华为DME|开启广西电力数据中心存储智能运维新历程

来源:业界供稿    2021-01-26 14:44:47

关键字: 数据中心

如何用好、管好、维护好电力数据,让电力数据发挥最大的价值,成为了行业共同思考的问题。

在世界经济数字化转型的大势驱动下,电力行业到了数字产业化、产业数字化的历史转折点。

智能电表采集频次达到分钟级,生产调度系统采集频次达到秒级,电力的生产和消费过程中,产生了亿万级的数据。据统计,仅广东电网数据总量就有约4000TB,而且保持着20%以上的年增速。

如何用好、管好、维护好电力数据,让电力数据发挥最大的价值,成为了行业共同思考的问题。

人工运维带来的隐患

成为决定数据中心生命周期永远的痛

翻阅近年来的宕机事件,不难发现数据中心运维存在着共通的、永远的痛处:

刚刚过去的2020年,谷歌公司服务在凌晨3点47分中断,导致旗下YouTube、Gmail、Google Drive、Google Search等服务出现异常,全球多个国家及地区用户无法正常使用,直到当地时间早上8点左右,相应的故障才陆续恢复。

事后,谷歌官方出具的调查报告显示:

宕机的原因是“internal storage quota issue”,即内部存储配额问题,与数据中心存储运维有着脱不开的干系。

数据中心80%的故障来自人为风险,数据中心从业务部署到运行再到新业务扩充,都要进行大量手动配置,不但工作量大还存在操作失误风险,无疑一颗定时炸弹,随时可能引爆。

碰到系统升级,更是让运维人员头痛,数据中心要求7*24小时在线,如果贸然对设备进行重启升级,必然会造成大面积的业务中断,这是数据中心不能承受的。

另外,在运维的监控管理上,数据中心需要工作人员24小全程值班,但是24小时值班的不可能全是技术骨干、高工,同时,人都存在犯错的概率。一旦数据中心出现紧急状况,值班员恢复操作或技术专家在没有掌握所有运行参数的情况下指导操作,不仅会处理效果不佳,更可能造成二次故障。

亿万数据

对电力数据中心的自动化、信息化水平

提出了新的挑战

人工运维给数据中心带来的巨大隐患,在电力行业等公共服务领域尤为突出,更对数据中心运维的自动化、信息化水平提出了新的挑战。

一方面,是面向流程自动化的顶层设计挑战:

数据中心的运维作为业务运行的核心支撑,运维自动化的核心价值就在于使能业务流程的数字化以及自动化。而从电力行业的现状来看,需要有从上而下的基于运维自动化的业务流程设计,这也将成为释放数据中心管理和运维效率的一大挑战。

另一方面,是面向云时代的运维新挑战:

随着数字新技术在电力行业广泛应用,数据中心有一个绕不开的话题是云化转型。数据中心云化带来了资源池化共享、业务快速发放、自动化部署等诸多好处的同时,也给运维带来了新的挑战。

传统运维只能看到设备通断和静态指标,出现问题很可能是业务部门早于信息部门知道,故障定位和业务恢复延时严重。面对云化的数据中心,传统的运维方式不仅自身感到力不从心,更越来越无法满足业务需求。

最后,是面向智能运维的技能转型挑战:

从传统到智能,运维人员需要超越以IT为中心的技能集合,实现以面向业务和全技术栈为中心的技能集合进行更新,进而有机会投入到智能数据挖掘、业务编排等高价值工作中去。因此,让运维人员从繁杂的事务性工作解脱出来就显得尤为重要了。

用更先进、更可靠的管理方式和支撑系统,确保电力生产和消费数据的实时监控、安全运行,让电力行业数据中心从人工运维走向智能运维,成为了业界关键诉求。

数据作为智能时代最重要的资产,每一个比特的丢失都可能造成不可承受之痛。数据从被采集到使用,再到产生价值,存储是其生命周期中最主要的存在状态,存储也因此被称为数据中心的底座,其管理和运维的重要性不言而喻。

华为DME

开启广西电力数据中心存储智能运维新时代

华为DME助力广西电力数据中心搭建存储智能运维能力,在与广西电力的沟通过程中,我们发现,广西电力数据中心存储由于缺乏统一、智能的管理平台,在存储设备数量不大时,运维压力还可以接受,但随着存储设备的不断增加,运维的复杂度呈现指数级上升。

基于华为DME的智能存储管理平台以及相应的服务,可以说非常符合我们电力行业对于存储统一运维管理的构想,进而大大提升我们的数据中心的运维效率。

广西电力公司运维中心运维工程师表示

华为DME围绕电力行业数据中心存储的运维痛点,以三大能力持续提升广西电力数据中心存储的管理和运维效率。

融合能力:

使得客户的日常运维管理操作都能集中在一个管理界面完成,避免多软件平台,多界面跳转,降低学习成本,提升管理效率。

更重要的是,华为DME提供的自动化的资源发放能力让运维人员从繁琐的手工操作与脚本开发验证中释放出来,减少手工误操作,让运维人员有更多的精力思考业务的优化。

智能能力:

实现运维从被动式到主动式的转变。除了基本的统一告警、统一监控能力外,DME提供的“策略检测”能力帮助客户基于自己的运维经验设置主动检测策略,便于主动发现问题。

“端到端性能分析”与“端到端TOPO”能力在一个界面展示SAN网络的所有IO路径上的各个对象的性能指标与运行状态,以便帮助客户快速定位问题。

开放能力:

通过提供标准接口对接云生态,持续对接上层系统,为后续智能运维平台融入业务平台实现业务流程自动化提供坚实基础。

我们处在一个变革的时代,

一个数字化互联互通的时代,

一个信息流稍纵即逝的时代

电力行业数据中心存储智能运维极简Style

你PICK好了吗

    扫一扫

    分享文章到微信


    北京第二十六维信息技术有限公司(至顶网)版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号
    举报电话:13070156560 举报邮箱:jubao@zhiding.cn 安全联盟认证