科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道容灾提高电信行业免疫力

容灾提高电信行业免疫力

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

对于计算机系统而言“没有数据就没有一切”,神州数码凭借着在电信领域丰富的服务经验、为电信行业用户提供了一套集咨询、实施、维护和管理于一体的解决方案,让电信行业用户从容应对灾难。

2003年11月19日

关键字: 容灾 神州数码 灾难恢复

  • 评论
  • 分享微博
  • 分享邮件
    电信IT系统的应用直接关乎管理、服务、成本、效率等各个重要环节,并最终全面影响电信运营商的竞争力,运营商们对信息系统的依赖性越来越强了。其中,与电信业务发展密切相关的计费系统、营帐系统、数据库以及邮件系统都对数据安全有着很高的要求。目前,电信行业的“大集中”建设进入了省级大集中阶段,任何单点的故障都有可能导致整个系统的瘫痪。同时,电信行业也是一个讲究系统高可用性的行业,它要求关键应用服务器必须24×7的不间断运行,以满足超大量用户的实时访问。以上这些因素证明,容灾系统的建设是电信行业保证整个信息系统稳定和数据安全的关键所在。

    一位管理学家说,人类无法完全避免灾难,但面对灾难,不同的态度和手段将导致完全不同的结果。神州数码凭借着在电信领域丰富的服务经验、关于容灾系统建设成熟的方法论和领先的技术能力,为电信行业用户提供了一套集咨询、实施、维护和管理于一体的解决方案,让电信行业用户从容应对灾难。

    什么是灾难

    要实现容灾,必须要先了解灾难。对于一个计算机系统而言,所有引起系统非正常停机的因素都可称为灾难。其大致可分为三类:一、不可预知的自然灾难,包括:飓风、龙卷风、地震、洪水、火灾等;二、基础设施的坏损,包括:CPU、硬盘等损坏、建筑物倒塌、电源中断等;三、操作系统失误,包括:计算机病毒、误操作、人为破坏等。据统计,各种导致灾难的因素比重排序为:硬件故障占44%、人为错误占32%、软件故障占14%、病毒影响占7%、自然灾害占3%。

    如果我们把上述灾难看作小概率事件而掉以轻心,则当灾难真正来临时,将面临无法估量的损失。另据IDC的一项统计数字显示:2000年以前的10年间,在美国遭受过灾难的公司中,有55%当时倒闭,在其余的45%中,因为数据丢失,有29%也在两年之内倒闭,最终能够存活下来的仅占16%。

    如果说“数据就是一切”还有一点夸张的话,那对于计算机系统而言“没有数据就没有一切”一点都不夸张。所以面对灾难,容灾备份系统称的上居功至伟。下面的例子说明了这一点。2001年9月11日,美国世贸中心顷刻间灰飞烟灭,在这伟大的建筑物里的不少国际大公司,都因这场世纪梦魇受到了致命打击。灾难爆发时,著名的财经咨询公司—摩根.斯坦利在世贸中心有近4000名员工,可以说损失巨大。但第二天摩根·斯坦利却奇迹般地恢复了正常运转。后来人们才知道,是先前建立的数据备份和远程容灾系统保护了重要的数据,挽救了Morgan Stanley,同时也在一定程度上也挽救了全球的金融业。

    神州数码:容灾系统建设之我见

    一、容灾不是简单的工程

    通常用户会低估灾备系统建设的复杂性,把它等同于一般的系统集成项目。实际上,灾备系统远远比人们想像的要复杂得多。

  • 对哪些应用系统和数据进行灾备?
  • 是采用同城灾备还是异地灾备?采用同步还是异步模式?
  • 网络带宽要求有多大?
  • 应用系统、主机、网络如何切换?
  • 灾备系统建设后,对生产系统的影响有多大?

    上述问题用户在建设灾备系统前一般都需要考虑。但由于面对的是一套完整的系统,上述问题就变得复杂起来;例如,灾备系统对生产系统影响的问题,不光是考虑存储设备本身的延时,还需要考虑灾备管理软件、数据库等所产生的系统额外开销,以及传输网络延迟等问题,只有在综合考虑所有环节后,所得到的灾备方案才是一个有把握成功的方案。

    此外,灾备系统的建设通常都伴随着主机、存储、网络系统的改造和迁移,如果事先没有良好的规划,不等到灾备系统建成,系统就可能遇到大麻烦。

    二、容灾的关键是距离

    容灾系统必须考虑到系统恢复的问题。现在不少企业也意识到了这一点,采取了系统定期检测与维护、双机热备、磁盘镜像或容错、备份磁带异地存放、关键部件冗余等多种灾难预防措施。这些措施一般能够进行数据备份,并且在系统发生故障后能够进行系统恢复。但是这种一般的措施只能用来应对计算机单点故障,对区域性、毁灭性灾难则束手无策,也不具备灾难恢复能力。仅有这些措施还不够,其关键业务必须实施远程容灾保护。

    远程容灾系统具备应付各种灾难特别是区域性与毁灭性灾难的能力,具备较为完善的数据保护与灾难恢复功能,保证灾难降临时数据的完整性及业务的连续性,并在最短时间内恢复业务系统的正常运行,将损失降到最小。在曾经实施过的中国联通云南分公司的容灾系统工程中,神州数码为云南联通贴身设计了一整套稳定、可靠的同城异地数据级容灾的综合数据容灾系统解决方案。在云南联通主中心与容灾中心之间,通过2根远程光纤相联实现数据的传输和备份。一旦发生地震、火灾等不可预见的灾难,系统将可在短短几十分钟之内,迅速启用备份中心的数据;而当主中心恢复后,又可快速进行备份中心到主中心的数据同步,从而真正发挥保障的作用。

    远程容灾系统一般由生产系统、可接替运行的后备系统、数据备份系统、备用通信线路等部分组成。在正常生产和数据备份状态下,生产系统向备份系统传送需备份的数据。灾难发生后,当系统处于灾难恢复状态时,备份系统将接替生产系统继续运行。此时重要营业/业务终端用户将从生产主机切换到备份中心主机,继续对外营业/开展业务。

    当然,并不是所有的信息系统都需要配置远程容灾,甚至单个系统中的不同模块,其对容灾也有不同的需求。如何最大限度地发挥投资的作用,同时又确保关键应用的不间断运行,需要在容灾系统建设的前期进行仔细的风险和投资评估。

    三、容灾不仅仅是产品和技术问题

    容灾是一个复杂的系统工程,而不仅仅是容灾产品和技术的简单安装。目前很多客户还停留在对容灾产品和技术的关注上,而对容灾的流程、规范及其具体措施还不太清楚或不太重视。例如在容灾系统的规划阶段,除要考虑容灾技术和产品的选型外,还必须考虑如何把运行中心切换到备份中心,如何保证切换过程中数据是正确的,并且没有丢失。发生数据丢失后,如何做一些补救工作,这不仅仅是存储问题,还牵涉到演习制度、培训制度。再例如,当灾难发生时,系统到底要不要切换,什么时候切换,切换与不切换的命令由谁来下等,需要建立起一整套严格的规章制度。

    此外,灾难发生的时间是无法预测的,可能是明天,也可能是明年,或者三五年以后,也可能永远不会发生;但无论灾难何时发生,必须始终保持容灾备份系统的可用性;这里人的因素可能比技术和产品的因素更重要——技术人员要有能力在灾难发生时正确、快速地进行切换,这种能力是一个组织团队的能力,能够长期保持,且不会随人员的变化而丧失。上述目标的达到除了完善的恢复计划外,还需要每年做一次甚至几次的灾备演习,并做一次系统回顾。因为系统有可能会改变,系统的变化可能使原来的方案不再适合,因此,每年要把文档再补充完整,并演习每个步骤。

    神州数码电信容灾解决方案

    根据电信行业客户规模、生产需求以及客户IT系统的现状,神州数码提出了不同阶段的容灾解决方案,帮助用户初步形成一个完整的容灾体系。该容灾体系包括四个阶段:本地数据安全保护、本地应用的高可用性、异地数据安全保护、异地应用的连续性。这四个阶段是容灾系统建设的一个渐进的过程,用户可以根据自己的实际情况进行选择,分步建设,最终建成一个完善的容灾系统。

    神州数码拥有关于容灾系统的成熟方法论,为电信行业用户提供集咨询、实施、维护和管理于一体的解决方案。不仅帮助客户解决数据的可靠性和安全性,同时能够帮助可解决商业范畴内的工作。针对不同需求的用户能够提供相应的解决方案,并对灾难进行恰当的分析,建设相应的容灾系统,使企业得以有效投入和产生恰当效果。面对具体容灾建设项目,神州数码的工作流程可以划分为四个阶段。

    1. 容灾系统项目咨询

    根据客户规模、生产需求以及客户IT的现状,进行可行性的分析并提供容灾项目咨询。内容包括:完整的业务连续性计划方法论、全面解决方案及项目管理的技术、尖端的备份和恢复技术的咨询、行业核心业务系统评估、风险管理及可用性评估等。

    2. 容灾系统设计

    根据客户的自身IT系统建立业务连续框架,不局限于某一家厂商的产品。对客户实际情况进行评估分析,为客户提供一套切合实际的,投资合理的,内容可靠的业务连续性及容灾备份方案。在此阶段中神州数码公司可以为客户提供:容灾系统规划、技术可行性分析、建立系统评估模型和网络系统方案、提出各种功能测试方案。

    3. 容灾系统实施

    神州数码的IT专家将根据业务联系框架和设计方案,进行包括主机、数据库、网络产品、存储设备等产品的分项实施,最终建成容灾备份系统。在实施过程中,所有的技术和流程都经过验证。神州数码可以为客户提供:容灾功能测试、容灾项目实施方案、提供实施报告、性能测量并报告结果。

    4. 容灾系统的运行维护

    根据用户的实际情况,制定容灾备份管理制度、流程。以确保客户在出现灾难的情况下能够顺利地实施容灾切换。

    目前,神州数码的电信容灾解决方案在中国联通云南分公司的容灾系统工程的实施中得到了很好的验证,并受到了用户的好评。

    背景资料

    神州数码系统集成事业本部,自1987年涉足系统集成领域以来,积累了长达17年的丰富行业经验。对行业需求有着深刻的理解,并拥有已被证明了的高效、正确的项目管理流程,以确保项目顺利实施。神州数码在金融、电信、政府等行业都有容灾应用系统解决方案的成功案例,能够有效地协助用户评估行业核心业务系统、信息流程和恢复需求(包括客户核心业务,业务中断的损失,可容忍任务中断的时间),并进行有针对性的灾备系统设计。

    此外,神州数码系统集成事业本部拥有一支技术过硬、经验丰富的技术队伍。容灾项目不仅涉及到存储,还涉及到主机、网络、数据库、应用系统等各个层面的内容,需要有综合的规划、分析和实施能力。神州数码在上述各个方面都有一批资深专家,能够为用户提供全面的、个性化的服务。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章