科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道云/数据中心云并不完美!盘点2013年十大云故障事件

云并不完美!盘点2013年十大云故障事件

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

没东西是完美的。公司也一样。但是现在的客户越来越在应用和数据访问方面依赖云,完美则正好是这些客户所要求的。下面列出完美童话破灭的10大浮“云”例子,这种事发生时用户唯一能做的无非也就是在互联网上发一发火愤怒一下而已。

作者:编译 来源:ZDNet存储频道 2013年8月1日

关键字: Google 云计算 亚马逊

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共2页)

Google

Google鼓励用户多使用Google Drive, Google Docs和 Gmail, 因而服务中断时对依赖这家总部在加州山景城公司的用户影响就更加深刻。4月17日的断网就是一个例子。当天发生了一个短暂的小故障,却显示了服务正常时间比例对Google这三个服务的挑战。据Google说,发生故障的是Gmail云电邮服务,影响到其他三个服务。登录设置里一个缺陷导致服务器超载,据信至少是问题的原因之一。Google说,4.25亿用户里只有“不到0.0007”受到影响。Google发布问题后不到一小时,服务回归正常运作。但是,接下来的几天陆续有不少问题,因而有Google断网两部曲的倒霉事……

云并不完美!盘点2013年十大云故障事件

Google两部曲

……还是说两、三、四部曲?今年3月,Google在仅仅一个星期内遭受了三次断网。主要原因起始于3月18日,一开始只是一个孤立的小故障,后来导致了大问题。范围之大以至三分之一的客户群收到影响,互联网上基本上是一片叫骂声。3月19日断网2小时,接着3月20日服务中断的时间更长。Google对3次断网的原因三缄其口。不过用户指近几周的服务相对稳定。

云并不完美!盘点2013年十大云故障事件

微软电邮

微软的在线服务名声3月14日这天受到一点打击,当天Hotmailhe和Outlook.com双双遭受服务中断达16小时之久。在同一段时间内,还发现微软的SkyDrive有稳定性问题,不过这些问题得到及时矫正。后来有报道说,问题的起因是某个固件升级导致服务器过热。

微软Windows Services部测试和服务工程副总裁Arthur de Haan在一篇博文中写道,“这个升级以前有成功完成过,但是这一次却出乎意料地没有成功。升级失败导致数据中心温度急剧地大幅度上升。上升得确实太快……最后导致数据中心很多服务器的防卫系统启动。”

各种服务在3月14-15之间逐步恢复,午夜前大多数邮箱回归正常运行。

云并不完美!盘点2013年十大云故障事件

SCORM

3月14日,SCROM升级一个云服务提高稳定性和性能,最后却导致降低稳定性,引起3个小时的云服务中断。SCORM隶属Rustici Software,是旨在推广电子学习软件产品兼容性的一套技术标准。升级里的一个错误引起一系列的连锁反应,最后影响到公司在亚马逊服务里几个区的服务。Rustic Software的客户支持经理Joe Donnelly在SCORM支持论坛写道,“我们对SCORM Cloud做了一些改变,目的是增加系统稳定性和性能。由于这些改变的引入,一个亚马逊服务器发生导入问题。这个问题导致了一系列的失败,主要是因为过度的CPU负载,最后出现亚马逊Web Service上SCORM几个区的服务发生不稳定的情况。”

云并不完美!盘点2013年十大云故障事件

Telstra

据报道,澳洲大型通信服务提供商Telstra的高端云计算3月底遭受了大规模的长达一天的断网。公司发言人一周后在一个发言中对媒体证实了断网事件。据澳洲技术通讯网站Delmiter报道,发言人说,“上个星期,我们的云平台有间歇的服务中断,影响到少数——约20个——客户。”问题的原因似乎是公司在墨尔本的数据中心里一个存储层出现问题,导致一些关键客户在相当长时间内不能使用服务。这位发言人说,“3月25日,我们发现数据存数设备出现问题,使用这些支持设备的客户受到影响。发现问题后,我们立刻联系了我们的存储合作伙伴并开始恢复服务。”据报道, Telstra目前正在进行一个8亿美元的扩展项目,用来做支持云基础设施和市场营销用。

云并不完美!盘点2013年十大云故障事件

Windows Azure

2月22日,微软的Azure Cloud全球服务中断差不多一整天,影响到安全网络交通。互联网上不少人报告说在此期间,Azure项目组合里的服务完全不能用,也有人说能用但速度特别地慢。Azure储存据信是受影响最大的服务。问题的起因经确认是由一个过期的SSL证书引起的。非安全HTTP连接仍然可用。据Kaspersky的Threatpost博客说, 微软是在2月23日的Windows Azure Service指示板上公布服务中断的。这条信息写道,“Storage的全球服务出现中断,影响到HTTPS运作(SSL交通),是由一个过期证书导致的。”除了“认错”外,微软2月24日在Windows Azure博客上发了一条消息,说会给受影响的客户发放信用值。Windows Azure业务和运营总经理Steven Martin写道,“鉴于这次的断网规模,我们会根据服务水平协议主动为受影响的客户提供信用值。”

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章