谷歌公司推为非必要数据推出的检索服务——也就是Nearline——拥有三秒左右的检索延迟,这样的结果实在令人有些惊讶。考虑到Nearline与Amazon的Glacier服务保持着基本一致的使用成本,我们不禁要问:谷歌公司是如何在成本不变的前提下,将后者高达3至5小时的磁带检索延迟压缩至3秒钟的?
磁带的成本确实很低——但速度也相当慢,而谷歌公司肯定没办法利用它让Nearline拥有如此出色的延迟水平。我们认为,Nearline使用的应该是蓝光碟片驱动器或者传统机械硬盘,并通过一系列调整来尽可能降低成本。
谷歌公司指出,其使用的是现有闪存与磁盘基础设施。谷歌云平台业务产品管理负责人Tom Kershaw表示:“我们希望能够维持单一堆栈,因为只有这样才能实现内容的可替代性……因此,我们需要有能力以无缝化方式在不同存储体系之间实现数据迁移,而一旦创建出彼此独立的设备农场,那么数据迁移将变得非常困难。”
“众所周知,在存储领域,存储本身的成本并不高,真正昂贵的是数据移动过程。因此我们在自己的基础设施之上利用软件方式实现差异化,但其底层磁盘与闪存仍然是完全一致的,”Kershaw解释道。
“因为我们拥有如此庞大的存储容量规模,所以如果我们将Nearline存储服务承载在其它类型的系统之上,就会失去规模化带来的经济优势,”他进一步补充称。
不过底层磁盘与闪存的一致性这种说法在我们看来并不太靠谱,而谷歌公司提到的在不同存储类型之间进行数据移动的说法,则让我们想到其肯定是将其它存储介质引入到了现有磁盘及闪存基础设施当中。
这绝对不是在变更客户数据集存储策略时所必须采取的元数据调整。
如果谷歌方面真的是在使用光盘存储来支持Nearline存储服务,那么其并不应该被归类到现有磁盘及闪存基础设施的组成部分当中。此外,从存储库中的离线蓝光光盘当中进行数据检索,其执行时间一般会大于三秒。因此,蓝光光盘的可能性已经基本被排除了——再见。
因此,到底是什么因素让磁盘存储在谷歌的Nearline服务当中大放异彩,但却又无法在几年前的Amazon磁带存储服务Glacier当中起效?
我们能够看到的有两点:叠瓦式磁记录(简称SMR)技术与氦气填充磁盘驱动器,这两大技术成果都能显著提高磁盘产品的存储容量。
今年6月,HGST公司公布了其He10 10TB叠瓦式驱动器。
希捷公司则拥有一款空气填充式8 TB叠瓦驱动器,其存储碟片容量能力比HGST的10 TB磁盘要少一张。HGST公司的叠瓦产品属于主机管理型而非驱动器管理型,因此要使用它必须对主机服务器上的应用软件作出变更。
谷歌公司如果希望拥有高效的驱动器存储方案,那么肯定不会选择这样劳力神伤的方式。
然而,HGST公司表示其一直在与PMC-Sierra以及Avago-LSI等厂商协作实现HBA支持。如果这项支持尚未准备就绪,那么谷歌公司肯定会面临问题——除非其先于其它厂商拿到了这项HBA技术。又或者,谷歌方面可能会利用希捷推出的SMR磁盘驱动器——其存储容量更低(6到8TB),但不需要对主机服务器软件作出变更。
综上所述,我们认为谷歌公司很可能在其Nearline存储服务当中使用了SMR磁盘驱动器——具体选项有二,HGST的氦气填充式驱动器容量价格比更出色,而希捷方面的产品更易于部署、但在容量价格比方面则略逊一筹。
好文章,需要你的鼓励
谷歌深度思维团队开发出名为MolGen的AI系统,能够像经验丰富的化学家一样自主设计全新药物分子。该系统通过学习1000万种化合物数据,在阿尔茨海默病等疾病的药物设计中表现出色,实际合成测试成功率达90%,远超传统方法。这项技术有望将药物研发周期从10-15年缩短至5-8年,成本降低一半,为患者更快获得新药治疗带来希望。
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
哈佛医学院和微软公司合作开发了一个能够"听声识病"的AI系统,仅通过分析语音就能预测健康状况,准确率高达92%。该系统基于深度学习技术,能够捕捉声音中与疾病相关的微妙变化,并具备跨语言诊断能力。研究团队已开发出智能手机应用原型,用户只需完成简单语音任务即可获得健康评估,为个性化健康管理开辟了新途径。