谷歌公司推为非必要数据推出的检索服务——也就是Nearline——拥有三秒左右的检索延迟,这样的结果实在令人有些惊讶。考虑到Nearline与Amazon的Glacier服务保持着基本一致的使用成本,我们不禁要问:谷歌公司是如何在成本不变的前提下,将后者高达3至5小时的磁带检索延迟压缩至3秒钟的?
磁带的成本确实很低——但速度也相当慢,而谷歌公司肯定没办法利用它让Nearline拥有如此出色的延迟水平。我们认为,Nearline使用的应该是蓝光碟片驱动器或者传统机械硬盘,并通过一系列调整来尽可能降低成本。
谷歌公司指出,其使用的是现有闪存与磁盘基础设施。谷歌云平台业务产品管理负责人Tom Kershaw表示:“我们希望能够维持单一堆栈,因为只有这样才能实现内容的可替代性……因此,我们需要有能力以无缝化方式在不同存储体系之间实现数据迁移,而一旦创建出彼此独立的设备农场,那么数据迁移将变得非常困难。”
“众所周知,在存储领域,存储本身的成本并不高,真正昂贵的是数据移动过程。因此我们在自己的基础设施之上利用软件方式实现差异化,但其底层磁盘与闪存仍然是完全一致的,”Kershaw解释道。
“因为我们拥有如此庞大的存储容量规模,所以如果我们将Nearline存储服务承载在其它类型的系统之上,就会失去规模化带来的经济优势,”他进一步补充称。
不过底层磁盘与闪存的一致性这种说法在我们看来并不太靠谱,而谷歌公司提到的在不同存储类型之间进行数据移动的说法,则让我们想到其肯定是将其它存储介质引入到了现有磁盘及闪存基础设施当中。
这绝对不是在变更客户数据集存储策略时所必须采取的元数据调整。
如果谷歌方面真的是在使用光盘存储来支持Nearline存储服务,那么其并不应该被归类到现有磁盘及闪存基础设施的组成部分当中。此外,从存储库中的离线蓝光光盘当中进行数据检索,其执行时间一般会大于三秒。因此,蓝光光盘的可能性已经基本被排除了——再见。
因此,到底是什么因素让磁盘存储在谷歌的Nearline服务当中大放异彩,但却又无法在几年前的Amazon磁带存储服务Glacier当中起效?
我们能够看到的有两点:叠瓦式磁记录(简称SMR)技术与氦气填充磁盘驱动器,这两大技术成果都能显著提高磁盘产品的存储容量。
今年6月,HGST公司公布了其He10 10TB叠瓦式驱动器。
希捷公司则拥有一款空气填充式8 TB叠瓦驱动器,其存储碟片容量能力比HGST的10 TB磁盘要少一张。HGST公司的叠瓦产品属于主机管理型而非驱动器管理型,因此要使用它必须对主机服务器上的应用软件作出变更。
谷歌公司如果希望拥有高效的驱动器存储方案,那么肯定不会选择这样劳力神伤的方式。
然而,HGST公司表示其一直在与PMC-Sierra以及Avago-LSI等厂商协作实现HBA支持。如果这项支持尚未准备就绪,那么谷歌公司肯定会面临问题——除非其先于其它厂商拿到了这项HBA技术。又或者,谷歌方面可能会利用希捷推出的SMR磁盘驱动器——其存储容量更低(6到8TB),但不需要对主机服务器软件作出变更。
综上所述,我们认为谷歌公司很可能在其Nearline存储服务当中使用了SMR磁盘驱动器——具体选项有二,HGST的氦气填充式驱动器容量价格比更出色,而希捷方面的产品更易于部署、但在容量价格比方面则略逊一筹。
好文章,需要你的鼓励
DeepSeek 发布了新的大语言模型系列 R1,专为推理任务优化。该系列包括两个主要模型 R1 和 R1-Zero,采用混合专家架构,拥有 6710 亿参数。R1 在多项推理基准测试中超越了 OpenAI 的 o1 模型,而 R1-Zero 则代表了机器学习研究的重大进展。DeepSeek 已在 Hugging Face 上开源了这些模型的源代码。
国家机器人研究中心与 Freshwave 公司合作,利用私有 5G 网络测试农业机器人。这项合作旨在提升农业生产力,预计到 2026 年农业科技产业规模将达到 156 亿英镑。私有 5G 网络将为农业机器人提供高速、低延迟的连接,实现实时数据分析和精准农业操作,有望彻底改变农业生产方式。
Cognizant 推出了神经 AI 多代理加速器和服务套件,旨在帮助企业快速开发和部署 AI 代理。该技术通过预构建的代理网络模板和无代码框架,实现了跨职能的可扩展性和自主决策能力。这一创新有望推动 AI 代理在企业工作流程中的广泛应用,促进人机协作,提升业务效率和适应性。
西部数据公司财务总监Wissam Jabre将于2月28日辞职,恰逢公司分拆为硬盘和固态硬盘两个独立业务。公司正在寻找新的财务总监。尽管面临闪存业务定价环境更具挑战性,公司第二财季收入预计仍将达到43亿美元,同比增长42%。分析师认为硬盘业务表现强劲,可能抵消了闪存业务的部分疲软。