谷歌公司推为非必要数据推出的检索服务——也就是Nearline——拥有三秒左右的检索延迟,这样的结果实在令人有些惊讶。考虑到Nearline与Amazon的Glacier服务保持着基本一致的使用成本,我们不禁要问:谷歌公司是如何在成本不变的前提下,将后者高达3至5小时的磁带检索延迟压缩至3秒钟的?
磁带的成本确实很低——但速度也相当慢,而谷歌公司肯定没办法利用它让Nearline拥有如此出色的延迟水平。我们认为,Nearline使用的应该是蓝光碟片驱动器或者传统机械硬盘,并通过一系列调整来尽可能降低成本。
谷歌公司指出,其使用的是现有闪存与磁盘基础设施。谷歌云平台业务产品管理负责人Tom Kershaw表示:“我们希望能够维持单一堆栈,因为只有这样才能实现内容的可替代性……因此,我们需要有能力以无缝化方式在不同存储体系之间实现数据迁移,而一旦创建出彼此独立的设备农场,那么数据迁移将变得非常困难。”
“众所周知,在存储领域,存储本身的成本并不高,真正昂贵的是数据移动过程。因此我们在自己的基础设施之上利用软件方式实现差异化,但其底层磁盘与闪存仍然是完全一致的,”Kershaw解释道。
“因为我们拥有如此庞大的存储容量规模,所以如果我们将Nearline存储服务承载在其它类型的系统之上,就会失去规模化带来的经济优势,”他进一步补充称。
不过底层磁盘与闪存的一致性这种说法在我们看来并不太靠谱,而谷歌公司提到的在不同存储类型之间进行数据移动的说法,则让我们想到其肯定是将其它存储介质引入到了现有磁盘及闪存基础设施当中。
这绝对不是在变更客户数据集存储策略时所必须采取的元数据调整。
如果谷歌方面真的是在使用光盘存储来支持Nearline存储服务,那么其并不应该被归类到现有磁盘及闪存基础设施的组成部分当中。此外,从存储库中的离线蓝光光盘当中进行数据检索,其执行时间一般会大于三秒。因此,蓝光光盘的可能性已经基本被排除了——再见。
因此,到底是什么因素让磁盘存储在谷歌的Nearline服务当中大放异彩,但却又无法在几年前的Amazon磁带存储服务Glacier当中起效?
我们能够看到的有两点:叠瓦式磁记录(简称SMR)技术与氦气填充磁盘驱动器,这两大技术成果都能显著提高磁盘产品的存储容量。
今年6月,HGST公司公布了其He10 10TB叠瓦式驱动器。
希捷公司则拥有一款空气填充式8 TB叠瓦驱动器,其存储碟片容量能力比HGST的10 TB磁盘要少一张。HGST公司的叠瓦产品属于主机管理型而非驱动器管理型,因此要使用它必须对主机服务器上的应用软件作出变更。
谷歌公司如果希望拥有高效的驱动器存储方案,那么肯定不会选择这样劳力神伤的方式。
然而,HGST公司表示其一直在与PMC-Sierra以及Avago-LSI等厂商协作实现HBA支持。如果这项支持尚未准备就绪,那么谷歌公司肯定会面临问题——除非其先于其它厂商拿到了这项HBA技术。又或者,谷歌方面可能会利用希捷推出的SMR磁盘驱动器——其存储容量更低(6到8TB),但不需要对主机服务器软件作出变更。
综上所述,我们认为谷歌公司很可能在其Nearline存储服务当中使用了SMR磁盘驱动器——具体选项有二,HGST的氦气填充式驱动器容量价格比更出色,而希捷方面的产品更易于部署、但在容量价格比方面则略逊一筹。
好文章,需要你的鼓励
大众汽车旗下ID. Polo与Cupra Raval已在西班牙马托雷尔工厂正式下线投产。两款车型起售价分别为24,995欧元和26,000欧元,均基于MEB+平台打造,搭载37kWh或52kWh电池组,续航里程最高可达454公里。这是大众"电动城市车家族"系列的首批产品,预计今年夏末秋初开始交付。大众集团通过跨品牌资源整合,实现约6亿欧元的成本节约,后续还将推出ID. Cross等新成员。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
三星宣布将于6月8日起为Samsung Health应用推出重磅功能更新,赶在Galaxy Watch 9传闻发布之前落地。新版本将引入多项AI驱动的生物特征分析功能,包括:综合心率、血氧、皮肤温度等数据的每日活力评分(Vitals)、结合体成分数据评估长期心脏健康的心脏健康评分、优化训练强度的每日有氧负荷追踪,以及横向对比用户群体的健身指数。此外,应用界面将重新划分为睡眠、营养、活动、正念和体征五大板块,并新增抗氧化指数、年龄指数和听力保护等个性化功能。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。