谷歌公司推为非必要数据推出的检索服务——也就是Nearline——拥有三秒左右的检索延迟,这样的结果实在令人有些惊讶。考虑到Nearline与Amazon的Glacier服务保持着基本一致的使用成本,我们不禁要问:谷歌公司是如何在成本不变的前提下,将后者高达3至5小时的磁带检索延迟压缩至3秒钟的?
磁带的成本确实很低——但速度也相当慢,而谷歌公司肯定没办法利用它让Nearline拥有如此出色的延迟水平。我们认为,Nearline使用的应该是蓝光碟片驱动器或者传统机械硬盘,并通过一系列调整来尽可能降低成本。
谷歌公司指出,其使用的是现有闪存与磁盘基础设施。谷歌云平台业务产品管理负责人Tom Kershaw表示:“我们希望能够维持单一堆栈,因为只有这样才能实现内容的可替代性……因此,我们需要有能力以无缝化方式在不同存储体系之间实现数据迁移,而一旦创建出彼此独立的设备农场,那么数据迁移将变得非常困难。”
“众所周知,在存储领域,存储本身的成本并不高,真正昂贵的是数据移动过程。因此我们在自己的基础设施之上利用软件方式实现差异化,但其底层磁盘与闪存仍然是完全一致的,”Kershaw解释道。
“因为我们拥有如此庞大的存储容量规模,所以如果我们将Nearline存储服务承载在其它类型的系统之上,就会失去规模化带来的经济优势,”他进一步补充称。
不过底层磁盘与闪存的一致性这种说法在我们看来并不太靠谱,而谷歌公司提到的在不同存储类型之间进行数据移动的说法,则让我们想到其肯定是将其它存储介质引入到了现有磁盘及闪存基础设施当中。
这绝对不是在变更客户数据集存储策略时所必须采取的元数据调整。
如果谷歌方面真的是在使用光盘存储来支持Nearline存储服务,那么其并不应该被归类到现有磁盘及闪存基础设施的组成部分当中。此外,从存储库中的离线蓝光光盘当中进行数据检索,其执行时间一般会大于三秒。因此,蓝光光盘的可能性已经基本被排除了——再见。
因此,到底是什么因素让磁盘存储在谷歌的Nearline服务当中大放异彩,但却又无法在几年前的Amazon磁带存储服务Glacier当中起效?
我们能够看到的有两点:叠瓦式磁记录(简称SMR)技术与氦气填充磁盘驱动器,这两大技术成果都能显著提高磁盘产品的存储容量。
今年6月,HGST公司公布了其He10 10TB叠瓦式驱动器。
希捷公司则拥有一款空气填充式8 TB叠瓦驱动器,其存储碟片容量能力比HGST的10 TB磁盘要少一张。HGST公司的叠瓦产品属于主机管理型而非驱动器管理型,因此要使用它必须对主机服务器上的应用软件作出变更。
谷歌公司如果希望拥有高效的驱动器存储方案,那么肯定不会选择这样劳力神伤的方式。
然而,HGST公司表示其一直在与PMC-Sierra以及Avago-LSI等厂商协作实现HBA支持。如果这项支持尚未准备就绪,那么谷歌公司肯定会面临问题——除非其先于其它厂商拿到了这项HBA技术。又或者,谷歌方面可能会利用希捷推出的SMR磁盘驱动器——其存储容量更低(6到8TB),但不需要对主机服务器软件作出变更。
综上所述,我们认为谷歌公司很可能在其Nearline存储服务当中使用了SMR磁盘驱动器——具体选项有二,HGST的氦气填充式驱动器容量价格比更出色,而希捷方面的产品更易于部署、但在容量价格比方面则略逊一筹。
好文章,需要你的鼓励
人工智能开发商Anthropic为其旗舰聊天机器人Claude推出新的医疗健康功能,用户现在可以与服务共享医疗记录以更好地了解自己的健康状况。Claude可以连接官方医疗记录和苹果健康等健身应用,进行更个性化的健康对话。新功能现已向美国的Claude Pro和Max订阅用户开放。公司强调该工具不用于诊断或治疗建议,而是帮助用户理解复杂医疗报告,为医患沟通做准备,并承诺严格保护用户隐私数据。
上海AI实验室联合团队开发RoboVIP系统,通过视觉身份提示技术解决机器人训练数据稀缺问题。该系统能生成多视角、时间连贯的机器人操作视频,利用夹爪状态信号精确识别交互物体,构建百万级视觉身份数据库。实验显示,RoboVIP显著提升机器人在复杂环境中的操作成功率,为机器人智能化发展提供重要技术突破。
谷歌发布通用商务协议(UCP)开放商务标准,旨在让AI智能体自动化整个购物流程,从产品发现到支付再到售后服务。该协议与Shopify、Target、沃尔玛等零售商合作开发,支持AI智能体协同处理客户购买流程各环节。谷歌还推出品牌商业智能体和直接优惠工具,优化AI搜索中的购物体验。麦肯锡预测智能体商务到2030年将成长为3万亿美元市场。
英伟达研究团队提出GDPO方法,解决AI多目标训练中的"奖励信号坍缩"问题。该方法通过分别评估各技能再综合考量,避免了传统GRPO方法简单相加导致的信息丢失。在工具调用、数学推理、代码编程三大场景测试中,GDPO均显著优于传统方法,准确率提升最高达6.3%,且训练过程更稳定。该技术已开源并支持主流AI框架。