让社会信任 AI 需要什么条件?每一个由 AI 算法产生的决策、预测和洞察都取决于数据的可用性和质量。为了充分发挥 AI 的潜力,数据必须被有效且高效地存储。换句话说,数据支撑着 AI,而存储则支撑着数据。这种赋能是相互的:AI 也在强化当今的存储创新以满足其需求。
要理解 AI 如何帮助创造更好的存储解决方案,我们首先要研究它与数据的关系。AI 数据存在于数据生成和消费的循环中,更多高质量、多样化的输入数据会带来更智能的模型和更好的结果。在这个循环中,AI 成为数据创造的倍增器,对大容量存储解决方案的需求也在显著增长。
然而,差距依然存在。基于 IDC 2024 全球数据圈研究的希捷分析显示,2024 年至 2028 年间,数据将以 25% 的速度增长,而存储设备的安装基数预计增长较慢,年复合增长率为 17%。
希捷描绘的数据生成和消费的无限数据循环。
这种差距对企业有商业影响:组织需要制定长期容量规划,确保其数据存储基础设施已准备好将未来的机遇转化为价值。
存储密度的进步使得在规模上满足 AI 数据存储不断增长的需求成为可能,同时最大限度地减少占地面积扩张和资源影响。例如,面密度的进步已经带来了每碟超过 3TB 存储容量的硬盘,提高了能源效率,并降低了每 TB 的碳排放。
AI 在这项创新中既是原因也是结果:AI 推动了数据存储设计的改进,这反过来又帮助组织在 AI 处理中最大化利用他们的数据价值。
例如,希捷正在使用 NVIDIA 技术来满足不断增长的 AI 存储需求,并开发下一代 Mozaic 硬盘。通过与 NVIDIA 合作,希捷优化工作流程,提高效率、性能和可扩展性。这种合作专注于模拟工作流程的各个方面,包括模型构建、解决方案算法、后处理和可视化任务。
通过解决传统 CPU 模拟和繁琐工作流程导致的存储硬盘设计流程中的重大挑战,团队能够加快硬盘设计速度。通过 GPU 加速计算加快电磁模拟,还实现了缩短数据存储设计生命周期、改善上市时间和符合可持续发展目标的目标。
通过更多前期产品建模和设计优化,公司可以处理更复杂的模型,减少原型制作和物理测试,降低设计过程中的能源消耗,并开发更节能的存储解决方案。
这种方法的好处也延伸到利益相关者,例如为所有人培养敏捷性和竞争力。客户可以更快地获得下一代硬盘创新,更早优化运营,并实现更快的投资回报。合作伙伴受益于动态协作、加速市场覆盖和提高资源效率。随着 AI 的兴起导致数据存储需求增长,技术合作伙伴关系有助于确保行业能以更快、更节能的解决方案引领发展,并满足 AI 的存储需求。
硬盘行业对这些创新并不陌生。几十年来,它一直走在将 AI、机器学习 (ML) 和其他先进技术整合到产品开发和制造过程的前沿。这种投入在当前部署在生产线上的众多 AI 解决方案中得到了证明。这些解决方案不仅提高了一线工作人员的效率,还实现了更快的问题解决。
随着数据存储的边界不断被推动,科技行业正准备采用下一代更快、容量更大和更节能的存储解决方案。这些创新将满足 AI 时代对数据存储不断增长的需求。通过这些新进展,技术领导者不仅跟上了当今的数据存储需求,还在塑造其行业的未来。
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
Meta公司FAIR实验室与UCLA合作开发了名为HoneyBee的超大规模视觉推理数据集,包含250万训练样本。研究揭示了构建高质量AI视觉推理训练数据的系统方法,发现数据质量比数量更重要,最佳数据源比最差数据源性能提升11.4%。关键创新包括"图片说明书"技术和文字-图片混合训练法,分别提升3.3%和7.5%准确率。HoneyBee训练的AI在多项测试中显著超越同规模模型,同时降低73%推理成本。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
上海AI实验室团队提出ViCO训练策略,让多模态大语言模型能够根据图像语义复杂度智能分配计算资源。通过两阶段训练和视觉路由器,该方法在压缩50%视觉词汇的同时保持99.6%性能,推理速度提升近一倍,为AI效率优化提供了新思路。