希捷科技全球高级副总裁暨中国区总裁 孙丹
2024年,数据将继续保持指数级增长,而数据存储行业也相应面临着前所未有的挑战和机遇。我们将见证更多存储技术的变革和创新,以更好地满足不断增长的数据需求,甚至重塑IT基础架构。
2024年,随着生成式人工智能变得普及,数据存储将成为人工智能成功的关键。
• 深度依赖数据的人工智能将推动数据中心和领先企业采用更高密度的硬盘存储,通过保存原始数据集和人工智能及机器学习产生的洞察,获取更具有未来前瞻性的数据价值。据IDC预测,2027年将产生291ZB数据——用户可获得海量数据,数据增长的速度将加剧上述趋势。
• Gartner预测,到2026年,超过80%的企业将在生产中使用生成式人工智能API和模型和/或部署生成式人工智能应用,而2023年初这一比例还不到5%。Gartner的一项调查还显示,55%的组织正在试用或使用生成式人工智能。Gartner预计,在未来两年内生成式人工智能产生的数据将占全部数据量的10%,而目前这一比例还不到1%。
• 企业将保存更多的运营数据用来训练人工智能、机器学习和深度学习模型不断进化;更多的企业将利用外部和内部数据训练模型,以从其信息中获益。
• 2024年,超大规模科技巨头预计将加速对云存储空间的投资,以支持人工智能项目的发展。而由于企业通过提高生产力和效率寻求竞争优势,人工智能也将推动企业IT支出和数据存储需求的增加。
2024年,数据中心的更新扩容将受益于硬盘面密度的大幅提升。
• 云数据中心近90%的数据存储在硬盘上。随着数据中心基础设施进入自然更新周期,它们可能用更大容量的硬盘替换小容量硬盘。
• 目前,基于传统PMR技术的硬盘容量平均为16TB。而新的HAMR技术将促使数据中心管理人员部署30TB的面密度更高的硬盘,从而可以在单个硬盘上存储更多数据,大幅降低能耗、减少占用空间,并大幅优化的总体拥有成本(TCO)。
• HAMR技术还将帮助数据中心运营商通过采用更耐用、更节能的存储设备进一步减少碳足迹,在处理全球5360万吨电子垃圾方面发挥更大的作用。
2024年,闪存和硬盘将继续在数据中心同时存在。
• 数据的指数级增长将驱动对海量硬盘的需求,与闪存存储共同支持当下和未来的工作负载。
• IDC、TRENDFOCUS和Forward Insights的最新分析表明,对于大多数以容量为先的存储任务来说,硬盘仍将是最具成本效益的选择。
• 全球绝大多数数据存储在云端,这里的存储容量需求预计只会增加,而硬盘将成为这EB级增长的主要受益者。硬盘海量存储每字节成本不到全闪存解决方案的1/5。对于数据中心架构来说,这个成本差异在明年,甚至未来十年都会一直存在。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。