作者:Jason M. Feist,希捷科技首席技术官办公室技术专家
显而易见,对于企业和个人而言,数据在以前所未有的速度激增。国际数据公司(IDC)的最新研究显示,2019年生成的数据为41ZB,而到2025年将激增至75ZB。物联网(IoT)、人工智能(AI)、5G和边缘的崛起不仅推动了数据的增长,也为获取新兴的数据驱动型业务价值带来了更多机会。
可以说,数据存储行业一直非常忙碌。以下是其2020年的几大主要趋势。
1. 不同介质设备将继续满足日益增长的数据存储需求。硬盘和闪存都在满足这一需求。提供实际数据的HDD是承载数据海洋必不可少的。而闪存用于在数据库中定位数据或建立索引。应用和相关服务的持续增长意味着这两种存储类型的数量都将增长。
2. 20TB大容量存储设备将被部署在公有云中。由于不断向云应用的迁移以及由此出现的机会,近线硬盘的存储容量不断刷新、提升。软件定义一切(SDx)使IT团队能够以最具成本效益的方式扩展业务,越来越多的企业从客户端/服务器模式转移到移动/云世界。在终端设备(电话、平板电脑、物联网设备等)获取数据造成大量数据迁移到核心。当用户在终端上进行交互时,运行大量不同的应用程序。例如商务旅行费用跟踪这样的简单任务,过去都是在电子表格中进行的,而现在他们可以通过手机上的一个应用程序来处理,以获取收据照片;而这些数据存储在云端。
3. 科技公司将继续评估和完善开放式架构。开放式架构将不同的资源、开发人员、开放式网络、组合式存储以及计算解决方案聚合在一起。该架构支持软件不断整合和开发的DevOps。相比于封闭式架构,DevOps为每个人提供了更好的控制性和可见性,消除了障碍,使不同的工作能够轻松协作。在软件和设备方面,它依靠于有才华的开发人员,既灵活又具有成本效益。
由于开放硬件和指令集能够优化边缘设备的成本和能耗,因此需求依然旺盛。Risc-V就是一个例子,它是一个针对电子产品的开放式指令集,专注于低成本、低功耗和安全性,使公司可以通过共享模式更快地利用和开发电子架构。开放软件部署将继续应用于存储管理,OCP(Open Compute Project)和CEPH等许多项目正在就需求和软件生态系统进行协作,以优化存储部署和效率,从而将公有云的性能引入到开源环境中,以供用户利用。
4. 终端、边缘、混合云、私有云和公有云之间的数据流,数据安全和保护比以往任何时候都更为重要。数据移动加强的同时,意味着其易受攻击,因此需要更多的保护。在云环境中,应用程序和数据在不停移动,这就需要严格遵守相关政策,保证设备安全性的实施,从而管理对设备本身的访问。除此之外,随着混合云连接到边缘、终端和物联网生态系统,还需要在每个设备附近存储数据,因为移动大型数据集的网络成本非常高。
因此,存储业将继续开发安全的传输设备,以替代昂贵且受带宽限制的网络传输,并持续优化机器学习,将计算设备与边缘存储进行匹配,通过智能设备进行推理和决策。对于设备本身,将继续通过静态加密提高安全性。
5. 通过创新与协作继续优化连接性。在数据存储行业,连接性在驱动着更高的带宽,这意味着我们将在数据排序领域不断看到创新(包括机械硬盘和闪存)。对数据模式进行排序可以提高资源效率和所有连接点的饱和度,所以围绕NVMe生态系统进行了大量的创新。
从铜缆、光纤到无线,延迟以及网络类型都会影响连接性。尽管铜缆在农村地区可能具有优势,但光纤可提供更快的速度,且信号损失更少。随着无线网络的日益普及,节省成本已成为重中之重,但是基础架构仍然滞后于技术的应用。5G技术已经为企业带来了更快的连接选择,这反过来也增加了每天交换和创建的数据量。
6. 能源效率提高意味着仅使用所需资源。第一,设备组合形式会影响能源成本。第二,设备的类型也对能源有影响。在未来一年中,我们将在这两个领域进行持续创新。在软件定义的存储世界中,趋势是将多种资源放在一起,并聚合到一个容器化的应用部署模型中。由于容器允许我们开发软件,仅使用需要的资源,因此可以降低成本和提高能效。存储行业还开发了多种新的设备类型,为此类容器提供更多资源以对其进行优化,以在与2019年相同的数据中心占地面积条件下,在2020年为更多的数据提供服务。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。