当今世界正在以惊人的速度产生数据,从这些数据中获取价值的能力将是决定成败的关键。基于此,英特尔公司的战略转向“以数据为中心”,构建了以数据为中心的“三驾马车”,进行了从云到网络到边缘的全面布局,从传输、存储和处理三个维度真正驱动以数据为中心的未来。
在赋能用户存储更多数据方面,英特尔提出了“数据存储金字塔”(亦称内存和存储层级)的战略模式,并通过傲腾技术 + 3D NAND存储技术组合拳的形式,实现了内存和存储业务的高速增长。如今,内存和存储已成为与英特尔处理器业务同等重要的产品线,最新数据显示,2020年Q1英特尔的存储业务销售额同比增长46%。
2020年6月,英特尔公司非易失性存储解决方案事业部副总裁,兼数据中心傲腾存储事业部总经理David Tuhy在英特尔内存和存储业务发展的最新进展线上活动中表示,2020年Q1的市场成绩之所以如此突出,傲腾存储技术起到了关键的作用。“相对内存来讲,DRAM并没有按照摩尔定律的成本/性能进行演进。相对存储来说,我们看到即便是最先进的产品——NAND SSD也开始放慢其性能增长的速度,所以基于3D Xpoint介质的傲腾技术成为内存和存储层级内新的增长引擎,一举打破了内存和存储瓶颈,使数据更靠近计算,并弥补了DRAM以及NAND SSD在容量和性能上的不足。” David Tuhy表示。
傲腾和3D NAND满足了对内存和存储层级结构中的新存储层的需求
在整个计算系统中,数据的存储金字塔一直存在瓶颈。介于内存和NAND之间的延迟、性能和容量等差距过于悬殊,让数据的价值不能有效发挥。特别是随着AI、5G、边缘计算的发展和落地,大量数据需要实时分析才能发挥数据的价值,这些需求凸显了目前在内存存储层级结构中存在的一大空白——其中,DRAM容量不够大,固态盘速度又不够快。所以英特尔提出的“数据存储金字塔”概念,并推出傲腾战略来弥补这一空白。籍此,介于DRAM和3D NAND之间的新技术——英特尔傲腾持久内存将大有作为。
目前,英特尔正在努力让傲腾持久内存在几乎所有的数据库里得到使用,并根据不同的应用和不同的数据库形式,进行大量的开发和优化。
据英特尔公司数据中心事业部产品管理高级总监Kristie Mann表示,“傲腾持久内存自发布以来,发展势头十分强劲,目前已有85%以上的概念验证转化成实际的应用部署,产生了超过200次的概念验证,同时也在诸多世界500强企业、云服务提供商以及OEM厂商和新兴服务提供商等中得到部署。”
比如说Oracle的数据库Exadata X8M应用英特尔傲腾数据中心级持久内存,在于Exadata采用复杂的远程直接内存访问(RDMA)技术,使数据库能够直接访问部署在智能共享存储服务器中的持久内存,从而绕过整个操作系统、网络和IO软件堆栈。与之前的Exadata版本相比,这可将Exadata X8M中的IO延迟减少十倍。
百度用于支持其基于云的信息流服务中的数据存储和信息检索的“Feed-Cube”的高级内存数据库,通过部署英特尔傲腾数据中心级持久内存和第二代英特尔® 至强®可扩展处理器,百度能够确保Feed-Cube的高并发性、大容量和高性能,同时降低总体拥有成本(TCO)。
百度推荐技术架构部主任架构师汪瑫表示:“通过在Feed-Cube数据库中采用英特尔傲腾数据中心级持久内存,百度能够节省成本效率,扩展内存容量,并始终能够帮助我们的信息流服务发展。”
同时在沟通会上英特尔发言人也透露代号为“Barlow Pass”的第二代英特尔傲腾数据中心级持久内存,代号为“Alderstream”的基于PCIe 4.0的第二代英特尔傲腾固态盘和用于数据中心级固态盘的144层QLC(四级单元)NAND产品也将也将于2020年下半年陆续推出。
好文章,需要你的鼓励
香港中文大学与华为诺亚方舟实验室合作开发了PreMoe框架,解决了大型混合专家模型(MoE)在内存受限设备上的部署难题。研究团队发现MoE模型中的专家表现出明显的任务专业化特征,据此提出了概率专家精简(PEP)和任务自适应专家检索(TAER)两大核心技术。实验证明,DeepSeek-R1 671B模型在精简50%专家后仍保持97.2%的MATH500准确率,内存需求降至688GB;而更激进的精简方案(减少87.5%专家)也能保持72.0%的准确率。该方法适用于多种MoE架构,为强大AI系统的广泛部署铺平了道路。
SCIENCEBOARD是一项开创性研究,旨在评估多模态自主智能体在真实科学工作流中的表现。研究团队构建了一个包含169个高质量任务的基准测试,涵盖生物化学、天文学等六个科学领域,并开发了一个真实环境让智能体通过CLI或GUI接口与科学软件交互。实验评估表明,即使是最先进的模型在这些复杂科学任务上的成功率也仅为15%,远低于人类表现,揭示了当前技术的局限性并为未来科学智能体的发展提供了宝贵见解。
帝国理工学院的研究团队开发了AlphaMed,这是首个仅通过极简规则强化学习就能培养医疗推理能力的AI模型,无需依赖传统的思维链示范数据。通过分析数据信息丰富度和难度分布的影响,研究发现高信息量的医疗问答数据是推理能力的关键驱动因素。AlphaMed在六个医疗问答基准上取得了领先成绩,甚至超越了更大的封闭源模型,同时展现出自发的步骤推理能力,为医疗AI发展提供了更加开放、高效的新路径。
Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。