“Optane已经被串连起来,而非作为孤立组件存在。”
Aperion公司发布的一款Optane阵列拥有五倍于原Apeiron闪存阵列之数据吞吐能力、六倍以上IOPS以及高达38倍的延迟削减效果。
在一项技术演示中,Apeiron方面将其配备有NVMe闪存驱动器的ADS1000存储阵列与搭载英特尔Optane 3D XPoint驱动器的版本进行了性能比较。
该公司全球销售与市场营销执行副总裁Jeff Barber介绍称:“我们对NAND与Optane进行了第三方测试,其中读取/写入负载为七比三比例,其中采用Optane的Apeiron产品仅拥有13微秒延迟,而NAND版本的延迟则高达500微秒。在大型数据块写入方面,Optane的性能亦达到NAND的10倍,且延迟仅为后者的二十五分之一。”
英特尔的P4800X为一款容量为375 GB的驱动器,采用3D XPoint存储器构建并因此拥有全面优于NAND的速度表现与使用寿命水平。
该存储方案属于一套外部阵列,可通过一套经过强化的2级以太网经由NVMe over Ethernet实现RDMA访问。访问服务器配备有Apeiron公司自主开发的主机总线适配器(简称HBA),该公司的目标在于确保访问配备SSD的共享式外部阵列时,这些服务器能够获得与SSD直连相对等的访问速度。
此次测试当中使用到的闪存驱动器为24块东芝7.68 TB SSD,而ADS1000则通过32个40 GbitE端口同五台戴尔及NEC x86服务器进行对接。每台服务器安装有两套双端口Apeiron HBA。
此后,Apeiron公司又对安装有内部Optane驱动器的同一服务器进行了性能测试,再接入配备Optane驱动器的ADS1000阵列进行再度测试。
该公司主要关注IOPS、数据吞吐量以及平均延迟等指标,并就此整理出测试结论。
Barber指出,“我们基本上通过与WWT的合作共同完成了面向Apeiron网络的NAND NVMe性能研究。此项测试中的每台服务器安装有四块驱动器,同时采用戴尔与NEC服务器结合的方式以确保Apeiron能够与一切x86第三代PCIe系统相兼容。”
“Apeiron随后与英特尔协作以测试多块Optane驱动器并运行了同一批VDBench脚本,这里使用的全部为‘现成’Optane产品(未针对Apeiron驱动器、HBA以及机柜进行任何优化)。……我们在同一数据块大小(最高256 K)前提下以七比三的读取/写入负载比例进行测试。”
以下图表所示为NAND版本ADS1000与Optane版本之间的IOPS、数据吞吐能力以及延迟水平对比:
ADS1000阵列之NAND与Optane SSD两套版本间性能测试比较。点击查看大图。
Apeiron公司亦运行了FIO基准测试,Barber表示“FIO同样非常重要,因为其证明Apeiron网络并没有因此遭遇任何显著延迟提升。实际上,采用外部阵列时其速度表现甚至优于内部Optane驱动器安装方案。这意味着‘Optane已经被串连起来’,而非作为孤立设备存在。这将改变我们对于高性能计算、分析以及SAP HANA等工作负载的理解……”
以下图表为4K随机数据块读取性能结果:
Apeiron公司的Optane DAS对Optane阵列FIO基准测试结果——条件为4K随机读取。
……以下图为128K数据块条件下的连续写入测试结果:
Apeiron Optane DAS对Optane阵列FIO基准测试结果——条件为128K连续写入。
这是我们目前见到的第一项外部阵列Optane基准测试结果,而且明显可以看到RDMA over Ethernet所提供的访问性能水平与服务器本地访问Optane驱动器方案基本相当。
Apeiron公司的系统设计同时支持NAND与Optane SSD,而且可能还会支持其它速度更快的存储介质。该公司的关注重点在于展示,其传输体系与NVMe类似,即不会带来任何网络访问造成的性能损失,且阵列本身的性能亦可实现线性增长。从结果角度出发,这一证明过程基本获得成功。
我们的目标则在于比较NAND与Optane SSD的数据访问性能。
由于不清楚ADS1000所配备之Optane的具体价格,因此我们无法判断Optane的性价比究竟如何。不过很明显,Optane确实能够提升ADS1000的数据访问性能,我们也期待着Apeiron公司能够发布Optane性能白皮书并最终推出Optane ADS1000产品。
这样火箭级的高速阵列产品可能会在性能提升方面给几乎每一种外部块存储阵列带来发展启示。该公司亦可能已经制定出一份数据管理服务路线图,旨在进一步增加此类热门解决方案对企业客户的吸引力。
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
Meta公司FAIR实验室与UCLA合作开发了名为HoneyBee的超大规模视觉推理数据集,包含250万训练样本。研究揭示了构建高质量AI视觉推理训练数据的系统方法,发现数据质量比数量更重要,最佳数据源比最差数据源性能提升11.4%。关键创新包括"图片说明书"技术和文字-图片混合训练法,分别提升3.3%和7.5%准确率。HoneyBee训练的AI在多项测试中显著超越同规模模型,同时降低73%推理成本。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
上海AI实验室团队提出ViCO训练策略,让多模态大语言模型能够根据图像语义复杂度智能分配计算资源。通过两阶段训练和视觉路由器,该方法在压缩50%视觉词汇的同时保持99.6%性能,推理速度提升近一倍,为AI效率优化提供了新思路。