2016年成立于纽约的VAST Data公司,日前宣布推出通用存储平台 (Universal Storage Platform),并表示公司已将数十千兆字节(GB)的存储出售给信息技术公司以及生物和医疗技术公司。VAST Data已获得8000万美元融资,公司的目标是希望帮助用户在最初归档应用程序时,无需再在多层级存储(特别是硬盘驱动器)环境和全固态解决方案两者中做出权衡取舍。令人非常感兴趣的是,VAST Data的通用存储平台 (Universal Storage Platform) 也是首个应用了3D XPoint存储技术的平台之一,并将存储系统的成本较传统企业闪存降低了80%。
VAST的通用存储平台在其存储前端使用英特尔傲腾(3D XPoint) NVMe SSD,可实现每秒万亿字节(TB/s)的写入速度和每秒数百万次的读写速度 (IOPs),并提供每单元四比特 (QLC)的3D NAND,进行艾字节规模的文件系统(NFS)和对象(S3)存储。VAST Data表示,使用NVMe QLC闪存和NVMe over Fabric (NVMe-oF) 不仅可以显著提高性能,还能将存储系统的成本降至可以媲美硬盘成本的水平。他们的目标是通过这种方法消除所有闪存、NAS和云对象以及文档存储,并将其集成到VAST的通用存储平台之上。
VAST存储系统组件(图片来自VAST产品展示)
该公司表示,他们在客户端网络中提供了一个跨文件和对象的全局命名空间,通过数据中心规模转换的NVMe以太网结构访问3D XPoint内存(存储级内存,下图中简称SCM)。SCM缓存层下面的QLC闪存结合有趣的软件管理功能,则可以优化性能和存储利用率。除了全局命名空间之外,他们还提供数据保护和全局压缩。
采用傲腾写缓冲器的VAST全局命名空间QLC闪存(图片来自VAST产品展示)
VAST宣称,“服务器在 VAST架构中是松散耦合的,因为不需要相互协调输入和输出,它们的数量几乎可扩展到无穷大。它们也不受任何集群式串扰的阻碍,那些串扰通常会给无共享(Shared-nothing)架构带来挑战。此外,VAST服务器可以像集装箱一样嵌入到应用服务器中,为每台主机提供NVMe over Fabrics (NVMeoF) 架构的性能。”
该公司可通过减少闪存上的写入来使用QLC闪存固态硬盘,特别是通过缓冲傲腾内存的写入,来实现写入放大,并使用应用感知数据放置在闪存上实现顺序写入。他们还尽可能将写入与擦除操作结合起来,写入完整的QLC擦除块。
VAST Data公司的数据存储模型基于几种有趣的方法来减少所需的容量包括自描述数据结构,发现并利用数据相似性模式在“全局命名空间中”进行数据压缩和重复数据删除,“其所拆分的数据细粒度比当前重复数据删除技术要小4000到128000倍。” VAST Data还宣称其重建速度比硬盘要快若干倍。他们还预测了将数据放置于闪存中的数据使用情况。使用本地可解码压缩算法在1毫秒内即可完成读取操作。
VAST展示了一种全局命名空间存储系统,该系统利用基于傲腾的缓冲器和数据管理功能来管理QLC闪存系统的损耗,该闪存系统的耐久性及保修期为10年。如今,诸如傲腾这样的新兴持久性内存正在对存储架构产生巨大影响。
好文章,需要你的鼓励
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。