2016年成立于纽约的VAST Data公司,日前宣布推出通用存储平台 (Universal Storage Platform),并表示公司已将数十千兆字节(GB)的存储出售给信息技术公司以及生物和医疗技术公司。VAST Data已获得8000万美元融资,公司的目标是希望帮助用户在最初归档应用程序时,无需再在多层级存储(特别是硬盘驱动器)环境和全固态解决方案两者中做出权衡取舍。令人非常感兴趣的是,VAST Data的通用存储平台 (Universal Storage Platform) 也是首个应用了3D XPoint存储技术的平台之一,并将存储系统的成本较传统企业闪存降低了80%。
VAST的通用存储平台在其存储前端使用英特尔傲腾(3D XPoint) NVMe SSD,可实现每秒万亿字节(TB/s)的写入速度和每秒数百万次的读写速度 (IOPs),并提供每单元四比特 (QLC)的3D NAND,进行艾字节规模的文件系统(NFS)和对象(S3)存储。VAST Data表示,使用NVMe QLC闪存和NVMe over Fabric (NVMe-oF) 不仅可以显著提高性能,还能将存储系统的成本降至可以媲美硬盘成本的水平。他们的目标是通过这种方法消除所有闪存、NAS和云对象以及文档存储,并将其集成到VAST的通用存储平台之上。
VAST存储系统组件(图片来自VAST产品展示)
该公司表示,他们在客户端网络中提供了一个跨文件和对象的全局命名空间,通过数据中心规模转换的NVMe以太网结构访问3D XPoint内存(存储级内存,下图中简称SCM)。SCM缓存层下面的QLC闪存结合有趣的软件管理功能,则可以优化性能和存储利用率。除了全局命名空间之外,他们还提供数据保护和全局压缩。
采用傲腾写缓冲器的VAST全局命名空间QLC闪存(图片来自VAST产品展示)
VAST宣称,“服务器在 VAST架构中是松散耦合的,因为不需要相互协调输入和输出,它们的数量几乎可扩展到无穷大。它们也不受任何集群式串扰的阻碍,那些串扰通常会给无共享(Shared-nothing)架构带来挑战。此外,VAST服务器可以像集装箱一样嵌入到应用服务器中,为每台主机提供NVMe over Fabrics (NVMeoF) 架构的性能。”
该公司可通过减少闪存上的写入来使用QLC闪存固态硬盘,特别是通过缓冲傲腾内存的写入,来实现写入放大,并使用应用感知数据放置在闪存上实现顺序写入。他们还尽可能将写入与擦除操作结合起来,写入完整的QLC擦除块。
VAST Data公司的数据存储模型基于几种有趣的方法来减少所需的容量包括自描述数据结构,发现并利用数据相似性模式在“全局命名空间中”进行数据压缩和重复数据删除,“其所拆分的数据细粒度比当前重复数据删除技术要小4000到128000倍。” VAST Data还宣称其重建速度比硬盘要快若干倍。他们还预测了将数据放置于闪存中的数据使用情况。使用本地可解码压缩算法在1毫秒内即可完成读取操作。
VAST展示了一种全局命名空间存储系统,该系统利用基于傲腾的缓冲器和数据管理功能来管理QLC闪存系统的损耗,该闪存系统的耐久性及保修期为10年。如今,诸如傲腾这样的新兴持久性内存正在对存储架构产生巨大影响。
好文章,需要你的鼓励
阿里云CEO吴泳铭在财报电话会议上表示,AI需求增长如此迅猛,以至于服务器部署速度无法跟上客户需求。公司正在对GPU进行配给制,优先满足使用全套阿里云服务的客户需求。过去12个月,阿里巴巴在AI相关基础设施上投入1200亿元人民币,预计三年预算可能超过当前的3800亿元。阿里云智能集团季度营收达56亿美元,同比增长34%。
新加坡南洋理工大学团队开发的NEO模型颠覆了传统视觉语言AI的设计思路,从模块化拼接转向原生统一架构。仅用3.9亿图文配对数据就实现了与大型模块化系统相媲美的性能,证明了端到端训练的有效性,为AI系统设计开辟了新路径。
OpenAI为ChatGPT推出"购物研究"新功能,恰逢假期购物季。该功能面向免费和付费用户开放,支持移动端和网页版。用户询问购物问题时,ChatGPT会提供个性化购物助手服务,通过一系列问题帮助用户筛选价格、用途和功能偏好。该功能基于专为购物任务优化的GPT-5 mini版本,从优质网络资源获取产品信息。OpenAI计划推出即时结账功能,允许用户直接在ChatGPT内购买商品。
谷歌联合德克萨斯大学等机构开发出LATTICE框架,这是一种革命性的信息检索系统,能像智能图书管理员一样工作。它将文档组织成语义树结构,用AI推理能力进行智能导航搜索,在复杂查询任务上比传统方法准确率提高9%以上。该系统无需训练即可适应新领域,为未来智能搜索指明了方向。