8月26日,阿里云透露核心存储产品ESSD已率先采用这一最新的自研存储网络协议,并实现大规模商用,数据传输效率提高50%。
据了解,未来该协议还将继续演进,有望取代传统TCP网络协议。此前,谷歌、微软也曾先后发表论文试图突破瓶颈,但都未大规模应用。
随着AIoT时代的到来,所有数据都要求实时采集、传输、计算,传统 TCP 和 RDMA 网络都无法完美适配云时代的存储需求。
ESSD是2018年阿里云研发的业内首个百万级 IOPS 、百微秒延时云存储产品,相当于一个千万平米的巨型数据仓库,自带时速超过120公里的超级高速,仅需1秒就可以完成1部高清电影的传输和存储。
阿里巴巴研究员,阿里云智能块存储研发资深总监满弓谈到,ESSD优异的性能得益于阿里云的多项技术自研,底层架构基于自研大规模分布式存储系统盘古 2.0,存储芯片采用自研Aliflash SSD,并且依托自研网络协议 Luna 和增强型RDMA 数据传输协议,结合自研HPCC流控算法,深度优化TCP,大幅降低计算资源消耗及响应延时,使ESSD的数据传输效率可提高50%。
采用全新网络协议的ESSD已正式商用,目前服务数万企业,涵盖自动驾驶、工业物联网、AR/VR、证券交易、电商搜索等数据高并发领域。
“ESSD为企业数据存储和业务敏捷创新提供了新的可能,成为AIoT海量数据存储场景的标配。”阿里云智能存储产品资深总监Alex Chen表示。
阿里云拥有全球最丰富的云存储产品家族,总数据存储量达数十EB,凭借多层次防护、跨区域容灾等能力连续三年入选Gartner全球云存储魔力象限,并且被列为全球领导者地位。
好文章,需要你的鼓励
亚马逊云服务部门与OpenAI签署了一项价值380亿美元的七年协议,为ChatGPT制造商提供数十万块英伟达图形处理单元。这标志着OpenAI从研究实验室向AI行业巨头的转型,该公司已承诺投入1.4万亿美元用于基础设施建设。对于在AI时代竞争中处于劣势的亚马逊而言,这项协议证明了其构建和运营大规模数据中心网络的能力。
Meta FAIR团队发布的CWM是首个将"世界模型"概念引入代码生成的32亿参数开源模型。与传统只学习静态代码的AI不同,CWM通过学习Python执行轨迹和Docker环境交互,真正理解代码运行过程。在SWE-bench等重要测试中表现卓越,为AI编程助手的发展开辟了新方向。
当今最大的AI数据中心耗电量相当于一座小城市。美国数据中心已占全国总电力消费的4%,预计到2028年将升至12%。电力供应已成为数据中心发展的主要制约因素。核能以其清洁、全天候供电特性成为数据中心运营商的新选择。核能项目供应链复杂,需要创新的采购模式、标准化设计、早期参与和数字化工具来确保按时交付。
卡内基梅隆大学研究团队发现AI训练中的"繁荣-崩溃"现象,揭示陈旧数据蕴含丰富信息但被传统方法错误屏蔽。他们提出M2PO方法,通过改进数据筛选策略,使模型即使用256步前的陈旧数据也能达到最新数据的训练效果,准确率最高提升11.2%,为大规模异步AI训练开辟新途径。