本周,已经有多家供应商开始将NVMe与其它云、软件以及超融合发展趋势相提并论。但在本文中,我们首先为大家带来几条新消息。
Blocks and Files报道称,Komprise公司的文件生命周期管理客户如今迎来更多冷门数据存储选项。
富士通-NetApp融合型NFLEX系统(目前仅在欧洲、中东以及非洲市场销售)获得SAP商务套件认证,已经成为面向S/4HANA以及BW/4HANA部署方案的认证产品。
初创企业Burlywood公司在其自主开发的闪存控制器软件包当中添加了NVMe支持能力。
Veeam公司告别其联合CEO Peter McKay,原因是这位掌门人无法为其一系列新举措提供合理的依据。由此空出的CEO与COO岗位也立即开始物色新人选。
NVMe-over-Fabrics阵列软件初创厂商Excelero公司将跨越TCP与光纤通道的NVMe运行能力引入其NVMe软件当中,旨在为现有iSCSI以及FC SAN用户提供面向NVMe-oF的迁移路由选项。
接下来是NVMe的“三杀”新闻:富士通公司表示其接下来将要推出的ETERNUS存储阵列将同时支持NVMe驱动器以及NVMe-oF访问机制。
此外,为了向英国学术界展示NVMe-oF阵列的连接优势,伦敦玛丽皇后大学公布了一款高性能DDN GridScaler阵列以及一款性能更为强劲的Excelero NVMe-oF D24全闪存阵列——后者性能表现之强,甚至令GrdScaler直接“沦为”高容量选项。
本周晚些时候,我们了解到由David Scott牵头的四位前任3PAR/HPE存储高管将重返初创企业Nebulon公司。该公司专注于面向混合IT的云定义存储业务。这家初创企业仍处于早期发展阶段,且目前正在招聘基础工程师职位,因此我们对其发展进度无疑有必要保持耐心。
这家企业表示还有很多工作要做,具体包括整理超融合基础设施供应商报告以及面向公有云的数据调回等。
好文章,需要你的鼓励
这篇研究提出了OThink-R1,一种创新的大型推理模型,能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现,现有推理模型即使面对简单问题也会生成冗长的推理过程,导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理,OThink-R1能根据问题复杂度动态调整思考深度。实验表明,该方法平均减少了23.4%的生成文本量,同时保持或提高了准确率,代表了向更高效、更人性化AI推理系统迈出的重要一步。
这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成准确率,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
这项由香港大学和南京大学等机构研究人员联合开发的双专家一致性模型(DCM)解决了高质量视频生成中的效率难题。研究团队发现扩散模型蒸馏过程中存在优化冲突:早期阶段负责语义布局与运动,后期阶段关注细节精修,两者学习动态差异显著。DCM创新性地将这两个任务分配给不同的专家模型,通过参数高效的实现方式,使模型仅需4步即可生成接近50步原始模型质量的视频,大幅提升生成速度,为实用化AI视频创作铺平道路。
这项研究介绍了QARI-OCR,一种基于Qwen2-VL-2B-Instruct模型微调的阿拉伯文字识别系统。研究团队通过三阶段合成数据训练,成功解决了阿拉伯文字识别中的主要挑战:曲线连笔特性、上下文变化的字母形状和发音符号。QARI v0.2模型创下了0.061的字符错误率和0.160的单词错误率,超越了现有开源解决方案,为阿拉伯文化遗产的数字化保存提供了重要工具。