数据中心的创新和加速,似乎是近几年一个永恒的话题,上周刚刚落幕的Avago亚洲数据中心论坛也不例外。
这次论坛上,Avago展示了PCIe共享IO、100Gb光纤收发器、通用存储适配器和高可靠性共享存储四大技术创新,浪潮、VMware和华三等合作伙伴现身助场,讨论数据中心基础架构的变革。
最近一两年Avago相当活跃。2013年底,Avago以65亿美元收购LSI,它保留了自身需要的业务元素,并相继把将其余部分LSI的加速解决方案部门以及闪存组件部门资产出售给希捷,LSI网络处理器业务出售给英特尔,此外以约3亿美元收购PLX,6亿美元收购Emulex。
频繁的买进卖出,表明Avago公司是一家专门从事产品组合构建的厂商,通过收购不断扩大数据中心影响力,这也逐步形成了Avago宽广的产品线。据介绍,Avago目前有超过2万项专利,每年研发投入约6.95亿美元,数据中心为首选投资重点。
现在,Avago与OEM合作伙伴之间拥有超过数千百种产品的协作关系,其范围涵盖通信包括无线、有线、企业级存储和工业市场。收购LSI之后Avago正式进军企业存储市场,针对从小型到超大规模数据中心,从存储处理器到固态盘等存储介质。
目前Avago存储业务的主要产品类型包括芯片、控制器、扩展器、PCIe交换器、软件固件等,而面向的客户以服务器OEM和ODM厂商、外部存储OEM和ODM厂商为主,这也使得OEM和ODM厂商较为集中的中国成为Avago增长最快的地区之一。
正如IDC中国区总裁霍锦洁在演讲中称,“未来数据中心的最大赢家将是在中国,这里是新技术的开创地”。在中国开展业务的同时,伴随数据中心规模日益壮大,Avago自身也在经历一场转型。LSI高级副总裁兼数据中心解决方案部总经理Tom Swinford称,如今Avago在中国市场主要帮助OEM厂商快速推出方案,在超大规模数据中心方案设计以及基于NVMe的固态盘设计上投入了大量精力。
对于数据中心复杂的变化趋势,Avago认为数据中心对固态盘的需求是非常强劲的,甚至已经开始超过传统硬盘的采购量。不仅如此,由于SATA已经成为数据中心性能的瓶颈,而NVMe芯片发展速度越来越快,固态盘的OEM厂商有70%的研发经费已经转向了NVMe领域,因此现代化数据中心正在朝着PCIe、NVMe作为物理接口和协议的方向过渡。
市场在转型,但是数据中心且并没有大规模采用NVMe,Swinford分析背后的原因是存储连接性方面存在技术空白。Avago在去年以3亿美元收购PLX,获得了存储数据交换技术并融入Avago产品,即将推出业界首款针对NVMe优化的网络链接产品,据称可以同时控制连接20个NVMe盘,打造一个基于NVMe的外部存储平台。
例如,这次论坛上Avago就和浪潮联合展示了使用PCIe交换芯片和服务器通用控制器连接,实现存储共享,针对中国拥有超大规模数据中心的企业。之所以如此关注PCIe,是因为现在数据中心很多组件都自带了PCIe接口,这样通过自带资源与PCIe接口实现连接,无需使用其他协议。
不仅如此,在很多场景下,把PCIe用于处理器与GPU之间、GPU与GPU之间的连接,使得数据中心自身的很多硬件,以软件方式实现硬件的集成。Avago数据中心解决方案事业部市场营销与支持副总裁Jas Tremblay认为,要做软件定义存储,就必须实现服务器与存储之间的互联互通,这正是Avago擅长的领域。
在会后接受采访时Swinford表示,Avago在软件定义存储方面的策略,是主要由操作系统级厂商主导,Avago起辅助的作用,包括和一些主流及创业型公司合作,例如Avago在这次论坛上就宣布与VMware投资建立联合实验室,共同开发软件定义的数据中心方案,并承担一些认证和测试的工作。
最后在谈到针对中国市场的定制化战略时,Tramblay解释说,目前在中国市场的定制化主要分为三个层次:芯片级,尤其是数据中心ODM厂商和高性能计算厂商;主板级,和OEM厂商做主板设计上的定制化,体现设计和成本上的差分性;软件级,现在Avago会帮助一些伙伴尤其是高性能计算厂商做软件定制,而这在两年前还没有过的。
好文章,需要你的鼓励
这篇研究提出了OThink-R1,一种创新的大型推理模型,能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现,现有推理模型即使面对简单问题也会生成冗长的推理过程,导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理,OThink-R1能根据问题复杂度动态调整思考深度。实验表明,该方法平均减少了23.4%的生成文本量,同时保持或提高了准确率,代表了向更高效、更人性化AI推理系统迈出的重要一步。
这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成准确率,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
这项由香港大学和南京大学等机构研究人员联合开发的双专家一致性模型(DCM)解决了高质量视频生成中的效率难题。研究团队发现扩散模型蒸馏过程中存在优化冲突:早期阶段负责语义布局与运动,后期阶段关注细节精修,两者学习动态差异显著。DCM创新性地将这两个任务分配给不同的专家模型,通过参数高效的实现方式,使模型仅需4步即可生成接近50步原始模型质量的视频,大幅提升生成速度,为实用化AI视频创作铺平道路。
这项研究介绍了QARI-OCR,一种基于Qwen2-VL-2B-Instruct模型微调的阿拉伯文字识别系统。研究团队通过三阶段合成数据训练,成功解决了阿拉伯文字识别中的主要挑战:曲线连笔特性、上下文变化的字母形状和发音符号。QARI v0.2模型创下了0.061的字符错误率和0.160的单词错误率,超越了现有开源解决方案,为阿拉伯文化遗产的数字化保存提供了重要工具。