在6月21日举办的华为开发者大会(HDC 2024)上,华为云CTO张宇昕介绍了下一代云基础设施——CloudMatrix。这一创新性的技术解决方案旨在解决当前云平台在大模型训练和使用中遇到的“算力墙”“内存墙”和“能效墙”等问题。
张宇昕表示,CloudMatrix改变了传统数据中心的架构和算力供给模式,将传统的以CPU为中心的主从架构,演进为多元算力对等全互联架构;并通过高速互联网络协议,将CPU、NPU、GPU 等算力资源全部互联和池化,从而把AI算力从单体算力演进到矩阵算力,开启智能算力新纪元。
目前华为云是业界唯一采用对等架构超节点技术提供算力服务的厂商,实现了业界领先的性能和可靠性。据悉,华为云超节点在算力方面相比业界单节点提升了50倍,大模型的checkpoint恢复时长低于10分钟,万卡集群线性度大于95%,远超业界水平。
值得一提的是,基于盘古大模型5.0的实测数据显示,在同等算力条件下,CloudMatrix相较于传统服务器集群架构,在模型训练效率上提升了68%。这一显著的提升,充分证明了CloudMatrix在云原生基础设施方面的技术领先性。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。