今天,在华为开发者大会2024 (HDC 2024)上,华为常务董事、华为云CEO张平安重磅发布盘古大模型5.0,在全系列、多模态、强思维三个方面全新升级;同时,张平安展示了盘古大模型在工业设计、建筑设计等领域的丰富创新应用和落地实践,持续深入行业解难题。这也将为建筑设计和制造业带来革命性的变革,还极大地加速了创新周期,为设计师们提供了前所未有的创意工具。
张平安强调,一直以来,华为云盘古大模型都坚定的聚焦行业,在解难题、做难事的道路上不断攻坚克难,砥砺前行,重塑千行万业。
据介绍,在工业设计领域,以新车造型设计为例,周期一般需要1-2年,盘古大模型可以让汽车的造型设计时间大幅缩短。造型设计师可以将自己的灵感,通过对话、画图与大模型交互,生成3D汽车数字模型,并可进行风格化调整、零部件编辑、颜色更换等。盘古大模型生成的数字模型还可直接输出成3D文件,支持10几种主流格式,设计师可以直接3D打印成样品,减少制作油泥模型的轮次,极大地节省成本和时间。
除了汽车造型设计,盘古大模型还可以用于汽车的工装设计、模具设计,以及电子产品领域的工业设计等。华为云与东莞市政府共同打造了东莞市人工智能大模型中心,希望让当地更多的电子制造类企业使用到盘古大模型的工业设计服务。
在建筑设计领域,基于盘古大模型的可控生成能力,只需输入设计的黑白草图,即可生成彩色并带有纹理的建筑群360°实景视频;基于盘古3D重建能力,还可以构建出高真实感的建筑3D模型,将复杂建筑群的概念设计周期从数周缩短到数十分钟,助力建筑师创造出更加出色的建筑作品。
“盘古大模型让每个工业设计师、每个建筑设计师都拥有自己的专业助手,让所想即所见,所见即所得!” 张平安表示。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。