近年来,随着5G通信、云计算、大数据、人工智能等科技的进步,智能网联汽车成为新时代汽车产业转型升级和产业技术变革的重要突破口,市场规模不断扩大。
近日,Momenta总裁曹旭东在接受人民网记者采访时表示,在全球AI驾驶技术面临巨大挑战的今天,Momenta将继续扎根中国,坚持数智化创新,助力自动驾驶迈向体验更舒适、驾驶更安全的高质量发展赛道。
“我们的目标非常明确,是实现规模化无人驾驶,不是做个demo,跑个测试区域,而是真正地完成商业闭环,让所有人在所有交通过程中,都能够得到自动驾驶带来的安全和价值。”曹旭东说。
Momenta在推进人工智能和自动驾驶的发展过程中,有着怎样的战略路径?数据驱动、AI大模型的技术在其中如何发挥作用?Momenta对未来技术路线演进的理解又是什么?
曹旭东告诉记者,Momenta的关键战略即“一个飞轮,两条腿”。一个飞轮,是指数据驱动的AI飞轮,人工智能的核心在于用数据驱动的算法,通过闭环自动化的方式,利用海量数据驱动技术快速迭代,最终实现“两年十倍”的成长速度。一条腿是L2级别的量产智能驾驶,通过与领先的主机厂进行量产合作,实现十万,百万,千万数量级的车辆装载量,产生海量数据流,以训练自动驾驶算法,解决L4完全无人驾驶的长尾问题。另一条腿是L4级别的完全无人驾驶,持续提供技术流,赋能量产智能驾驶产品能力的快速进步。
曹旭东介绍称,这样两条腿交替提升,让量产L2车辆的数据,可以用来训练L4的算法,让L4的算法,为L2提供足够高的技术上限和进步空间。打通量产智能驾驶(Mpilot)和完全无人驾驶(MSD)的技术架构和数据流,最终实现规模化无人驾驶。
据了解,目前Momenta已与全球排名前十的汽车集团中的一半企业开展量产合作,业务覆盖中国及德国、日本、美国等多个国际市场,其中Robotaxi系列也已经在苏州落地运行,产生的海量数据也在助力自动驾驶安全水平和使用体验上的持续提升。
“这条关键的战略路径,是我们创业第一天就定下来的,主要是基于我们对自动驾驶终局的思考。”曹旭东认为,“自动驾驶的终局,是实现规模化无人驾驶,就是任何车辆,任何时间,任何地点,均可实现无人驾驶。”
曹旭东告诉记者,要实现完全无人驾驶,就必须要有约千亿公里的路测数据,相当于数百万辆车在路上跑一年的数据量。对于一家创业公司来说,成本是难以承受的。这就决定了Momenta必须面向量产,与主机厂合作,通过量产车辆,获得海量数据,训练自动驾驶的算法,最终实现规模化无人驾驶。
在曹旭东看来,人工智能,特别是基于海量数据,深度学习的算法,随着数据量的累积,数据处理能力的提升,具备自主学习,自我迭代的潜力,可以大幅降低解决每个长尾问题的研发成本。所以,要实现规模化无人驾驶,要真正发挥人工智能的潜能,就必须坚定不移地走数据驱动的道路。
“中国汽车产业的数智化创新,已经走在全球的前列,这里面得益于国家政策的指引,中国消费者对创新的开放和包容,以及中国汽车人的锐意进取和自我革新。”曹旭东表示,中国有全球最高质量的实体基础设施建设及数字化基础设施建设,而这些数字化的基础设施建设,能够很好地推动产业协作模式持续优化,帮助企业降本增效,形成新能力。
“海量数据的存储和处理是自动驾驶研发的重点工作之一,比如通过与华为云的合作,获得可靠的数字基础设施服务,通过数字化运营的工具和方法论,提升我们的产品研发效率。”曹旭东说。
谈及未来,汽车行业“数智化”的下半场,中国汽车产业如何加速拥抱智能化、实现全面数智升级,赢得全球竞争优势?
曹旭东表示,除了进一步提升自动驾驶的安全水平和舒适度,中国汽车产业还要不断加强产业协作模式的优化和重塑,用好数字化能力强的合作伙伴,重塑自身的业务流程,逐渐从L2,发展到L3,、L4;加速推进智能化转型,实现全面数字化升级,最终实现规模化无人驾驶,以赢得全球市场竞争优势。(来源:人民网)
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。