3月16日,在2024年中国电动汽车百人会论坛上,国科础石总裁薛云志受邀发表《探索国产汽车操作系统发展之路》主题演讲,提出了突破国产汽车操作系统两大卡点,针对国产汽车操作系统发展提出了三大主张。
汽车智能化、硬件集中化对车规级汽车操作系统提出了更高的要求。一方面,硬件集中化使得电子电气架构在发生调整和变化;另一方面,在应用层中,高阶自动驾驶、端到端大模型、整车融合式智能的趋势,对操作系统提出了高安全、高性能、满足AI原生计算需求、开源开放的要求。
当前,国产操作系统在功能安全、性能、核心技术等方面已具备一定实力,产品与技术上不存在本质障碍,真正的困难在于怎么实现规模化量产上车和如何建设生态。
薛云志在演讲中说道:“从上车角度看,由于操作系统切换成本高,国产汽车操作系统难以规模化量产装车;无法量产又进一步导致汽车操作系统难以接触业务场景,产品迭代与工程经验不足使得产业难以建立对国产汽车操作系统的信心。”
“从生态角度看,国产操作系统在产业生态、开发生态建设上受制于人。国产操作系统生态替代缺乏需求牵引,产业应用不足,又让国产操作系统缺少生态建设的牵引能力和议价能力。另外,上下游难以打通,令国产汽车操作系统与国产芯片间没有形成强产业协同,也导致了国产操作系统应用生态难以进一步发展。”
目前业界针对国产汽车操作系统“上车”和“生态”两个关键卡点的应对措施,总结下来一共有10点。比如通过做好产品、全栈自研、参与主机厂与Tier1开放生态建设、构建标准体系、国产操作系统“上车”政策支持等5大实践推动量产“上车”;同时通过面向行业部分开放源码、全面开源、基础软件和芯片协同、以开源促标准,以标准促生态、随中国汽车出海构建全球生态等5大举措促进“生态”建设。
这十条行业实践,从结果上看并没有根本性解决国产操作系统的问题。在这些实践的基础上,国科础石进一步提出了三大创新主张:
建立智能汽车操作系统的开源基线版本;
面向整车操作系统演进建设软件工程工具,以工具促生态;
芯片、操作系统厂商、主机厂联合共建公共软件工程平台
建立智能汽车操作系统的开源基线版本以及根社区
以服务器端操作系统为例,Linux根社区Linux.org于1991年发布Linux0.01版。以此为基线版本,后续二十年又不断衍生出Debian, Fedora, CentOS,Gentoo,Ubuntu等社区和社区发行版,以及Redhat,SUSE等商业发行版,生态逐步繁荣。“Linux已经运行在我们所能见到各种各样的设备之上,小到最小的微控制器,大到宇宙飞船等等,我们可以看到Linux几乎无所不在,反观现在汽车操作系统,其实并没有建立起来根社区和基线版本”,薛云志说道。
对此,国科础石提出我国亟需打造自主的类Linux的开源操作系统基线版本并建立开源根社区,形成生态护城河,并为此做了大量实践。
国科础石将Linux做了专门的定制和优化,同时做了功能安全增强,把自动驾驶所需的核心功能全部抽象出来,形成了一个专门的内核,成功获得中国第一张ASIL-B的功能安全评估报告。同时,国科础石面向车控域的RTOS也获得了ISO26262 ASIL-D功能安全认证。
薛云志强调:“国科础石愿意把符合车规的最高功能安全等级要求的基础操作系统的全部组件,都贡献到开源社区里面作为基线版本运行,同时基于础光操作系统基线版本,建立国内根社区,并与OpenSDV汽车软件开源联盟等专业性的国内开源组织协作,召集更多志同道合的开发者共建,推进社区的可持续成长;基于开源开放推动国产汽车操作系统的共同发展,以一个功能安全、组件全面的开源操作系统作为基线版本建设技术底座,避免行业重复造轮子。”
面向整车操作系统演进建设软件工程工具,以工具促生态
开发工具、开发资源推动生态建立这一路径已在PC时代、智能手机时代均得到验证。Windows生态的建立离不开Visual Studio,安卓的成功也离不开Google Mobile Service。在国科础石看来,汽车操作系统生态的建立,也需要一套可以适应未来汽车操作系统架构演进与开发实践变革的工具,从基础编译器、诊断工具,向SOA化开发、虚拟孪生、云原生开发者平台演进,适应从基础操作系统向整车操作系统的发展路径。简而言之,如果有好的工具,赋能开发者,减少二次开发,将支撑并促进生态的建设。
因此,国科础石提出面向整车操作系统演进建设汽车软件工程工具,以工具促生态。薛云志表示,我们正在着力打造一系列适配性好的专业工具,并形成完整、成熟、安全的工具体系,覆盖设计、开发、测试、验证的全生命周期的工具链条,能够帮助主机厂、Tier1供应商应对越来越复杂,越来越智能化的开发需求,为生态建设送上“强力助攻”。
芯片、操作系统厂商、主机厂联合共建公共软件工程平台
最后,操作系统与芯片之间的耦合关系,芯片适配对于国产操作系统生态的发展至关重要。国产芯片厂商需要重复适配不同的操作系统,涉及大量重复的工程化适配工作,还要开发配套IDE、配置工具等。这对于芯片大厂商来说是必要的投入,但对于众多国内厂商来讲,重复投入建设软件研发团队,重复造轮子,这是很大的成本支出。
由此,国科础石提出以公共资源统筹的方式,来解决国产芯片与国产操作系统重复适配的问题,降低产业总成本。具体来说,就是通过联合芯片厂商、基础软件厂商、主机厂联合建设公共平台,由该平台负责芯片与操作系统的适配,统一框架与接口标准,并建设统一的IDE、配置工具链等。向下适配硬件,同时向上整合应用,减少芯片厂商高昂的软件成本,形成新型产业链生态。
可以预期的是,新型产业链生态的成功打造,将带来新型零部件产业链的聚集,提高零部件厂商全方位服务能力,助力行业向软件定义转型升级,带动产业繁荣。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。