11月2日,以“数智未来 因你而来”为主题的鲲鹏应用创新大赛2023全国总决赛在四川成都圆满落幕。经过长达6个月的层层筛选与激烈角逐,最终从3大赛事、5大赛道中评选出了13个金奖、16个银奖、19个铜奖。
本次全国总决赛邀请到中国工程院院士、清华大学计算机科学与技术系教授、鲲鹏MVP郑纬民作为致辞嘉宾进行开场致辞。他表示,多年来鲲鹏在处理器、操作系统、数据库等基础软硬件领域的持续探索以及在重点行业核心场景的落地应用成绩斐然,目前已构建一个全栈创新的计算产业生态系统。郑院士强调,人才作为燎原的星星之火,特别是鲲鹏与高校进行着越来越广泛的合作,正在着手打造更为广阔的开发者使能蓝图。
华为鲲鹏计算业务总裁李义表示,鲲鹏应用创新大赛自2020年创立以来已经连续举办了三届,今年第四届大赛在规模、赛题设置、赛队辅导等方面进行了全方位提升。在企业赛的基础上,增加了高校赛和科研赛,为高校团队提供了一个更加公平的竞赛环境,吸引了来自全国50多个顶尖院校的400多支队伍参赛,相比去年翻了两倍。面向企业,今年大赛首次设置“鲲鹏一体机解决方案创新赛道”,来自金融、运营商、政府等国计民生重点行业的很多优秀企业都热情参与。今年我们鼓励赛队从“会用鲲鹏”走向“用好鲲鹏”,基于鲲鹏平台进行更多的原生开发和创新。总决赛入围的102个作品中有80%运行在openEuler系统,有72%使用鲲鹏Devkit代码迁移和性能分析工具,有65%基于鲲鹏Boostkit进行了性能优化。大赛的每一支参赛队伍都是鲲鹏计算产业的一笔宝贵财富,也为中国计算产业创新发展注入蓬勃动力。明年,面向企业,我们将继续拓展国计民生行业广度,携手企业开发者深入行业核心生产系统,以多样性算力释放技术生产力,并发布新的激励政策鼓励伙伴商用版本基于鲲鹏首发,支持更多原生方案开花结果。面向高校,将继续加大推广,吸引更多同学以赛促学,让更多科研人才熟悉鲲鹏。同时,我们将持续升级鲲鹏应用创新大赛平台,携手广大的鲲鹏开发者共创美好的数智未来。
鲲鹏应用创新大赛是面向全球开发者的顶级赛事,旨在激发行业应用创新、加速产业融合、促进人才培养,吸引全产业开发者共同打造鲲鹏全栈解决方案。全国总决赛邀请到院士、高校教授、产业联盟组织代表、行业组织代表、企业领袖等各界专业人士莅临大赛,担任评委,共同从技术领先性、方案创新性、商业前景、社会价值、现场表现等多个维度对参赛队伍进行评审。全国16个赛区、1600多支队伍,经过6个月的角逐,最终从3大赛事、5大赛道中评选出了13个金奖、16个银奖、19个铜奖。以下为获奖名单:
是结束,更是开始。面向未来,鲲鹏应用创新大赛将继续促进产业链合作伙伴的开放合作,聚力更多产业资源,汇聚更多行业能量,使能开发者不断创新。华为也将继续秉持“硬件开放、软件开源、使能伙伴、发展人才”的生态策略,持续创新,为中国计算产业夯实发展底座。
本次全国总决赛由华为技术有限公司主办,鲲鹏生态创新中心承办,中国软件行业协会、绿色计算产业联盟、中国计算机行业协会、"智能基座"虚拟教研室、"101计划"虚拟教研室联办,并得到四川华鲲振宇智能科技有限责任公司和北京海量数据技术股份有限公司的赞助支持。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。