5月9日,作为鲲鹏开发者峰会2024的“压轴环节”,鲲鹏应用创新大赛2024正式启动。华为鲲鹏计算业务总裁李义、华为鲲鹏计算业务副总裁陈超、软通动力鲲鹏生态技术总监李成鹏、长亮科技平台技术总监杨国雄、东方国信大数据事业部副总经理王虎等嘉宾作为代表共同启动了本次大赛,这也是该赛事的第5次举办。
鲲鹏应用创新大赛2024是面向基础软/硬件开发者的顶级赛事,本届大赛以“数智未来,因你而来”为主题,旨在鼓励广大开发者基于鲲鹏全栈技术,围绕产业难题、共同打造基础软/硬件解决方案。大赛由华为技术有限公司主办、鲲鹏生态创新中心承办,并联合中国软件行业协会、绿色计算产业工作委员会、中国计算机行业协会、“智能基座”虚拟教研室、“101计划”虚拟教研室共同举办,共设立企业、科研与高校3大赛事,含原生开发创新、基础软件创新、高性能计算创新等9大赛道,赛道的专业领域得以进一步延伸,推动开发者由应用迁移走向原生开发,为鲲鹏生态繁荣注入源头活水。
鲲鹏应用创新大赛2024在参赛权益、人群覆盖和赛题广度等方面再度“加码”,助力广大开发者在实战竞技中活用鲲鹏前沿技术。区域层面,覆盖北京、上海、广东、浙江、江苏、湖北、陕西、四川、山东、广西、贵州、天津、重庆、甘肃、黑龙江、山西等16个区域。为了吸引更多开发者踊跃参赛,大赛设立高达1000万元的奖金池,另外面向企业与高校参赛者增设了更丰富的参赛权益,除华为开发者大会/全联接大会等旗舰大会方案展览与推广外,参与企业赛的解决方案还可入选年度TOP100优秀商业解决方案。高校赛事参赛者更有华为公司实习机会、参与华为优才实习计划、高校赛夏令营·走进华为等多项权益可享。
随着2024年5月9日大赛启动仪式的举办,为期半年的鲲鹏应用创新大赛2024正式拉开帷幕,将于9月份进入区域决赛,经过各区角逐后,10月份进入全国半决赛,11月份正式开展全国总决赛。
人才是生态繁荣的核心,为人才搭建展现自我能力的舞台,才能不断吸引全产业链开发者聚力共舞,实现“星火燎原”之势。近年来,华为持续开放更多基础技术能力,赋能更多开发者学以致用,提高开发效率,降低开发成本,让每一位优秀开发者成为鲲鹏生态的星火,激发了整个产业的活力。鲲鹏计算产业经过四年多的快速发展,已吸引超过320万开发者,鲲鹏合作伙伴超5100家,打造15800个通过鲲鹏认证的解决方案。随着鲲鹏应用创新大赛2024的启航,鲲鹏计算产业将迸发出更澎湃的活力,深化创新奔赴山海!
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。