12月15日,由开放原子开源基金会、中国电子技术标准化研究院、国家工业信息安全发展研究中心、中国软件行业协会共同主办的操作系统大会2023在北京举办。openEuler委员会主席江大勇先生表示:openEuler已经成长为符合国际标准的开放治理、合规运作、具备安全供应链的全球化社区,在中国汇聚全球开源力量,为世界开源贡献中国智慧。
欧拉开源四年,实现了跨越式的发展,从正式上线到2019年12月31代码正式开源头三,再到今天历经了1445天,欧拉系已经成为中国服务器操作系统新增第一份额。2023年中国新增市场份额占比36.8%,并在技术创新、行业应用、产业生态建立了完善地发展体系,形成了正循环。这是在全球最大的单一市场,基础软件领域,仅用4年时间就成为第一份额,创造了记录。
构建全球开源生态,打造国际化的开源协作平台
欧拉一直致力于打造国际化的开源协作平台,汇聚全球开源力量,为世界开源贡献智慧,并始终以支持全球98%的开源软件,欧拉已经持续集成的操作系统,进入了云原生、大数据、存储、数据库、SPDX的社区,实现了原生支持,开箱即用。
在软件供应链的稳定和安全方面,欧拉深度参与了openCHAOSS等规范的制订与推广,率先突破了ISO5230开源软件协议认证,在社区的基础设施达到了openSSF、SLSAL3标准,为用户提供安全可靠的系统。此外,欧拉还与全球组织合作,帮助欧拉满足全球各区域本地化要求,规范欧拉开源社区的国际化治理,让全球用户和开发者充分使用欧拉,贡献欧拉。
发布基础设施2.0,汇聚全球开发者,打造全场景OS
全球化的openEuler,需要全球化的社区基础设施的支撑。围绕开发、构建和协作的全流程社区活动,打造高效易用的社区基础设施平台。
全球化开发方面,支持多代码托管平台接入社区,方便贡献者就近开发;支持多平台多类型镜像的分发,方便用户就近获取openEuler。全场景构建方面,定义创新的软件元数据描述文件,适配众多格式的上游软件,通过EulerMaker,实现全场景的统一构建。全链路协作方面,通过应用软件平台,连接海量上游软件和社区用户,实现上游软件的分类聚合和预验证,以及用户共性问题反馈快速闭环,大幅提升协作效率。
共建、共享、共治,openEuler成最具活力、创新力开源社区
从openEuler捐献给开放原子开源基金会之后,得到加速发展,2022年12月,开放原子开源基金会宣布openEuler升级为项目群,在治理章程、社区运作、资金募集等方面可独立项目运作,接受开源项目加入,使用openEuler项目群基础设施、运营、营销等资源。2023年上半年,9个项目完成捐赠意向签约,此次大会新增13个项目捐赠意向签约,多为解决方案类、涉及全场景、全开发流程的项目,捐赠后将从云原生、AI、智能化、可监控等维度为openEuler注入新的创新力量。
openEuler开源社区秉承“共建、共享、共治”的原则,携手全产业链共建可持续发展的操作系统产业生态。社区开源以来,已吸引1300+家头部企业、研究机构和高校加入,汇聚16800+名开源贡献者,成立100+个特别兴趣小组(SIG),openEuler开源社区已成为中国最具活力和创新力的开源社区。
从星星之火到燎原主流,从引领中国到走向世界。未来,欧拉将连接全球开源基金会、开源组织、开发者,共建全球开源新生态,为全社会创造价值。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。