近日,在2024全球数字经济大会举办的“数据要素高层论坛”上,北京电子数智科技有限责任公司(以下简称“北电数智”)AI可信负责人马世韬受邀出席,并发表《以北电数智AI可信探索,看数据要素的核心要义》的主题演讲,正式对外发布北电数智 “红湖·可信数据空间”,标志着北电数智在人工智能领域先进理念的应用和解决方案的实践。

北电数智AI可信负责人马世韬作主题演讲
据IDC测算,2022-2027年中国数据量规模将由23.88ZB增长至76.6ZB,复合增速达26.3%。然而相较于全球,中国数据开源和市场流通较差、数据挖掘和治理能力滞后,优质的中文数据集依然稀缺,大量非结构化数据无法被算法模型训练所使用。如何能够应用高质量数据集已成为制约人工智能技术发展的关键瓶颈。为数据流转应用创造互信共享环境,已成为当前促进大模型落地和AI产业发展的关键。结合对这一问题的思考,北电数智AI可信负责人马世韬提出“可信数据空间是找到跨域多主体数据流转最优解”的观点,并结合北电数智在此方面的实践成果在论坛演讲中进行了详细的介绍。
当前,国内数据价值挖掘存在“数据供不出”“数据流不动”“数据用不好”“数据风险大”等难题,需要通过建设新型基础设施来解决数据价值挖掘中的痛点。可信数据空间,是人工智能浪潮下利用标准、技术以及广泛接受的数据治理模型来促进数据安全交换、共享流通的基础设施,可保障数据要素能够在安全可信的环境中汇聚、共享、开放和应用,助力数据要素实现高效流通并充分发挥出价值,是解决数据跨域流通的最优解。

北电数智“红湖·可信数据空间”采用“数据沙箱”的理念,为政务、医疗等数据提供可信数据空间能力,并利用类似“逻辑数仓”等技术,对导入、修改和删除数据支持从概念验证到模型或应用开发调优,使数据在不离开企业的情况下实现利用;同时以隐私计算、区块链等技术和机制,通过加密计算,保证数据处理全过程的安全和隐私保护,从而打破政府、企业间的数据孤岛壁垒,实现数据融合,形成更加安全、开放、高效的数据交换生态系统;并依托全链路全周期安全可控,确保数据使用的可追溯性和透明度,从而解决数据的可信度、可控性、可用性和可审计能力难题。
正因此,北电数智不仅可为数交所、大数据局等政府端客户、资源型国企提供可信数据空间底座,确保数据要素在安全环境中有效接入、处理、托管及应用;还可为G端和B端客户提供高度安全的可信数据产品,助其实现数据存储、管理、处理、查询、决策支持、保护等功能。此外,北电数智还可为算力中心租户,在提供算力租赁的基础上,提供一站式的智算算力+智算云+可信数据开发的综合方案。
未来,北电数智将依托公司在芯片、算法大模型等领域的深厚积累,持续深耕可信数据空间领域,坚守数据安全底线,保障数据生产流通全过程安全可信,为AI生态圈企业提供全栈安全可信能力,为驱动AI可信未来构建出数据价值网络, 全力促进数据要素价值释放,让人工智能赋能千行百业,促进AI产业加速发展。
好文章,需要你的鼓励
武汉大学研究团队提出DITING网络小说翻译评估框架,首次系统评估大型语言模型在网络小说翻译方面的表现。该研究构建了六维评估体系和AgentEval多智能体评估方法,发现中国训练的模型在文化理解方面具有优势,DeepSeek-V3表现最佳。研究揭示了AI翻译在文化适应和创意表达方面的挑战,为未来发展指明方向。
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
参数实验室等机构联合发布的Dr.LLM技术,通过为大型语言模型配备智能路由器,让AI能根据问题复杂度动态选择计算路径。该系统仅用4000个训练样本和极少参数,就实现了准确率提升3.4%同时节省计算资源的突破,在多个任务上表现出色且具有强泛化能力,为AI效率优化开辟新方向。