近日,在2024全球数字经济大会举办的“数据要素高层论坛”上,北京电子数智科技有限责任公司(以下简称“北电数智”)AI可信负责人马世韬受邀出席,并发表《以北电数智AI可信探索,看数据要素的核心要义》的主题演讲,正式对外发布北电数智 “红湖·可信数据空间”,标志着北电数智在人工智能领域先进理念的应用和解决方案的实践。
北电数智AI可信负责人马世韬作主题演讲
据IDC测算,2022-2027年中国数据量规模将由23.88ZB增长至76.6ZB,复合增速达26.3%。然而相较于全球,中国数据开源和市场流通较差、数据挖掘和治理能力滞后,优质的中文数据集依然稀缺,大量非结构化数据无法被算法模型训练所使用。如何能够应用高质量数据集已成为制约人工智能技术发展的关键瓶颈。为数据流转应用创造互信共享环境,已成为当前促进大模型落地和AI产业发展的关键。结合对这一问题的思考,北电数智AI可信负责人马世韬提出“可信数据空间是找到跨域多主体数据流转最优解”的观点,并结合北电数智在此方面的实践成果在论坛演讲中进行了详细的介绍。
当前,国内数据价值挖掘存在“数据供不出”“数据流不动”“数据用不好”“数据风险大”等难题,需要通过建设新型基础设施来解决数据价值挖掘中的痛点。可信数据空间,是人工智能浪潮下利用标准、技术以及广泛接受的数据治理模型来促进数据安全交换、共享流通的基础设施,可保障数据要素能够在安全可信的环境中汇聚、共享、开放和应用,助力数据要素实现高效流通并充分发挥出价值,是解决数据跨域流通的最优解。
北电数智“红湖·可信数据空间”采用“数据沙箱”的理念,为政务、医疗等数据提供可信数据空间能力,并利用类似“逻辑数仓”等技术,对导入、修改和删除数据支持从概念验证到模型或应用开发调优,使数据在不离开企业的情况下实现利用;同时以隐私计算、区块链等技术和机制,通过加密计算,保证数据处理全过程的安全和隐私保护,从而打破政府、企业间的数据孤岛壁垒,实现数据融合,形成更加安全、开放、高效的数据交换生态系统;并依托全链路全周期安全可控,确保数据使用的可追溯性和透明度,从而解决数据的可信度、可控性、可用性和可审计能力难题。
正因此,北电数智不仅可为数交所、大数据局等政府端客户、资源型国企提供可信数据空间底座,确保数据要素在安全环境中有效接入、处理、托管及应用;还可为G端和B端客户提供高度安全的可信数据产品,助其实现数据存储、管理、处理、查询、决策支持、保护等功能。此外,北电数智还可为算力中心租户,在提供算力租赁的基础上,提供一站式的智算算力+智算云+可信数据开发的综合方案。
未来,北电数智将依托公司在芯片、算法大模型等领域的深厚积累,持续深耕可信数据空间领域,坚守数据安全底线,保障数据生产流通全过程安全可信,为AI生态圈企业提供全栈安全可信能力,为驱动AI可信未来构建出数据价值网络, 全力促进数据要素价值释放,让人工智能赋能千行百业,促进AI产业加速发展。
好文章,需要你的鼓励
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。
耶鲁、哥大等四校联合研发的RKEFino1模型,通过在Fino1基础上注入XBRL、CDM、MOF三大监管框架知识,显著提升了AI在数字监管报告任务中的表现。该模型在知识问答准确率提升超过一倍,数学推理能力从56.87%提升至70.69%,并在新颖的数值实体识别任务中展现良好潜力,为金融AI合规应用开辟新路径。
加州大学圣巴巴拉分校研究团队开发出能够自我进化的AI智能体,通过《卡坦岛拓荒者》桌游测试,这些AI能在游戏过程中自主修改策略和代码。实验显示,具备自我进化能力的AI显著超越静态版本,其中Claude 3.7模型性能提升达95%。研究验证了AI从被动工具向主动伙伴转变的可能性,为复杂决策场景中的AI应用开辟新路径。