近日,在2024全球数字经济大会举办的“数据要素高层论坛”上,北京电子数智科技有限责任公司(以下简称“北电数智”)AI可信负责人马世韬受邀出席,并发表《以北电数智AI可信探索,看数据要素的核心要义》的主题演讲,正式对外发布北电数智 “红湖·可信数据空间”,标志着北电数智在人工智能领域先进理念的应用和解决方案的实践。
北电数智AI可信负责人马世韬作主题演讲
据IDC测算,2022-2027年中国数据量规模将由23.88ZB增长至76.6ZB,复合增速达26.3%。然而相较于全球,中国数据开源和市场流通较差、数据挖掘和治理能力滞后,优质的中文数据集依然稀缺,大量非结构化数据无法被算法模型训练所使用。如何能够应用高质量数据集已成为制约人工智能技术发展的关键瓶颈。为数据流转应用创造互信共享环境,已成为当前促进大模型落地和AI产业发展的关键。结合对这一问题的思考,北电数智AI可信负责人马世韬提出“可信数据空间是找到跨域多主体数据流转最优解”的观点,并结合北电数智在此方面的实践成果在论坛演讲中进行了详细的介绍。
当前,国内数据价值挖掘存在“数据供不出”“数据流不动”“数据用不好”“数据风险大”等难题,需要通过建设新型基础设施来解决数据价值挖掘中的痛点。可信数据空间,是人工智能浪潮下利用标准、技术以及广泛接受的数据治理模型来促进数据安全交换、共享流通的基础设施,可保障数据要素能够在安全可信的环境中汇聚、共享、开放和应用,助力数据要素实现高效流通并充分发挥出价值,是解决数据跨域流通的最优解。
北电数智“红湖·可信数据空间”采用“数据沙箱”的理念,为政务、医疗等数据提供可信数据空间能力,并利用类似“逻辑数仓”等技术,对导入、修改和删除数据支持从概念验证到模型或应用开发调优,使数据在不离开企业的情况下实现利用;同时以隐私计算、区块链等技术和机制,通过加密计算,保证数据处理全过程的安全和隐私保护,从而打破政府、企业间的数据孤岛壁垒,实现数据融合,形成更加安全、开放、高效的数据交换生态系统;并依托全链路全周期安全可控,确保数据使用的可追溯性和透明度,从而解决数据的可信度、可控性、可用性和可审计能力难题。
正因此,北电数智不仅可为数交所、大数据局等政府端客户、资源型国企提供可信数据空间底座,确保数据要素在安全环境中有效接入、处理、托管及应用;还可为G端和B端客户提供高度安全的可信数据产品,助其实现数据存储、管理、处理、查询、决策支持、保护等功能。此外,北电数智还可为算力中心租户,在提供算力租赁的基础上,提供一站式的智算算力+智算云+可信数据开发的综合方案。
未来,北电数智将依托公司在芯片、算法大模型等领域的深厚积累,持续深耕可信数据空间领域,坚守数据安全底线,保障数据生产流通全过程安全可信,为AI生态圈企业提供全栈安全可信能力,为驱动AI可信未来构建出数据价值网络, 全力促进数据要素价值释放,让人工智能赋能千行百业,促进AI产业加速发展。
好文章,需要你的鼓励
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。