运营商作为落实国家大数据战略的排头兵,具有先天优势,包括数据安全性保障和基础算力资源保障,平台系统运维保障等,在发展大数据产业的服务商中是天然的一极。
联通大数据有限公司作为运营商大数据产业发展的领跑者,是中国联通全网数据商业运营的统一出口和合资合作平台,以中国联通“聚焦·创新·合作”战略为引领,秉承“创新改变世界、数据联通未来”的理念,加快推进数字资源整合和开放共享,保障数据安全,致力于成为值得信赖的数据智能服务运营商。
联通大数据的首席技术官、数据科学家宋雨伦博士,深耕数据科学应用研发领域多年,积极探索海量运营商数据在民生、政务、经济等领域的最佳实践。
宋雨伦博士指出,“聚数据,建平台,攻技术,定标准,促应用,成体系,兴产业”,是联通大数据业务发展的核心工作思路。中国联通在三大运营商中率先实现了全网数据的一点大集中,目前已在海量数据加工与处理,应用机器学习和深度学习算法进行数据建模,图数据库应用、人物关系图谱构建等技术领域沉淀了相关的技术能力。另外在平台架构层面,除了提供IaaS层(基础设施)服务、PaaS层(生产工具)服务、SaaS层(各类应用云化)服务外,还提供MaaS层(数据模型对外)服务和DaaS层(数据API接口和数据托管)服务。联通大数据不是要做数据的搬运工,而是通过对数据的开发和深度加工以及平台能力建设,为企业和政府提供更好的决策依据,从而更好地服务广大人民群众。
保障用户数据的隐私和安全是每一家数据公司的首要任务。联通大数据在企业价值观和经营理念上,始终把用户的信息安全放在第一位。确保数据在安全可控的范围内使用,从而提供持续、稳定、高效的大数据运营服务。同时,有严格的内控内审机制将用户数据进行加密、脱敏、隔离,工作人员不能直接触碰完整的个体用户数据,严格控制可追溯到个人或终端的数据授权和应用。联通大数据始终坚持“数据安全是生命线、安全事件零容忍、敏感数据不出门”的三大安全原则,建立践行科学的数据价值观,打造了覆盖数据全生命周期的大数据安全体系,实现了既定信息安全目标。
数据的本质是服务。宋雨伦博士表示,数据应该“来源于C端,服务于C端”,真正做到将数据“取之于民,用之于民”。互联网公司是通过直接服务C端获得收益,而联通大数据是通过服务B端和G端来间接服务C端客户,为社会、机构和政府提供数据决策支持,从而服于民生和百姓生活。
宋雨伦博士认为,在数据的开发和利用上,三大运营商之间并不存在互相竞争关系,而应该是一个合作共赢的关系,如果能增强三者之间的联系与合作,互相补充对外服务的业务能力,更充分释放运营商大数据的价值,承担起更多的社会责任和义务。
谈到大数据与人工智能的关系,宋雨伦博士说,大数据是人工智能的基础,人工智能是大数据的高级应用。人工智能目前刚刚起步,还是在向着唯一目标做优化,或策略优化在单点上实现突破。只有真正地将目标优化和策略优化有效地结合在一起时,人工智能才走向下一个阶段,才能更好地代替人进行识别和判断,做出有效的决策。目前,联通大数据正朝着目标优化和策略优化两个方向努力,推动人工智能产业向更高水平发展。
自联通2012年推动全国数据集中统一管理以来,经过几年的积淀和发展,联通大数据在数据集中、数据治理,平台建设、产品打磨、对外开放、商业化探索和服务运营等多个领域的实践经验,已处于行业领先水平。
好文章,需要你的鼓励
TAE Technologies在最新一轮投资中获1.5亿美元,累计融资约18亿美元。公司利用 AI 技术优化融合反应堆设计,目标于 2030 年代商业化发电,谷歌等巨头均参与合作。
这项来自首尔国立大学的研究提出了状态机推理(SMR)框架,解决了大型语言模型在信息检索中的过度思考问题。研究者将推理过程从冗长的令牌生成转变为离散动作(精炼、重排序、停止),使系统能够高效地在状态间转换。实验结果表明,SMR在BEIR和BRIGHT基准测试中显著提高了检索性能,同时减少了74.4%的计算资源消耗,证明其在不同语言模型和检索器中的通用性。这种结构化方法不仅解决了冗余轨迹和误导性推理问题,还为构建更高效的信息检索系统提供了新思路。
Nvidia 正在全球数据中心推广 AI 芯片,其最新 Blackwell 架构在 MLPerf 基准测试中获得最高性能,大幅加速下一代 AI 应用的训练与部署。
REASONING GYM是GitHub团队开发的一个突破性推理环境库,为强化学习模型提供可验证奖励。与传统固定数据集不同,它能生成无限训练数据并调整难度,涵盖代数、算术、认知、几何等100多个领域的数据生成器。研究显示,即使顶尖AI模型在复杂任务上表现也不佳,而专门针对推理训练的模型明显优于通用模型。更重要的是,在一个领域学习的技能可以意外地迁移到其他领域,这为提升AI推理能力提供了新路径。