运营商作为落实国家大数据战略的排头兵,具有先天优势,包括数据安全性保障和基础算力资源保障,平台系统运维保障等,在发展大数据产业的服务商中是天然的一极。
联通大数据有限公司作为运营商大数据产业发展的领跑者,是中国联通全网数据商业运营的统一出口和合资合作平台,以中国联通“聚焦·创新·合作”战略为引领,秉承“创新改变世界、数据联通未来”的理念,加快推进数字资源整合和开放共享,保障数据安全,致力于成为值得信赖的数据智能服务运营商。
联通大数据的首席技术官、数据科学家宋雨伦博士,深耕数据科学应用研发领域多年,积极探索海量运营商数据在民生、政务、经济等领域的最佳实践。
宋雨伦博士指出,“聚数据,建平台,攻技术,定标准,促应用,成体系,兴产业”,是联通大数据业务发展的核心工作思路。中国联通在三大运营商中率先实现了全网数据的一点大集中,目前已在海量数据加工与处理,应用机器学习和深度学习算法进行数据建模,图数据库应用、人物关系图谱构建等技术领域沉淀了相关的技术能力。另外在平台架构层面,除了提供IaaS层(基础设施)服务、PaaS层(生产工具)服务、SaaS层(各类应用云化)服务外,还提供MaaS层(数据模型对外)服务和DaaS层(数据API接口和数据托管)服务。联通大数据不是要做数据的搬运工,而是通过对数据的开发和深度加工以及平台能力建设,为企业和政府提供更好的决策依据,从而更好地服务广大人民群众。
保障用户数据的隐私和安全是每一家数据公司的首要任务。联通大数据在企业价值观和经营理念上,始终把用户的信息安全放在第一位。确保数据在安全可控的范围内使用,从而提供持续、稳定、高效的大数据运营服务。同时,有严格的内控内审机制将用户数据进行加密、脱敏、隔离,工作人员不能直接触碰完整的个体用户数据,严格控制可追溯到个人或终端的数据授权和应用。联通大数据始终坚持“数据安全是生命线、安全事件零容忍、敏感数据不出门”的三大安全原则,建立践行科学的数据价值观,打造了覆盖数据全生命周期的大数据安全体系,实现了既定信息安全目标。
数据的本质是服务。宋雨伦博士表示,数据应该“来源于C端,服务于C端”,真正做到将数据“取之于民,用之于民”。互联网公司是通过直接服务C端获得收益,而联通大数据是通过服务B端和G端来间接服务C端客户,为社会、机构和政府提供数据决策支持,从而服于民生和百姓生活。
宋雨伦博士认为,在数据的开发和利用上,三大运营商之间并不存在互相竞争关系,而应该是一个合作共赢的关系,如果能增强三者之间的联系与合作,互相补充对外服务的业务能力,更充分释放运营商大数据的价值,承担起更多的社会责任和义务。
谈到大数据与人工智能的关系,宋雨伦博士说,大数据是人工智能的基础,人工智能是大数据的高级应用。人工智能目前刚刚起步,还是在向着唯一目标做优化,或策略优化在单点上实现突破。只有真正地将目标优化和策略优化有效地结合在一起时,人工智能才走向下一个阶段,才能更好地代替人进行识别和判断,做出有效的决策。目前,联通大数据正朝着目标优化和策略优化两个方向努力,推动人工智能产业向更高水平发展。
自联通2012年推动全国数据集中统一管理以来,经过几年的积淀和发展,联通大数据在数据集中、数据治理,平台建设、产品打磨、对外开放、商业化探索和服务运营等多个领域的实践经验,已处于行业领先水平。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。