任正非在《经济学人》署名文章中谈到信息智能时代,数据基础设施的重要性。也为未来二三十年华为的战略重心画了个方向。
在不久前参加全球数据基础设施峰会,笔者听到招商银行信息技术部总经理周天虹分享,真正感受到了夯实数据基础设施,是数字化银行发展的基石。特别是AI的应用更直观的了解到基础设施的重要性。由此可以预见的是,在新的智能时代,数据基础设施需要先行进行爆炸式创新。
大家知不知道2019年刚刚过去的双十一,哪家银行信用卡交易额最高?不错就是招商银行,招商银行是获得中国最佳零售银行的称号的。但是招商银行的网点数不到一些大行的十分之一。取得的成绩,背后就是招商银行基于科技敏捷带动业务敏捷的战略。
今天大家都在谈金融科技时代,招商银行在2017年就实施了数据基础设施战略,打造贴近市场,紧紧围绕客户需求的快速交付产品的敏捷性的银行。
招商银行APP、掌上生活APP是招商银行零售金融数字化体系里面的两大APP,可以说是能够满足用户的普通金融需求。同时这两款APP累计用户数正在以42%的年增长率在增加,同时这两款APP要承担92%的客户流量。这么大的流量对于数据基础设施的需求不言而喻。
你想一想,在这两款APP上,近2000个客户画像标签,每天近40亿的客户触达,同时要毫秒级的时间做出风控判断。这背后的数据基础设施不仅需要满足海量数据的存储需求,而且这个基础设施要满足超级机器学习、计算机视觉、知识图谱和自然语言处理等AI平台的落地。对数据处理和数据传输也需要更高的要求。
这么我看来,数据基础设施到了必须爆炸式创新的地步。比如,大数据云化之后,计算、存储是融合还是分离,自动化部署能力如何?虚拟数据如何实现即统一又自助的服务?新的数据基础设施能满足AI和BI的高效、实时处理?
在满足了各种业务的同时,高可靠、高性能、高扩展、开放性、简单运维、高安全这些必要因素更是一个都不能少。
那么数据基础设施架构要如何创新,招商银行根据自身的业务发展给出了演讲展望。
首先这个架构核心是敏捷性,面向AI时代,创新时代,唯快不破。敏捷性的基础设施是AI应用爆炸式增长的基础。其次是要云化。这个架构要提供云服务和微服务的方式来应对未来应用。第三,还要具备平台化需求,这样可以依托平台来支持应用的共性诉求。最后还要具备开放性,金融服务场景互联在结合生态互联定能释放更大的能量。
这个展望我认为很具有代表性,至少是金融领域在未来很长时间的一个真实迫切的需求。相关的数据技术服务商可以参考并考虑如何满足客户的需求还进行数据基础设施的创新。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。