在今天举办的中国闪存联盟第七季暨闪存联盟2.0发布盛典上,中信银行数据中心副总经理班孝明根据自己在银行数据中心20多年的工作经验,谈到了今天的银行业需要什么样的架构师,其观点非常接地气。这里ZD至顶网记者忍不住想把班孝明的观点分享给大家。
首先简单阐述一下ZD至顶网记者对于架构师的理解。这里的架构师是基于IT系统能够完整的勾画出一个可以进化的适合本企业或者本行业的“设计师”,架构师可以是CEO/CTO/CIO等高级管理层,也可以是具体的IT管理者。其具有对行业特点趋势洞察,对IT专业领域熟知、有过完整的项目实施以及正确的人文情怀等要素。
班孝明的观点是,包括银行业在内的数据中心目前需要新兴技术的架构规划与设计方面的特定技术架构师:即需要技术管理上的硬能力,又要具备一定的软能力。
目前中信银行数据中心把架构师的需求分为三类:基础结构架构师、特定技术架构师、解决方案架构师。为什么这么分?班孝明认为这样是目前包括中信银行在内的银行业数据中心面临的一大痛点,就是银行数据中心的IT服务人员是不断有很少的成员逐渐增加起来的。数据中心人员的结构、技术组合的过程、包括知识的储备比较单一的。而一个好的架构师是需要一个“T”字性人才,即需要广泛的业务知识,有需要专业的技术理论。一个包含方方面面专长所有的IT架构师目前比较稀少。
现在中信银行数据中心就是这三组架构师构成。
规划和设计基础性的、公共的、可复用的框架和组件,建立一个基础的平台。供实施遵循依据和使用工具。
规划设计某种专享技术架构规划与设计
把产品、技术和理论进行有力的组合,创造出用户需求的选择。
而更专业的企业级架构更是需要银行内的专家与专业的IT提供商以及集成方案商来共同讨论实施。
班孝明观点是:目前银行业需要一个复合型人才的架构师。
具体来说银行数据中心急需怎么样的架构师?现在银行面临着新兴科技企业的冲击,对于银行的昨天来说也是靠着技术发展起来的,那么今天技术冲击着现行的业务和经营模式。同时也在改变和影响银行业的未来,掌握一种新技术、适应一种新技术,就能够未来竞争中取得一席之地。银行数据中心建设也面临着科技转型。包括技术转型已经成为企业战略的重要先行力。
所以需要具备大数据、物联网、超融合、软件定义、区块链等都是为了科技转型的方向。这方面的架构师具备新兴技术的能力,对于企业来说更是急迫需求和缺乏的。同时在市场上这样的架构师确实也稀缺。(好的架构师都在BAT等互联网企业)。
从企业来讲需要新型的各种技能的架构师。同时银行数据中心的特殊性,对于监管和业务创新等需求比如像系统的双活、多活、灾备、业务连续性保证等基础性的架构师也是需求迫切。也是重点考虑方向。
班孝明观点:架构师是未来企业的真正发展的一个助推力。同时这个市场需要大家共同开发。这也是此次闪存联盟的重点。2016年10月以来,闪存联盟已累计举办8次培训活动,逾500位架构师参加培训,实质性地推动了本土架构师的专业能力提升、行业趋势研讨及其业务经验的共享。今后,闪存联盟2.0时代将结合闪存市场对于混合云、数据认知方面的最新应用热点与技术趋势,通过“百强架构师”系列课程,设置更多关于软件定义存储、高性能计算、虚拟化、数据备份等方面的架构师培训。
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。