近日,由中国人民银行主管的《金融电子化》杂志社主办的“2023第十四届金融科技创新奖”评选结果揭晓。宏杉科技“万象分布式存储”凭借在金融科技领域的创新应用与实践荣获 “金融科技应用创新奖”。
本次评选旨在表彰2023年度在金融科技创新和业务发展方面取得突出成果的单位。此次获奖充分体现了专家评审们对宏杉科技在金融科技领域创新实力及实践成果的认可。
当下,金融机构数字化转型加速向深水区迈进,从局部突破走向全面开展,从通用领域走向细分环节,其中数字基础设施成为金融业数字化转型行稳致远的关键之锚。在数据层面,随着金融柜面无纸化、双录等各项数字化业务的推进,以图片、影像、音视频、日志等为主的非结构化数据呈爆发式增长态势。如何高效管理海量数据,构筑坚固的存储底座,保证业务安全稳定运行是金融机构面临的重要课题。宏杉科技深入金融行业应用场景,精准把脉用户痛点,能够提供完善的分布式存储产品及解决方案,凭借宏杉万象分布式存储去中心化的架构和高扩展、高性能、多平台融合等特性,助力解决海量非结构化数据“存管用”难题,保证金融上层业务的稳定性与安全性。
数据存储更海量,存储部署更易扩展
万象分布式存储采用分布式去中心化架构,元数据配置更加灵活,具备支持上万个节点的扩展能力。在元数据架构上,宏杉科技采用了先进的元数据集群架构,通过宏杉自研的元数据分部算法,消除了单Master的瓶颈以及Hash算法的规模限制,在实现全对称部署的前提下极大提升了存储规模。因此,相较传统集中式存储存在扩展瓶颈,万象分布式存储具备灵活扩展特性,更适合承载金融行业持续以指数型增长的非结构化数据。
性能卓越,数据高效管理
基于去中心化的架构,万象分布式存储系统容量可扩展到EB级别,扩容后可立即获得更高的聚合性能和更大的容量,具备数百GB的带宽。同时,通过前端切片、小文件聚合、缓存优化等技术,万象分布式存储在大文件和小文件环境下均能提供强大的性能支持,可充分满足金融业务瞬时高并发访问需求。此外,万象分布式存储采用扁平化的数据架构,通过元数据快速检索而非层级展开即可获取所需数据,极大地提升了金融用户在海量数据中调取所需信息的效率。
多平台融合,数据管理便捷安全
基于自研的增强型协议,万象分布式存储支持CIFS、NFS、FTP、S3等多种协议灵活转换,实现所有非结构化数据协议互通,共享同一份数据,数据0迁移拷贝,帮助金融用户业务轻松接入存储系统,极大地提高了访问效率。此外,万象分布式存储基于系统内部客户端和用户的精细化访问控制机制,支持多副本和目录级纠删码、双活、复制、两地三中心等多种冗余保护措施,为用户提供多层级的数据保护和容灾功能,为用户数据安全保驾护航。
目前,宏杉科技万象分布式存储已在中国农业发展银行、秦皇岛银行、中信建投证券、中国太平保险等知名金融机构应用。随着数字化变革的深入,宏杉科技将持续秉持自主研发与技术创新的理念,打造更多满足未来发展的金融行业解决方案,助力更多金融机构数字化革新。
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。