伴随着AI大模型风口崛起,人工智能技术的企业级应用百花齐放,成为当代商业效率升级的重要手段之一。然而对于很多企业来说,庞大的数据规模和算法研发门槛仍然如同天堑,行业期待数据与智能齐备的新型AI服务。

天云数据是国内鲜有的,能同时提供数据基础设施和数字原生全产业服务链的科技公司。秉承“数据+智能”的理念,致力于AI-Native数据库和人工智能软件的研发与创新,以推动企业向数字原生迈进,赋能产业数字化转型。
在第二届光合组织AI解决方案大赛上,天云数据的通用PaaS化AI建模平台产品——MaximAI,为企业AI能力建设交出新的答卷,并在众多参赛方案中脱颖而出,录入大赛获奖榜单。
“MaximAI是一个涵盖机器学习、研发、运营的一体化平台,我们可以用这个平台为企业提供全方位的AI赋能。”天云数据首席数据科学家吕慧介绍,MaximAI旨在突破 Hadoop/Spark 的使用瓶颈,进一步降低 AI 落地成本,实现 AI模型标准化、流程化、批量化生产,让每家企业都拥有开箱即用的AI能力。
基于用户的AI应用需求,MaximAI在场景实践中带来多重产品价值:比如平台利用分布式架构,支持进行海量数据的全量数据无偏建模,保证数据价值得到深度挖掘;不熟悉编程的普通业务人员也可操作建模,大幅降低建模人员门槛;通过拖拉拽的方式即可完成模型流水线化上线,避免不同团队之间的知识壁垒与矛盾,加速知识应用;支持对数据的统计分析和可视化探查等功能,实现建模流程可回溯,模型可复用等。
从企业的生产制造、供应链、营销与销售、交付与服务等价值链,每个环节都存在可利用 AI 改善的空间,而MaximAI可以在业务线上降本增效,满足了业务爆发的需求。更长远看,MaximAI 可提升模型性能、可扩展性、可解释性和准确度,还能优化资源配置,提升模型开发效率和业务敏捷度,这无疑实现了 AI 价值的最大化。
“要让AI走进千行百企并不简单。”天云数据数据库研发负责人乔旺龙表示,天云数据为客户提供的是一站式的建模流程,这要求平台不仅要在功能上做到横向的全覆盖,同时也要在行业领域上进行纵向的扩深。
在服务金融领域时,天云数据根据银行、券商等各类客户需求场景,在工程平台上一次性开发了几百个量化算子。接下来在服务其它客户时,这些积累的量化算子可以帮助天云数据快速切入到新用户的场景中,再次进行复用并释放价值。
在连接用户业务场景的过程中,软硬件之间的兼容问题也变得更加突出。尤其对于金融等信创领域,能否适配到性能可用的国产硬件底座,是AI迈向千行百业的关键。对于天云数据来说,海光为MaximAI的落地提供了很好的支撑。
“我们早在2017年就与海光开展了项目上的合作,并在2020年完成产品的兼容性适配。”吕慧指出,在兼容性以及设备性能方面,海光产品的友好度非常高。“比如服务器性能方面,根据前端技术人员的反馈,海光服务器性能比其它服务器起码提升了10%。”
值得一提的是,天云数据与海光进行产品认证时,还得到了多项软硬件资源的支撑以及技术支持,包括安排专人为天云数据提供技术答疑、专项资源对接等。“因为数据库对于硬件设备的要求非常高,有时候还需要再底层技术上做一些变动,这样才能在这个设备上运行的更好。所以海光对我们的支持非常重要。”吕慧表示。
目前,MaximAI已经可以支持云原生 AutoML、多算法框架的训练和发布、多国产芯片支持、云边一体的应用发布部署。天云数据业已为超过50+家五百强及上市公司提供服务,涉及金融、科技、石油、电力、生物医药等多个领域。“
作为第二届光合组织AI解决方案大赛奖项得主,非常感谢大赛为MaximAI提供了一个展示成果的舞台,同时也让天云数据与海光等生态伙伴的合作更加深入。”吕慧对接下来的赛事非常期待。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。