当前,人工智能应用快速落地、多模态大模型加速迭代,亿万数据让计算需求无限迫近“天花板”。与此同时,计算需求倍数增长也带来了诸多难题。能耗问题日益凸显、高质量的训练数据集还需扩展、算力的高效融合与运维管理仍存挑战,行业迫切需要系统化的整体解决方案能力。
近日,中科可控发布新一代高融合一体化算力平台,兼顾用户算、存、管、用多个维度需求,给予用户“全屋定制”般的高质量计算基础设施部署体验。

高密算力高效调度 打造最佳能效比
中科可控一体化算力平台支持高密算力、高效调度,单节点最高支持256核心512线程的强大算力。依托高密设计,还可匹配不同高度机柜形态,实现多样化算力融合。面对大数据中心、高端计算及AI计算等多种场景,机柜可满足全精度计算需求,支持万亿级大模型训练!
依托多年绿色计算实践经验,中科可控新一代计算平台可覆盖风冷、风液混合、全液冷等全类节能形式,最大程度扩展机房可适配性,并提供专业漏液防护设计。全液冷环境下,制冷PUE低至1.09。加上独特的智能供电技术,整柜还可节能5%以上,真正实现高算力、低能耗,能效比拉满!

超大容量灵活配置 存算合力一机制胜
作为整机柜服务器,中科可控新一代计算平台还兼具强大的存储性能,可提供3.2P全闪存储空间,实现高达61万+IOPS 数据吞吐量,满足语料读取和大模型 Checkpoint需求。
在部署过程中,计算平台还可提供灵活的配置方案。存储方面,提供全闪、混闪等灵活的配套方案。依托分布式架构,还可快速扩展。计算方面,支持整机、半柜形式,一机在手,即可满足不同用户、不同阶段的个性化存算需求!

积木式模块化部署 加速无人运维时代到来
在计算中心建设过程中,部署运维同样是关键,与建设周期和成本息息相关。中科可控新一代计算平台采取自研“积木式”模块化方案,机柜级交付,部署时间节省高达80%。
此外,中科可控新一代计算平台可实现“全盲插”,同时“电、网、液“三总线设计让柜内0线缆,快速简化运维难度。在智能管理方面,精准U位识别技术,可快速定位故障机,智能双重漏液防控设计,让整机柜供电、供液更安全,加速无人化运维时代到来!
万亿算力、绿色部署、存算统筹、极简运维……中科可控期待以一体化算力平台全维能力,满足国家计算中心高质量建设需求,成为更多用户数智升级路上的优秀之选。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。