云计算、大数据、3D打印、人工智能、虚拟现实等信息技术的兴起极大激发了数据要素的创新活力,数字化正全面重塑工业格局,作为数据基础设施的核心底座,存储系统对企业数据的保存、使用和挖掘起到了至关重要的作用。
深圳市杉岩数据技术有限公司(以下简称:杉岩数据)以新一代智能分布式存储技术为核心,致力于打造云计算、人工智能、物联网等领域的数据存储基石。其核心产品「产线质检数据智能存储平台」能够为多个生产线设备的图片/日志数据提供统一的采集、存储和管理能力,切实有效解决制造业企业产线海量质检数据存放难、检索慢、管理难、利用难等问题,帮助制造企业实现产线业务的降本增效。
随着数字化转型的深入,企业的 IT 系统建设也进一步加快,一方面带来了数据量的急剧增长,另一方面也提高了数据的访问频率,对存储系统的管理要求也进一步提高:
●数据体量大:大量机器设备的高频数据和互联网数据持续涌入,大型工业企业的数据集将达到PB级甚至EB级别;
●低时延:云平台和工厂生产设施的实时通信,海量传感器与人工智能平台的信息交互等都对时延有着极为苛刻的要求,甚至需达到20ms以内;
●高安全:为满足产品质量的追溯要求,质检图片往往需要保存2年以上,一旦个别硬盘损坏,数据无法恢复,存在安全风险。
鲲鹏平台天生的多核多并行能力,能够很好的满足数据量大、高安全和超低时延的要求;此外, 提供完善的鲲鹏开发套件DevKit以支撑应用的快速迁移、开发和调优。基于上述考虑,杉岩数据选择鲲鹏作为承载「产线质检数据智能存储平台」的数字底座,从而更好的保障业务性能和持续演进。
基于DevKit代码迁移工具实现杉岩智能存储管理平台快速迁移
在项目开始阶段,开发人员需要将软件平台快速迁移到鲲鹏。该系统主要由C语言开发,代码体量高达数十万,依赖文件较多,经分析采用手动迁移,整个系统预计需要10人天才能完成。而鲲鹏DevKit代码迁移能力可以实现依赖文件自动识别、兼容包一键下载、代码修改建议一键替换,无须耗时耗力检查跟进。在鲲鹏DevKit的帮助下整个系统只用了4人天,平均2人天/应用完成了迁移。
【鲲鹏DevKit代码迁移工具扫描获取迁移报告】
开发&编译:基于鲲鹏DevKit高效开发压缩解压缩模块,开发效率提升20%
迁移完成之后,开发团队计划在鲲鹏平台上新开发用于对象存储写场景的压缩解压缩模块,以便进行数据的存储和传输。由于原有X86平台的开发经验和兼容生态并不能直接复制到鲲鹏平台之上,开发人员在应用开发过程中也遇到了不少问题:对鲲鹏加速库的API不熟悉、不知道如何使用,不知道如何对现有程序进行针对鲲鹏处理器的加速优化等。
面对上述挑战,技术人员在开发过程中使用了鲲鹏DevKit提供的鲲鹏开发框架、通用计算SDK和GCC for openEuler进一步提升应用开发效率和性能。首先,通过鲲鹏开发框架快速创建通用计算应用工程,一键部署鲲鹏通用计算SDK快速引入鲲鹏硬件加速、鲲鹏加速库等能力,该应用基于ARM指令深度优化,为分布式存储压缩等应用场景提供高性能加速,并通过启发式编程智能提示和补全鲲鹏相关函数和编译选项,培养用户的开发习惯。经测试,在512K workload下,对象存储-RGW单节点写测试性能由1.49GB/s提升至1.79GB/s,性能提升20.13%。
【通过鲲鹏DevKit创建鲲鹏通用计算工程】
【通过鲲鹏DevKit实现开发效率提升】
此外,技术人员在编译过程中将之前的GCC 7.3更换为GCC for openEuler。GCC for openEuler提供了针对鲲鹏微架构芯片及指令优化,通过软硬协同相较GCC 7.3提供更强的性能,有效提升了编译效率,替换之后,存储产品在鲲鹏平台上的运行性能提升12%。
当前,杉岩产线质检数据智能存储解决方案已在高端制造、金融、党政、医疗、教育等10 余个重点行业实现大规模商用部署,累计服务客户1000+,总交付容量超过5500PB。作为鲲鹏计算产业生态重要伙伴,杉岩数据将联合深圳鲲鹏产业源头创新中心继续深耕软件定义存储领域,发挥国家级专精特新“小巨人”企业的示范引领作用,为国家数字经济高质量发展贡献新的力量!
鲲鹏DevKit也将围绕开发者体验持续升级能力,支持迁移扫描、鲲鹏亲和分析等插件快速接入企业现有开发流水线(如:Jenkins,CodeArts),不改变现有开发流程,开发者可以在流水线中快速扫描、修改、提交代码,更加便捷的发布鲲鹏版本。
【扫码登录鲲鹏社区DevKit专区,了解更多】
好文章,需要你的鼓励
从浙江安吉的桌椅,到广东佛山的沙发床垫、河南洛阳的钢制家具,再到福建福州的竹藤制品,中国各大高度专业化的家具产业带,都在不约而同地探索各自的数字化出海路径。
哥伦比亚大学研究团队开发了MathBode动态诊断工具,通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷:几乎所有模型都表现出低通滤波特征和相位滞后现象,即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试,为AI模型选择和部署提供了新的评估维度。
研究人员正探索AI能否预测昏迷患者的医疗意愿,帮助医生做出生死决策。华盛顿大学研究员Ahmad正推进首个AI代理人试点项目,通过分析患者医疗数据预测其偏好。虽然准确率可达三分之二,但专家担心AI无法捕捉患者价值观的复杂性和动态变化。医生强调AI只能作为辅助工具,不应替代人类代理人,因为生死决策依赖具体情境且充满伦理挑战。
这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大,导致AI要么给出危险回答,要么过度拒绝正常请求。研究团队提出AdvChain方法,通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性,用1000个样本达到了传统方法15000个样本的效果,为AI安全训练开辟了新方向。