云计算、大数据、3D打印、人工智能、虚拟现实等信息技术的兴起极大激发了数据要素的创新活力,数字化正全面重塑工业格局,作为数据基础设施的核心底座,存储系统对企业数据的保存、使用和挖掘起到了至关重要的作用。
深圳市杉岩数据技术有限公司(以下简称:杉岩数据)以新一代智能分布式存储技术为核心,致力于打造云计算、人工智能、物联网等领域的数据存储基石。其核心产品「产线质检数据智能存储平台」能够为多个生产线设备的图片/日志数据提供统一的采集、存储和管理能力,切实有效解决制造业企业产线海量质检数据存放难、检索慢、管理难、利用难等问题,帮助制造企业实现产线业务的降本增效。

随着数字化转型的深入,企业的 IT 系统建设也进一步加快,一方面带来了数据量的急剧增长,另一方面也提高了数据的访问频率,对存储系统的管理要求也进一步提高:
●数据体量大:大量机器设备的高频数据和互联网数据持续涌入,大型工业企业的数据集将达到PB级甚至EB级别;
●低时延:云平台和工厂生产设施的实时通信,海量传感器与人工智能平台的信息交互等都对时延有着极为苛刻的要求,甚至需达到20ms以内;
●高安全:为满足产品质量的追溯要求,质检图片往往需要保存2年以上,一旦个别硬盘损坏,数据无法恢复,存在安全风险。
鲲鹏平台天生的多核多并行能力,能够很好的满足数据量大、高安全和超低时延的要求;此外, 提供完善的鲲鹏开发套件DevKit以支撑应用的快速迁移、开发和调优。基于上述考虑,杉岩数据选择鲲鹏作为承载「产线质检数据智能存储平台」的数字底座,从而更好的保障业务性能和持续演进。

基于DevKit代码迁移工具实现杉岩智能存储管理平台快速迁移
在项目开始阶段,开发人员需要将软件平台快速迁移到鲲鹏。该系统主要由C语言开发,代码体量高达数十万,依赖文件较多,经分析采用手动迁移,整个系统预计需要10人天才能完成。而鲲鹏DevKit代码迁移能力可以实现依赖文件自动识别、兼容包一键下载、代码修改建议一键替换,无须耗时耗力检查跟进。在鲲鹏DevKit的帮助下整个系统只用了4人天,平均2人天/应用完成了迁移。

【鲲鹏DevKit代码迁移工具扫描获取迁移报告】
开发&编译:基于鲲鹏DevKit高效开发压缩解压缩模块,开发效率提升20%
迁移完成之后,开发团队计划在鲲鹏平台上新开发用于对象存储写场景的压缩解压缩模块,以便进行数据的存储和传输。由于原有X86平台的开发经验和兼容生态并不能直接复制到鲲鹏平台之上,开发人员在应用开发过程中也遇到了不少问题:对鲲鹏加速库的API不熟悉、不知道如何使用,不知道如何对现有程序进行针对鲲鹏处理器的加速优化等。
面对上述挑战,技术人员在开发过程中使用了鲲鹏DevKit提供的鲲鹏开发框架、通用计算SDK和GCC for openEuler进一步提升应用开发效率和性能。首先,通过鲲鹏开发框架快速创建通用计算应用工程,一键部署鲲鹏通用计算SDK快速引入鲲鹏硬件加速、鲲鹏加速库等能力,该应用基于ARM指令深度优化,为分布式存储压缩等应用场景提供高性能加速,并通过启发式编程智能提示和补全鲲鹏相关函数和编译选项,培养用户的开发习惯。经测试,在512K workload下,对象存储-RGW单节点写测试性能由1.49GB/s提升至1.79GB/s,性能提升20.13%。

【通过鲲鹏DevKit创建鲲鹏通用计算工程】

【通过鲲鹏DevKit实现开发效率提升】
此外,技术人员在编译过程中将之前的GCC 7.3更换为GCC for openEuler。GCC for openEuler提供了针对鲲鹏微架构芯片及指令优化,通过软硬协同相较GCC 7.3提供更强的性能,有效提升了编译效率,替换之后,存储产品在鲲鹏平台上的运行性能提升12%。
当前,杉岩产线质检数据智能存储解决方案已在高端制造、金融、党政、医疗、教育等10 余个重点行业实现大规模商用部署,累计服务客户1000+,总交付容量超过5500PB。作为鲲鹏计算产业生态重要伙伴,杉岩数据将联合深圳鲲鹏产业源头创新中心继续深耕软件定义存储领域,发挥国家级专精特新“小巨人”企业的示范引领作用,为国家数字经济高质量发展贡献新的力量!
鲲鹏DevKit也将围绕开发者体验持续升级能力,支持迁移扫描、鲲鹏亲和分析等插件快速接入企业现有开发流水线(如:Jenkins,CodeArts),不改变现有开发流程,开发者可以在流水线中快速扫描、修改、提交代码,更加便捷的发布鲲鹏版本。
【扫码登录鲲鹏社区DevKit专区,了解更多】

好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。