云计算、大数据、3D打印、人工智能、虚拟现实等信息技术的兴起极大激发了数据要素的创新活力,数字化正全面重塑工业格局,作为数据基础设施的核心底座,存储系统对企业数据的保存、使用和挖掘起到了至关重要的作用。
深圳市杉岩数据技术有限公司(以下简称:杉岩数据)以新一代智能分布式存储技术为核心,致力于打造云计算、人工智能、物联网等领域的数据存储基石。其核心产品「产线质检数据智能存储平台」能够为多个生产线设备的图片/日志数据提供统一的采集、存储和管理能力,切实有效解决制造业企业产线海量质检数据存放难、检索慢、管理难、利用难等问题,帮助制造企业实现产线业务的降本增效。
随着数字化转型的深入,企业的 IT 系统建设也进一步加快,一方面带来了数据量的急剧增长,另一方面也提高了数据的访问频率,对存储系统的管理要求也进一步提高:
●数据体量大:大量机器设备的高频数据和互联网数据持续涌入,大型工业企业的数据集将达到PB级甚至EB级别;
●低时延:云平台和工厂生产设施的实时通信,海量传感器与人工智能平台的信息交互等都对时延有着极为苛刻的要求,甚至需达到20ms以内;
●高安全:为满足产品质量的追溯要求,质检图片往往需要保存2年以上,一旦个别硬盘损坏,数据无法恢复,存在安全风险。
鲲鹏平台天生的多核多并行能力,能够很好的满足数据量大、高安全和超低时延的要求;此外, 提供完善的鲲鹏开发套件DevKit以支撑应用的快速迁移、开发和调优。基于上述考虑,杉岩数据选择鲲鹏作为承载「产线质检数据智能存储平台」的数字底座,从而更好的保障业务性能和持续演进。
基于DevKit代码迁移工具实现杉岩智能存储管理平台快速迁移
在项目开始阶段,开发人员需要将软件平台快速迁移到鲲鹏。该系统主要由C语言开发,代码体量高达数十万,依赖文件较多,经分析采用手动迁移,整个系统预计需要10人天才能完成。而鲲鹏DevKit代码迁移能力可以实现依赖文件自动识别、兼容包一键下载、代码修改建议一键替换,无须耗时耗力检查跟进。在鲲鹏DevKit的帮助下整个系统只用了4人天,平均2人天/应用完成了迁移。
【鲲鹏DevKit代码迁移工具扫描获取迁移报告】
开发&编译:基于鲲鹏DevKit高效开发压缩解压缩模块,开发效率提升20%
迁移完成之后,开发团队计划在鲲鹏平台上新开发用于对象存储写场景的压缩解压缩模块,以便进行数据的存储和传输。由于原有X86平台的开发经验和兼容生态并不能直接复制到鲲鹏平台之上,开发人员在应用开发过程中也遇到了不少问题:对鲲鹏加速库的API不熟悉、不知道如何使用,不知道如何对现有程序进行针对鲲鹏处理器的加速优化等。
面对上述挑战,技术人员在开发过程中使用了鲲鹏DevKit提供的鲲鹏开发框架、通用计算SDK和GCC for openEuler进一步提升应用开发效率和性能。首先,通过鲲鹏开发框架快速创建通用计算应用工程,一键部署鲲鹏通用计算SDK快速引入鲲鹏硬件加速、鲲鹏加速库等能力,该应用基于ARM指令深度优化,为分布式存储压缩等应用场景提供高性能加速,并通过启发式编程智能提示和补全鲲鹏相关函数和编译选项,培养用户的开发习惯。经测试,在512K workload下,对象存储-RGW单节点写测试性能由1.49GB/s提升至1.79GB/s,性能提升20.13%。
【通过鲲鹏DevKit创建鲲鹏通用计算工程】
【通过鲲鹏DevKit实现开发效率提升】
此外,技术人员在编译过程中将之前的GCC 7.3更换为GCC for openEuler。GCC for openEuler提供了针对鲲鹏微架构芯片及指令优化,通过软硬协同相较GCC 7.3提供更强的性能,有效提升了编译效率,替换之后,存储产品在鲲鹏平台上的运行性能提升12%。
当前,杉岩产线质检数据智能存储解决方案已在高端制造、金融、党政、医疗、教育等10 余个重点行业实现大规模商用部署,累计服务客户1000+,总交付容量超过5500PB。作为鲲鹏计算产业生态重要伙伴,杉岩数据将联合深圳鲲鹏产业源头创新中心继续深耕软件定义存储领域,发挥国家级专精特新“小巨人”企业的示范引领作用,为国家数字经济高质量发展贡献新的力量!
鲲鹏DevKit也将围绕开发者体验持续升级能力,支持迁移扫描、鲲鹏亲和分析等插件快速接入企业现有开发流水线(如:Jenkins,CodeArts),不改变现有开发流程,开发者可以在流水线中快速扫描、修改、提交代码,更加便捷的发布鲲鹏版本。
【扫码登录鲲鹏社区DevKit专区,了解更多】
好文章,需要你的鼓励
OpenAI意外发现规模假说:Dota 2项目中计算资源翻倍带来AI表现翻倍,彻底改变行业轨迹。Greg Brockman揭秘GPT-3产品化困境:"我们不知道谁会为API付费",最终市场自己找到了出路。AI医疗突破只需超越WebMD,个性化咨询正在重塑多个领域。
耶鲁大学研究团队开发了SCIVER评估工具,专门测试AI验证科学论文声明的能力。通过3000个专家标注例子的测试,发现即使最先进的AI模型在复杂科学推理任务上仍远不如人类专家,主要存在信息检索不全、图表误读和逻辑推理断裂等问题,为AI科研应用发展指明了改进方向。
存储行业近期动态频繁,Arctera、Wasabi和TD SYNNEX联合推出渠道专属数据保护解决方案;AWS启用EC2环境SAN启动功能;Broadcom发布VMware Cloud Foundation 9.0版本;Commvault与Kyndryl合作提升网络弹性服务;CTERA成为首家支持模型上下文协议的混合云存储供应商;多家企业获得新一轮融资,推动AI基础设施和数据管理技术发展。
马里兰大学团队开发出PrefBERT智能评价系统,解决了AI在开放性写作任务中缺乏有效质量评判标准的问题。该系统通过学习人类专家评分标准,能准确评判文章质量,显著提升AI生成内容的质量和人类偏好一致性,为AI训练提供了新的质量导向解决方案。