今天,数据空前地增长和扩张,并在复杂多变的生态系统(包括多云和边缘)中以各种方式流动。数据位置的复杂性加剧了企业数据管理的挑战。如何更加有效地管理和利用数据,最大化提取其价值,成为摆在各个企业面前的难题。
为此,希捷赞助, IDC对全球1500名企业高管进行了调研,并发布《数据新视界:从边缘到云,激活更多业务数据》报告,提出企业面临的数据管理挑战,并探讨其解决方案。
那么,这份报告对于希捷有何指导意义?希捷会针对报告的结论推出哪些创新的解决方案?以及面对中国等新兴市场,希捷的应对策略如何?就此至顶网对希捷中国团队进行了书面采访。
要把数据运营提到战略位置
《数据新视界》调研认为随着数据管理挑战的提升,应该把数据运营(DataOps)作为应对数据管理挑战的解决方案,通过将数据创建者和数据使用者联系起来,打破应用数据的壁垒,激活更多业务数据。
希捷认为将数据投入使用的五大阻力来自: 1) 将采集的数据变为可用;2) 已采集数据的存储管理;3) 确保需要的数据得到采集;4) 确保采集数据的安全;5) 将采集的数据孤岛变为可用。从上面的五个利用数据的障碍来看,其实质还是——有效进行数据运营,从而挖掘数据真正的价值。
要进行有效的数据运营,首先企业要有全局性的标准、架构、数据管理政策;其次企业对自身的数据要有清晰的认识,包括数据访问权限、数据分类、存储存储位置、分析后数据的走向等等;第三,对于数据治理及流程做出决策后,企业要通过全局性的团队以相同的方式访问相同的分析工具,彻底打破数据孤岛。
希捷同时还建议将数据运营与其他数据管理解决方案结合使用,以获得在提高客户忠诚度、营收、利润等方面的更大改善。
报告有助于推动希捷产品和技术创新
首先,对于企业来讲,通过《数据新视界》报告,可以寻找应对数据管理挑战的解决方案,帮助企业通过有效的数据管理,最大限度激活其业务数据,从而获取更多的数据价值。
对于希捷,这份报告同样具有重要意义。基于《数据新视界》调研的一些重要结论:例如,两年后从边缘传输到核心的数据将从今天的36%增长到57%;管理多云和混合云中的数据是最大的数据管理挑战;企业将管理更多动态数据等等,希捷可以不断审视自己的产品结构,根据数据发展的新趋势,调整产品组合,提供更适应需求的数据服务,助力企业更有效地管理数据;同时,存储创新也会直接影响数据价值。希捷将一如既往地在容量(提升规模效益)、带宽(促进存储、网络和计算功能间的数据流动)、数据安全(构建更安全的网络和计算)和数据流动架构(将硬件加速和卸载推进到存储或网络层)方面持续投入进行研发创新,为用户提供行业领先的产品,助力他们不断提升数据利用率。
具体来说,希捷科技继续通过HAMR技术来不断提升磁盘的面密度从而提升容量;在容量提升的情况下,应用双磁臂(MACH.2)技术,实现磁盘性能加倍;借助基于Seagate Secure的安全系统来确保存储系统数据安全;在数据迁移方面,Lyve Drive移动系统能够有效地实现在企业、云和边缘间高效移动数据;Lyve数据服务还能实现磁带迁移、云备份、数据管理和数据传输,为数据保驾护航。
中国市场显示了强大活力
报告指出,中国区在数据分析和云迁移方面全球领先。这背后的原因一方面是IoT、边缘计算、边缘数据中心、AI等新技术以及新领域的发展导致数据激增;同时也表明中国企业的数据管理能力正在快速提高,并且已经认识到数据运营的带来的价值。
中国区云服务商提供的公有云Iaas资源日渐普及,也推动了数据向云端迁移。云迁移说明中国市场已经做好了采用云的准备。
同时中国已经开始实施新基建项目,以促进数字经济的发展。在与技术结合之后,新基建将为企业数据管理带来新的商机。
而希捷也已经组建了专门针对上述新兴市场的IT4.0团队,与垂直行业一起研究其数据的独特性、发展趋势等,并有针对性地进行研发,提供真正符合垂直行业需求的数据存储和管理解决方案。
比如非结构化数据带来很多管理难题,边缘的重要性更为凸显,希捷会根据客户的需求,为他们提供定制化的边缘存储解决方案,解决他们面临的数据管理难题,更快速有效地在边缘端处理关键任务数据。
针对云计算与数据中心,希捷一直以来提供最可靠、总体拥有成本低、容量大、扩展灵活的数据存储解决方案,为云计算和数据中心日益增长的海量数据提供存储解决方案。
新技术发展如火如荼,对数据的认识在不断深化。在中国,随着新基建项目不断上马,我们将看到数据运营在不断变化的商业环境中发挥更多的作用,助力企业更好地利用数据,挖掘数据的价值,进而获取更好的业绩;同时我们也将看到类似希捷这样的创新科技企业不断顺应市场和行业的发展趋势,提供真正符合需求的技术和产品,在新的经济环境中获取更大的发展。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。