日立集团 (TSE: 6501) 旗下提供数字基础架构、数据管理与分析及数字解决方案的子公司 Hitachi Vantara 宣布推出 Lumada DataOps 产品组合的新功能,为所有企业级客户提供自动化和 AI 驱动的数据运维;同时还宣布推出 Lumada 工业数据运维 (Lumada Industrial DataOps),为工业用例提供高级分析功能。
随着越来越多数据跨越数据中心、边缘、混合云和公有云基础架构分布,企业正面临着更加棘手的数据蔓延和数据治理问题,其带来的复杂性进一步阻碍企业将数据转化为业务价值。国际知名 IT 研究和咨询机构 451 Research 近期发布的一项数据运维调查问卷 (DataOps Survey) 指出,数据隐私、合规性以及数据访问与准备已成为数据驱动型企业组织的首要任务。
Lumada DataOps 产品组合的扩展,使企业能够创建一个由增强的数据目录治理的无缝数据经纬 (Data Fabric),以实现自动化数据质量改进和治理水平提升。借助由 Pentaho 驱动的 Lumada 数据集成 (Lumada Data Integration) 更新,客户能够缩短跨多个数据源和地点挖掘、访问、准备和混合数据的时间,并简化这些操作。此外,全新的 Lumada 工业数据运维产品组合包括适用于工业环境的物联网分析模型,该模型能无缝整合 IT 和 OT 数据,提供业务洞察,加速企业变革。
Hitachi Vantara 首席产品官 Radhika Krishnan 表示:“传统的数据管理解决方案往往将客户限制在专有的技术中。有别于此,Lumada DataOps 和 Lumada Industrial DataOps 产品组合面向所有开放生态系统进行增强,使得客户能够有效地管理和治理来源于各处的数据。无论客户的数据置于何处,Hitachi Vantara 都能通过 Lumada DataOps 产品组合搭配数据和分析咨询服务,帮助他们发现、分析和治理数据,并从中盈利;同时,Hitachi Vantara 还帮助客户提高数据洞察能力,推动业务发展。”
从边缘到多云数据经纬的智能数据运维
Lumada DataOps 产品组合支持企业在单一智能平台上完成自动化收集、整合、治理和分析数据等日常任务,为所有企业数据提供开放、可组合的基础;同时也允许企业自主选择工具和分析,并通过自服务的方式访问数据。此次 Lumada DataOps 产品组合的更新包括:
· 数据目录 (Data Catalog) – Lumada Data Catalog 更新至 v7.0,采用基于 Io-Tahoe 技术的可信数据,进一步为企业获取洞察提速。Io-Tahoe 技术包括一个全新的功能强大的用户界面、数据质量以及与 Collibra 的连接。
· 数据集成 (Data Integration) – Pentaho 更新至 v9.3,通过灵活的云部署和适用于Snowflake、MongoDB Atlas、Teradata、Elastic Search 7.x和 IBM MQ 9.2 等云数据存储服务的新连接器,整合混合云中的数据。
IT 与 OT 数据融合促进数字化工业运维
Hitachi Vantara 发布的全新 Lumada 工业数据运维 (Lumada Industrial DataOps) 产品组合帮助企业生成实时洞察,加速成果产出,使关键运维更加可预测、可管理。该产品组合通过为分析解决方案构建从边缘到多云的数据经纬,加速 IT 和 OT 数据的融合。Lumada 工业数据运维组合提供的工业物联网软件可以在 OT 和 IT 资源间自动完成数据管道交付,为预测性维护和运营优化提供工业 AI 和 ML模型。新的 Lumada 工业数据运维产品组合包括以下功能:
· 工业物联网核心 (IloT Core) – 通过完整的工业物联网数据平台,其中包括数字核心、网关、数字孪生 (Digital Twin) 和机器学习服务,加速并扩展运营应用程序的部署。
· 工业物联网分析 (IIoT Analytics) – 通过工具包简化 AI 和 ML 解决方案的创建,同时通过打包好的数字孪生和预训练的 ML 模型简化工具包的交付。
拥有了过滤后的、准确的数据,企业便可以利用数字孪生和 AI/ML 模型等高级运营分析功能,来预测和制定运营决策。
选择 Lumada 工业物联网解决方案的核心客户之一便是迪士尼乐园和度假区。Hitachi Vantara 是美国佛罗里达州奥兰多华特·迪士尼世界度假区和加州迪士尼乐园度假区的官方游乐和表演分析供应商。
迪士尼设计与工程技术分析业务总监 Michael Tschanz 表示:“为维护复杂的游乐设施,我们不断地从整个游乐项目的多个接触点捕捉并摄取数据,努力优化各项设施的运行效率,并继续维持尽可能无缝的游玩体验。我认为,我们与 Hitachi Vantara 今年合作的最酷的一个项目便是联手开发的数字孪生分析技术。过去,景点内某些区域无法放置传感器,导致数据收集不畅;如今借助数字孪生仿真技术,我们解决了在特定区域开展分析的困境,这一创新将使得分析的准确性达到更高水平。”
欢迎大家在北京时间 2022 年 3 月 25 日下午 13:00 注册并参与 Hitachi Vantara 线上研讨会 —— 为数字化创新优化数据经纬
客户证言
· 国际金融科技公司 MarketAxess 信用风险分析经理 Dale Bloom 表示:“Pentaho 提供的数据集成功能在处理多样性的数据集和提供数据驱动的洞察方面发挥了显著作用,帮助我们公司做出有效的、跨职能的决策。新的数据存储集成功能使得我们能够灵活连接更多数据,轻松识别并建立控制,解决数据流中断问题,同时在混合环境中实现无缝部署,更好地服务于业务发展。”
· 英国跨国能源和服务公司森特理克 (Centrica Plc) 全球数据主管 Eddie Edwards 表示:“Centrica 为数百万住宅和商业客户提供全方位的能源服务和产品,并延伸至相关保险、维修服务和智慧能源管理解决方案。Centrica 集团下属每个品牌均高度关注客户,我们基于准确的数据来推动能源的可持续发展与持续创新,并帮助社区有效利用能源。缩短从数据中获取洞察并加以利用的时间,有助于我们不断改善客户体验,同时加速实现我们制定的零碳能源目标。借助 Lumada 数据目录,我们能够在混合数据经纬中实现完全自动化数据发现,并确保有效满足监管部门的合规要求。作为一家客户信赖的能源供应商,与 Hitachi Vantara 合作加强我们对数据隐私的控制,有助于我们实现对客户的承诺,并能够降低运营风险。”
· Hitachi Vantara 在英国的创新技术经销商 Ethos Technology 首席执行官 Omar Galbraith 表示:“我们的合作伙伴正在寻求提供更多的数据管理解决方案和服务,以更快地实现业务的敏捷性提升和能够从数据中获取价值这两个目标,同时大幅降低总体拥有成本。在 Lumada DataOps 产品组合的支持下,我们能够更有底气地与合作伙伴展开对话,帮助他们迁移到跨混合云的环境中,提供数据管理自动化服务,以便他们加快数据的应用、治理、保护、服务和在其客户中的数据消费。我们的合作伙伴现在可以摈弃传统的一次性产品交易供应模式,转而建立一套增值管理服务组合。”
· 领先的市场研究和咨询服务公司 Ventana Research 高级副总裁兼研究总监 Dave Menninger 表示:“各类企业组织都迅速意识到了数据战略的价值,一项成功的数据战略能够从客户、运营和实时边缘环境中挖掘整个组织的全部资源。Hitachi Vantara 提供的 Lumada 解决方案能够帮助企业发现、分析数据,并向正确的利益相关方分发数据,进而向其提供高可信度的洞察。”
产品上市信息
Lumada DataOps 产品组合中的 Lumada 数据目录 v7.0 现已在全球上市,Pentaho v9.3 将在 2022 年 5 月正式上市。Lumada 工业数据运维软件将在 2022 年 4 月底上市,届时可从 Hitachi Vantara 及其全球合作伙伴网络获得,敬请期待。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。