在Hitachi Next2019 大会上,该公司发布了其Hitachi Virtual Storage Platform(VSP)5000(此前曾命名为Jupiter项目)。这台设备能够在提供每秒2100万输入输出操作(IOPS)性能的同时,将延迟控制在70微秒水平。
Hitachi VSP 5000 Storage系列
VSP 5000内部采用PCIe交换架构,起步为双控制器,后续可扩展至12个控制器,最大存储容量为69 PB。这套系统支持NVMe SSD,外加传统的SAS SSD与HDD,允许用户在性能与存储成本之间做出权衡。另外,VSP 5500版本(双控制器)的可用性等级为8到9,相当于年均停机时间约316毫秒。
凭借着内置的交换式PCIe背板,这套系统也能够使用NVMe-over Fabric(NVMe-oF),但目前这项功能尚未实际启动。其拥有32 Gbps光纤通道(FC)外部连接,PCIe横向扩展互连以及以太网端口。VSP 5000采用FPGA作为加速器,用以执行数据查找及检索任务,进而协助提高整体性能。内部系统则内置有4路网络冗余,能够支持闪存SSD与Optane SSD(后者被称为内存级存储,简称SCM)。
Hitachi Vantara表示,VSP 5000将采用AI技术驱动,同时提供4倍的故障隔离与故障原因分析速度,可自动执行80%的日常俗务,且具有基于机器学习的先进智能重复数据删除技术。此外,压缩、快照以及瘦镜像功能也没有缺席,能够为用户带来7:1的存储容量利用效率。该公司的Flash Assurance Credit闪存保险服务负责在数据未损坏的情况下提供设备更换保障。
Hitachi Vantara在其发展路线图中公布了未来的智能闪存模块方案,其中将包括域专用加速器。这些加速器将帮助用户重建存储节点以及下一代横向扩展文件存储设备、用于对象存储的NAS网关、外加组合式横向扩展存储。
Hitachi Ops Center将充当该公司存储基础设施(包括VSP 5000平台)的管理套件。Ops Center能够显著提高基础设施管理的优化速度。下图所示为Ops Center支持的部分操作,包括通过收集及分析遥测数据实现数据管理与保护、自动执行日常任务以及设备管理操作等。
Ops Center管理器提供关于IT数据中心运营情况的全局视图,同时配备一套可突出显示存储系统运行状况、性能、容量以及各类事件的操作仪表板。用户可以直接访问各分布式Ops Center Analyzer服务器以进行故障排查。VSP 5000系列将附带管理软件,外加下图所示的一整套增值软件包。
该公司还对其AI基础设施管理产品Lumada进行了扩展。这款产品此前主要面向物联网应用,但现在也可以在数据中心、云环境以及边缘位置全面使用,具体如下图所示。Lumada能够与包括Hitachi和其他第三方应用配合。
Hitachi Vantara还推出一套名为DataOps面向数据运营的模型。DataOps是一套协作型数据管理方案,致力于改善数据流的通信、集成与自动化效果。用户可以利用DataOps创建更加高效的数据中心。
在本次大会上,Hitachi Vantara还公布了Lumada Data Services,这是一套基于云端的控制面板,可用于简化DataOps,通过Pentaho 9.0,外加面向Hadoop部署的Lumada Data Lake(下一代边缘到核心到云端数据湖)的成本节约工具Lumada Data Optimizer,来编排并分析边缘、核心以及云端数据。
根据日立方面的介绍,Lumada Data Services能够加速数据发现、实现数据管理自动化,从而在实现成本保障与合规性的同时,帮助用户随时随地查看全部数据状态。从边缘到云端的相关元数据都可通过云控制台查询,并根据预设策略进行编排,这一切都将作为DataOps的运营基础。值得一提的是,Hitachi Cloud Services中包含一项有趣的功能,即以基础设施即代码或者软件定义基础设施的方式驱动自动化,同时消除部署风险。
Pentaho 9.0与Hitachi Content Intellignece相结合,使新的数据流服务能够快速面向一切数据类型建立流水线,通过流水线分配馈送AI模型,进而实现性能分析与监控以及资源分配。Pentaho 9.0还提供多集群支持能力,也能够与容器技术协同使用。
Lumada Data Optimizer支持利用Hadoop对计算及存储资源进行独立规模伸缩,并自动将冷存储内容转移至日立Content Platform(HCP)。Lumada Data Lake负责利用单一集成目录对包含原始、甄选以及已发布内容的数据进行智能存放与访问。最后,HCP是一项软件定义式S3云优先服务,采用容器化机制并能够跨越多种云环境发挥作用。
Hitachi Vantara公司此次发布VSP 5000系列产品,标志着其已经正式进军NVMe存储市场。而该公司披露的这一系列新型硬件以及基于AI的基础设施管理工具,也将为用户带来更强大的通用数据访问、分析以及管理能力。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。