EMC公司已经着眼于低延迟对VMAX设计进行了重构,并借此打造出两款新的全闪存VMAX产品。
存储巨头如今已经拥有四大全闪存阵列产品家族:XtremIO用于相对较为标准的全闪存工作负载; DSSD D5负责提供终极高性能方案; VMAX则提供高性能与大容量方案,同时匹配VMAX数据管理服务环境。
最后,还有一款全闪存VNX用于在VNX数据服务之下交付更为简单的双控制器闪存阵列性能方案。
目前VMAX All Flash(简称VMAX-AF)产品系列共拥有两款机型:
• VMAX 450可匹配一到四套引擎。
• VMAX 850可匹配一到八套引擎。
EMC公司宣称,VMAX-AF在总体持有成本方面低于基于磁盘的传统企业级阵列,且能够面向企业关键性任务应用场景。
它可向上扩展至最高4 PB存储容量,同时支持块存储、文件存储以及大型机访问协议,且仍然保持了VMAX的强大可靠性水平。其性能水平可向上扩展至400万IOPS,这意味着单一引擎能够交付约50万IOPS。
这样的IOPS表现相当于DSSD D5阵列1000万IOPS的一半。
其中采用V-Brick构建块设计。一个V-Brick中可容纳一套VMAX引擎与53 TB实际可用容量,且能够以13 TB为增量单位向上扩展至500 TB存储空间。(作为参考,D5阵列的存储容量为144 TB,实际可用空间为100 TB。)
这套系统采用三星PM863系列2.5英寸、32层、3D TLC V-NAND 3.84 TB SSD。这款闪存驱动器可实现每天一次全盘写入。
客户还可以通过将V-Bricks数量增加至八套上限以迎来4 PB存储空间。
VMAX-AF目前的IOPS水平提供可浮动区间,且延迟低于500微秒(DSSD D5的延迟水平为100微秒),同时支持最高每秒150 GB传输带宽(D5为每秒100 GB)。这意味着VMAX在速度方面几乎与DSSD相差无几,同时具备约28倍存储容量及50%传输带宽提升。一台3-V-Bricks 450能够提供150 TB存储容量,高于D5的144 TB。这将带来一种非常有趣的性价比参考。
VMAX-AF还具备一项Write Folding技术,旨在改进闪存使用寿命。
根据EMC II公司产品与市场营销总裁Jeremy Burton所言,这一新家族可能不会搭载重复数据删除功能,但将在未来获得软件压缩机制。
VMAX-AF产品自然而然地继承了全部VMAX数据管理服务,这也成为其面对DSSD D5阵列时的最大比较优势。这使得VMAX-AF成为一套更易于为既有VMAX用户接受的系统。
另外VMAX-AF还提供一套类似于设备采购的软件选择方案。其基础F级软件包提供:
• 精简配置
• 服务质量
• 嵌入Unisphere
• VVol支持与SnapVX技术
• AppSync数据保护软件以实现副本数据管理(简称CDM)
FX级软件包则提供:
• SRDF软件以实现远程复制,实现"六个九(99.9999%)"可用性水平。
• 基于控制器的闲置数据加密机制D@RE
• ViPR套件(包含控制器与SRM)以实现自动化配置、管理与监控。
• CloudArray软件负责在VMAX与云存储服务之间为非关键性数据建立链接。
• eNAS技术负责实现文件存储。
• EMC Unisphere 360负责立足于单一数据中心管理高达200台VMAX阵列。
然而,这些软件包中并未包含ProtectPoint软件。这款数据保护产品可被添加至VMAX-AF系统当中以执行VMAX与Data Domain阵列之间的直接备份操作,且无需配合任何其它备份软件。
XtremIO Xpect More Program亦被扩展至VMAX-AF当中。共提供经过简化的规划、部署与管理功能。另外该阵列家族还拥有一套寿命周期内平价维护模式与寿命周期内闪存寿命保护服务。
VMAX-AF还被引入至VCE公司(EMC旗下之融合型平台事业部)的Vblock与VxBlock 740融合型系统当中。
EMC公司认为到2020年,全部用于生产型应用的存储方案都将以闪存为基础; 传统磁盘则将被主要用于保存大批量归档存储数据。
考虑到这一点,EMC方面已经开始全力进军闪存领域,并借此取代传统数据中心内规模庞大但却性能低下的批量数据存储机制--磁盘驱动器。存储巨头宣称,没有哪款闪存阵列能够适应全部潜在用例。不过Pure Storage对此显然持有不同意见。
由于EMC公司拥有可观的销售与市场推动力量以及销售渠道,相信不久之后我们将被闪存阵列的消息所吞没。
这两套全闪存VMAX系统目前已经正式上市。VMAX-AF系统现可作为既有Vblock与VxBlock系统与VCE Vscale Fabric实现方案的VCE技术扩展选项进行订购。
* VMAX-AF是我们自行总结的缩写名称,并非EMC官方定名。
好文章,需要你的鼓励
这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不同复杂度的状态跟踪任务。实验表明,双线性RNN能有效学习各种状态跟踪任务,甚至只需极少量训练数据。研究还发现,纯乘法交互比加法交互更有利于状态跟踪,为循环网络设计提供了新视角。
这项研究探讨了多模态大语言模型在增强推理能力时出现的视觉幻觉问题。研究发现,模型生成更长推理链时,对视觉信息的关注减少,导致幻觉增加。研究者提出RH-AUC指标和RH-Bench基准来评估模型在推理与幻觉间的平衡,发现较大模型表现更好,纯强化学习训练优于监督微调加强化学习,且训练数据的类型比数量更重要。这些发现对开发既具推理能力又保持视觉准确性的AI系统具有重要意义。
这篇研究探讨了大语言模型在自动推理任务中的不确定性问题。研究者提出,模型生成形式规范时的概率不确定性不是缺陷,而是宝贵的信号源。通过引入概率上下文无关文法框架分析SMT-LIB程序分布,他们发现不确定性信号具有任务相关性(如逻辑任务中的语法熵AUROC>0.93)。他们的轻量级信号融合方法能减少14-100%的错误,仅需最小弃权,将大语言模型驱动的形式化转变为可靠工程学科。研究揭示当模型正确理解逻辑关系时会产生稳定的语法模式,为判断何时信任模型提供了可靠指标。
来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特有的语义处理挑战。GATE模型在MTEB基准测试的语义文本相似度任务中表现卓越,比包括OpenAI在内的更大模型高出20-25%,同时保持了多维度(768至64)的高效表现。研究通过详细的错误分析揭示了模型在不同相似度水平上的表现特点,为阿拉伯语NLP领域提供了新的研究方向。