IBM本周三对全闪存阵列家族进行了扩充,增加两款新的高性能型号,专门用于将客户的IT环境与云连接起来。另外,还推出了一款针对高性能服务器和大型机服务器的新全闪存阵列,并表示今年年底预计会推出一个专门针对大数据环境的型号。
IBM市场副总裁Eric Herzog表示,这次推出的新产品是IBM扩展在全闪存存储市场覆盖面的举措之一。我们看到全闪存阵列对于全方位的用户平台是很重要的,所以我们正在将这项技术扩大的大型机和云。因为IBM身处于一个竞争非常激烈的环境中,在全闪存存储阵列市场占有份额排名第二,仅次于EMC。并且在软件定义存储业务方面处于领跑位置,"
在周三的消息公布之前,IBM已经有两项采用IBM FlashCore技术的新型号。与大多数全闪存阵列中采用SSD不同的是,IBM FlashCore是客户定制化的,IBM与美光公司合作,专门针对在高性能闪存阵列中的使用进行了设计,Herzog表示。
IBM新推出的FlashSystem A9000,在8U机箱内通过采用压缩和重复数据删除技术可实现最高300TB的FlashCore容量。性能最高可达到500000 IOPS。
IBM还推出了FlashSystem A9000R,可扩展到全机架的全闪存阵列,最高可达到900TB的原始容量或者1.8PB的有效容量,性能最高可达到200万IOPS。
Herzog表示,这两个型号的延迟最低可达到250微秒。延迟数据可能要比初看更好一些。很多全闪存阵列的延迟大约是100微秒。但是这是在没有运行数据服务的情况下。A9000和A9000R 250微秒的延迟是在运行了复制和数据安全等数据服务的情况下测量出来的。"
这两个型号都针对云环境进行了优化,包括增加了多租户运行、内嵌的服务质量、连接到IBM SoftLayer和OpenStack云。
Lumenate是一家总部在达拉斯的解决方案提供商、IBM渠道合作伙伴,该公司医疗保健和战略高级副总裁Jamie Shepard认为,这些云优化的能力和原始性能同样重要。
除了IBM SoftLayer和OpenStack之外,新推出的阵列还有针对Amazon Web Services和微软Azure的原生API支持,Shepard表示。"新的全闪存存储可以连接到云, IBM的闪存开发人员正在与IBM的云开发团队紧密合作中。"
混合工作负载的服务质量,以及提供多租户的能力,这对于新的IBM解决方案来说一个重要的优势,Shepard表示。"看看金融机构,他们可能想把所有工作负载都放在闪存上。但是对于需要在年底运行的工作负载来说,他们并不想增加更多容量。所以他们可以在这个时候连接到云中。IBM正在将云效率带入数据中心。"
"IBM全闪存阵列产品线的另一个新成员是DS8888,该阵列采用IBM基于Power8的控制器,以及IBM大型机和Power8服务器家族所采用的光纤通道和FICON连接性。DS8888在40U控制器内最多可达到192TB容量,提供低于1毫秒的延迟和最高250万的IOPS性能。"
Herzog表示,今年第三季度IBM还计划推出一款专门针对大数据的全闪存阵列。这款与SanDisk合作设计的新阵列,又称为"Big Data Flash",将瞄准像集群横向扩展NAS、大数据就地分析、针对文件的OpenStack等使用实例,他说。
好文章,需要你的鼓励
这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不同复杂度的状态跟踪任务。实验表明,双线性RNN能有效学习各种状态跟踪任务,甚至只需极少量训练数据。研究还发现,纯乘法交互比加法交互更有利于状态跟踪,为循环网络设计提供了新视角。
这项研究探讨了多模态大语言模型在增强推理能力时出现的视觉幻觉问题。研究发现,模型生成更长推理链时,对视觉信息的关注减少,导致幻觉增加。研究者提出RH-AUC指标和RH-Bench基准来评估模型在推理与幻觉间的平衡,发现较大模型表现更好,纯强化学习训练优于监督微调加强化学习,且训练数据的类型比数量更重要。这些发现对开发既具推理能力又保持视觉准确性的AI系统具有重要意义。
这篇研究探讨了大语言模型在自动推理任务中的不确定性问题。研究者提出,模型生成形式规范时的概率不确定性不是缺陷,而是宝贵的信号源。通过引入概率上下文无关文法框架分析SMT-LIB程序分布,他们发现不确定性信号具有任务相关性(如逻辑任务中的语法熵AUROC>0.93)。他们的轻量级信号融合方法能减少14-100%的错误,仅需最小弃权,将大语言模型驱动的形式化转变为可靠工程学科。研究揭示当模型正确理解逻辑关系时会产生稳定的语法模式,为判断何时信任模型提供了可靠指标。
来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特有的语义处理挑战。GATE模型在MTEB基准测试的语义文本相似度任务中表现卓越,比包括OpenAI在内的更大模型高出20-25%,同时保持了多维度(768至64)的高效表现。研究通过详细的错误分析揭示了模型在不同相似度水平上的表现特点,为阿拉伯语NLP领域提供了新的研究方向。