华为推出了一款新的全闪存OceanStor Pacific阵列9920,并透露了其压缩和面向勒索软件快速恢复的一些细节。
这家总部位于中国的大型公司和存储领域的巨头们进行竞争,拥有广泛的存储产品组合:OceanStor Dorado全闪存、OceanStor Hybrid、OceanStor Pacific分布式存储、FusionCube HCI和OceanProtect备份存储。
新的9920采用了可扩展的设计和完全对称的分布式架构,但实际上它是一个五合一的阵列,因为它具有基于2RU机箱的多功能设计,可根据CPU类型和驱动器变化进行配置。比如高性能的H系列,可以由两个基于Arm的鲲鹏 920处理器提供动力,也可以由两个英特尔至强SP CPU提供动力。
鲲鹏系列机箱可以使用用于SAS或NVMe驱动器的12 x 3.5英寸或25 x 2.5英寸驱动器托架。H系列可以有12 x 3.5英寸或25 x 2.5英寸SAS插槽,也可以有12个3.5英寸或24 x 2.5英寸NVMe驱动器托架。整体情况很复杂。
一个鲲鹏节点可以提供高达20GBps的带宽,稳定的1ms延迟,并以高达230000 IOPS的速度运行。更快的Intel H系列可运行80万IOPS。随着节点的扩展,带宽和IOPS总量会增加。
基于鲲鹏处理器的9920系统支持NFS、SMB、POSIX、MPI-IO、HDFS和S3存储访问,而基于Intel的H系列支持SCSI、iSCSI和OpenStack Cinder。
数据访问可以通过TCP或RoCE在25或100GbitE或100Gbps EDR InfiniBand上进行。9920以N+M方案提供基于纠删码的数据冗余,其中M可以是2、3或4,表示驱动器恢复数量。如果数据丢失,则使用鲲鹏处理器以每小时2TB的速率和使用Xeon CPU以每小时4TB的速率进行自动和并发的数据重建。H系列还支持3副本模式,而不是纠删码。
华为表示,凭借其FlashLink技术和AI Fabric网络加速,单个9920系统可以满足数百万虚拟机的应用性能要求,包括虚拟化(云资源池)、数据库、高性能计算、AI应用和大数据分析等工作负载。
9920可以单独使用,也可以为基于磁盘的OceanStor Pacific 9540提供闪存存储层。
OceanStor压缩和勒索软件保护
华为的OceanStor软件套件具有智能的应用程序感知压缩功能。例如,算法,用于压缩数字病理学中使用的JPEG图像,声称使用其软件时,压缩比可以达到59:1,而没有使用其软件时,压缩比为38:1。
我们被告知,它的软件可以在基因测序中采用1.8:1的GZIP压缩比,并将其提高到3:1。在这种情况下,软件从语义上解析输入数据并识别某些应用程序文件类型,例如数字病理学和基因序列。然后,它可以使用多帧相关性和基于参考的压缩,将数据缩减率提高50%。华为表示,其软件还具有自适应边界识别功能,可以减少分区信息熵,仅此一项就可以将压缩率提高20%以上。
OceanCyber设备可以通过数据复制快照安全扫描实时监控OceanStor Pacific IO模式。它可以检测勒索软件攻击,据称识别准确率为99.9%,然后使用WORM文件系统中的安全快照从所谓的隔离区跨空气间隙进行恢复。恢复可以在检测到攻击后几秒钟内开始。
勒索检测在任何带有阻止列表和信任列表的勒索软件事件之前开始。使用用户行为分析来监控进程内事件的IO行为。华为的软件还对文件中的勒索软件进行定期检测扫描。
华为产品在美国实际上是不可用的。在美国以外,在其产品销售的地区和地区,华为产品代表着强大的存储系统竞争。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。