IBM公司日前公布了其作为软件定义存储产品线组成部分的弹性存储(Elastic Storage)方案,不过从本质上讲这只是经过重新包装与命名的陈旧GPFS产品。
GPFS的全称为通用并行文件系统,IBM利用它来专门应对面向大量文件的并行访问操作。
IBM公司在声明中指出,弹性存储方案“能够提供前所未有的性能表现、无限的扩展能力并通过将数据自动迁移至最为经济的存储设备之上而实现了高达90%的存储成本节约效果。”
根据我们的理解,这里指的无疑是磁带存储介质。
蓝色巨人是这样描述软件定义存储技术的:
软件定义存储是一整套功能集合,旨在以自动化方式管理本地与全局数据、为数据访问带来突破性的传输速度、简化管理流程、带来更为快捷的基础设施扩展技术并在数据规模持续增长的同时不断改善成本效率。除此之外,这些优势还能够作用于任何一家企业的存储系统,最终为用户带来自动化与虚拟化相结合的存储方案。
这份公告中还提到弹性存储方案汲取了一部分来自沃森项目的技术成果——众所周知,沃森是IBM着力打造、成功取得“Jeopardy”竞答节目冠军的计算系统。根据我们得到的消息:“在弹性存储功能的支持下,只需几分钟时间、总量高达5TB的沃森‘知识数据’(相当于两亿页信息)就能被载入到计算机内存当中,”而且“IBM研究部门已经证实弹性存储能够成功在四十三分钟内对保存在单一集群当中的上百亿个文件进行全盘扫描——这一技术展示证明了该方案足以帮助客户借助其无与伦比的强大性能对少量数据存储库进行分析,从而提取出准确的处理结论。”
说到这里,我们需要对IBM声明中的说法作出一番分析:在四十三分钟内扫描上百亿个文件?是的,这种说法我们之前就已经见到过。就在2011年7月,IBM曾经利用Violin闪存阵列让GPFS实现过四十三分钟扫描一百亿个文件的处理任务。
IBM公司表示:
弹性存储方案还利用服务器端闪存实现了六倍于标准SAS磁盘的性能表现……当服务器配备有闪存存储设备时,该功能会自动将闪存作为缓存存储使用,从而显著改进性能表现。
实际效果能够达到标准SAS磁盘驱动器的六倍?希望真是如此。
那么在IBM收购了TMS RamSan技术之后,弹性存储方案是不是就用上了自家的FlashSystem闪存阵列呢?在这份弹性存储方案公告中,只是提到了服务器端闪存、而没有具体说明其种类。IBM公司的一位发言人指出:“该软件能够支持来自任何一家供应商的存储系统,其中包括IBM FlashSystem。”
我们被告知“弹性存储方案会对存储资源进行虚拟化,从而允许多种系统及应用程序共享这套通用存储池。这就保证了数据能够以透明化方式实现全局访问,而且无需对应用程序作出修改、也避免了其它破坏性存储管理应用的介入。”
IBM公司指出,国家大气研究院计算与信息服务中心在其位于怀俄明州以及科罗拉多州的两座数据中心内保存并管理着超过50PB的庞大数据,而弹性存储方案为研究人员提供了对这批海量数据的快速访问能力。就在去年,该机构还专门撰文就GPFS作出了评述。
IBM在声明中援引了国家大气研究院计算与信息服务中心数据分析服务小组主管Pamela Gillman的说明:“IBM的这套全局文件系统软件为我们带来了可扩展、可靠且速度出色的信息访问能力。”
没错,这就是GPFS。
根据我们得到的消息:“弹性存储的关键性组件之一在于其能够以自动化与智能化方式将数据迁移到最符合管理策略与成本优势的可用存储系统当中。……弹性存储方案能自动将使用频率最低的数据迁移至价格最低、最具维护成本优势的磁带驱动器当中,而访问频率较高的数据则会被移动到高速闪存系统内以改善使用体验。”这种解决思路似乎源自Tivoli存储管理器,同时又加上了IBM自家的线性磁带文件系统(简称LTFS)。
弹性存储方案支持OpenStack Cinder与Swift、外加POSIX及Hadoop API。
如果大家想了解更多关于IBM软件定义存储技术的详情,可以点击此处查看IBM官网上提供的内容——其中对GPFS连接进行了详尽描述,并将“弹性存储”作为新的产品代号。
弹性存储v4.1包含以下特性:
这份网页中提到:“在与IBM Tivoli存储管理器(简称TSM)或者IBM线性磁带文件系统(简称LTFS)相集成时,IBM弹性存储能够实现独一无二的全数据生命周期管理功能,通过由自动化及分层存储管理机制支持的管理策略实现显著的成本节约效果。”
大家可以点击此处阅读IBM提供的弹性存储方案说明(PDF格式)——这实际上是一份针对GPFS v3.3的介绍材料,IBM公司2010年版权所有。
IBM指出:“弹性存储软件还将在今年晚些时候以IBM SoftLayer云服务的姿态与用户见面,”这意味着大家可以直接从IBM或者认证合作伙伴手中购买这款软件。
目前我们还不清楚弹性存储软件的具体售价。
好文章,需要你的鼓励
开放闪存平台(OFP)旨在用直接访问的闪存盒替代全闪存阵列,每个闪存盒配备控制器DPU、Linux系统和并行NFS软件。该倡议由Hammerspace主导,针对新云、超大规模和AI公司在数据中心设计演进中面临的基础设施限制。OFP通过结合IPU/DPU技术、闪存优化机箱和Linux协议,提供高密度、低功耗的存储解决方案,满足AI应用从PB级向EB级数据容量需求的扩展。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。
ERP系统市场近年来相对稳定,但AI正在改变一切。供应商们正竞相在产品组合中嵌入AI功能,构建包括可组合应用、集中数据存储和可扩展云平台的生态系统。Oracle凭借AI投资超越SAP成为ERP收入领导者,而AI代理已从实验阶段进入实际应用,能够管理整个工作流程并进行自动化决策。本文盘点了Oracle、SAP、微软等十大最具影响力的ERP厂商及其AI战略。
这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。