一位相当权威的EMC博主与IBM展开了激烈争论,其核心议题在于谁才是足以与蓝色巨人的TSM备份与归档软件相匹配的最佳向外扩展后端存储库:EMC的Isilon还是蓝色巨人的GPFS。
IBM方面表示,其TSM——即Tivoli存储管理器——产品“提供备份、归档、恢复、空间管理、数据库与应用程序保护以及裸机恢复与灾难恢复功能。
Stefan Radtke则在自己的博客中指出,“Isilon是最适合与TSM备份相匹配的完美解决方案。”
他表示自己是通过客户实际部署得出这个结论的,初始TSM实例数量为4个、运行在Windows 2012之上,所有备份内容由两台18TB NetApp阵列与两套TS3500磁带库负责——每个磁带库配备八个LTO4驱动器——并构成SAN体系。
这套方案随后进行了调整,TSM实例数量保持不变,但备份内容由具备432TB原始容量(可用容量为260TiB)的3节点LAN连接Isilon NL400集群与一套配备8个LTO4驱动器的TS3500磁带库负责打理。
Radtke的TSM与Isilon配置方案。
对于NetApp配置方案,Radtke指出:“备份、归档与迁移任务以100MB到150MB每秒的速度彻底进行,有时甚至会持续到中午……而归档任务……每天的执行时长则在八到十六个小时之间。”
在切换至Isilon之后,就单一TSM实例来看:“数据吞吐能力提升到约400MB每秒……归档数据吞吐能力……外加备份与恢复数据吞吐能力……也获得了改进,其执行完成时间比原先提前了数个小时。”
在对TSM进行调整以使用更多线程之后,“数据吞吐能力进一步增加至800MB每秒,而归档数据吞吐能力也提升到150MB每秒与750MB每秒之间,运行时长则由原本的16小时缩短至约2.5小时。”
由于大部分数据都被保存在Isilon阵列当中,因此现在只需要一套磁带库与之相搭配。
Radtke对于Isilon的表现作出如下总结:
在另一方面,IBM、Andre Gaschler与Nils Haustein则探讨了在GPFS存储方案之上运行TSM服务器的实际效果。
他们解释称,GPFS利用“经过优化的高性能集群文件系统为应用程序带来指向单一集群中多个节点的并发高速文件访问机制。”
这二位“进行了一系列将TSM与IBM System x GPFS存储服务器(简称GSS)相结合的测试工作。这套GSS系统提供标准GPFS文件系统,其配置在GPFS本地RAID设备(简称GNR)之上。TSM服务器软件运行所在的服务器则利用高速网络连接与GSS文件系统相对接。”GSS设备与两台TSM服务器之间的连接为56Gbit每秒InfiniBand。
他们总结出了如下结论:
他们指出:“这些性能指标明确证实,TSM服务器能够在GSS(即GPFS存储服务器)上获得线性性能扩展。”
这两位GPFS支持者总结道:“GSS将优秀性能表现与操作简化加以结合,为我们带来一套堪称完美的TSM存储环境。多TSM实例能够在基于GPFS的弹性存储云当中实现全方位向外扩展。”
TSM/Isilon组合的峰值数据吞吐能力为每秒800MB,相比之下TSM/GPFS的峰值数据吞吐能力则高达5.4GB每秒(相当于每秒5400MB)——几乎达到前者的七倍。诚然,将二者直接加以对比并不准确,但这样的结果显然说明Isilon并不是惟一值得认真考量的方案——GPFS同样具备出色甚至是更为出色的实际表现。
好文章,需要你的鼓励
这篇研究提出了OThink-R1,一种创新的大型推理模型,能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现,现有推理模型即使面对简单问题也会生成冗长的推理过程,导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理,OThink-R1能根据问题复杂度动态调整思考深度。实验表明,该方法平均减少了23.4%的生成文本量,同时保持或提高了准确率,代表了向更高效、更人性化AI推理系统迈出的重要一步。
这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成准确率,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
这项由香港大学和南京大学等机构研究人员联合开发的双专家一致性模型(DCM)解决了高质量视频生成中的效率难题。研究团队发现扩散模型蒸馏过程中存在优化冲突:早期阶段负责语义布局与运动,后期阶段关注细节精修,两者学习动态差异显著。DCM创新性地将这两个任务分配给不同的专家模型,通过参数高效的实现方式,使模型仅需4步即可生成接近50步原始模型质量的视频,大幅提升生成速度,为实用化AI视频创作铺平道路。
这项研究介绍了QARI-OCR,一种基于Qwen2-VL-2B-Instruct模型微调的阿拉伯文字识别系统。研究团队通过三阶段合成数据训练,成功解决了阿拉伯文字识别中的主要挑战:曲线连笔特性、上下文变化的字母形状和发音符号。QARI v0.2模型创下了0.061的字符错误率和0.160的单词错误率,超越了现有开源解决方案,为阿拉伯文化遗产的数字化保存提供了重要工具。