一位相当权威的EMC博主与IBM展开了激烈争论,其核心议题在于谁才是足以与蓝色巨人的TSM备份与归档软件相匹配的最佳向外扩展后端存储库:EMC的Isilon还是蓝色巨人的GPFS。
IBM方面表示,其TSM——即Tivoli存储管理器——产品“提供备份、归档、恢复、空间管理、数据库与应用程序保护以及裸机恢复与灾难恢复功能。
Stefan Radtke则在自己的博客中指出,“Isilon是最适合与TSM备份相匹配的完美解决方案。”
他表示自己是通过客户实际部署得出这个结论的,初始TSM实例数量为4个、运行在Windows 2012之上,所有备份内容由两台18TB NetApp阵列与两套TS3500磁带库负责——每个磁带库配备八个LTO4驱动器——并构成SAN体系。
这套方案随后进行了调整,TSM实例数量保持不变,但备份内容由具备432TB原始容量(可用容量为260TiB)的3节点LAN连接Isilon NL400集群与一套配备8个LTO4驱动器的TS3500磁带库负责打理。
Radtke的TSM与Isilon配置方案。
对于NetApp配置方案,Radtke指出:“备份、归档与迁移任务以100MB到150MB每秒的速度彻底进行,有时甚至会持续到中午……而归档任务……每天的执行时长则在八到十六个小时之间。”
在切换至Isilon之后,就单一TSM实例来看:“数据吞吐能力提升到约400MB每秒……归档数据吞吐能力……外加备份与恢复数据吞吐能力……也获得了改进,其执行完成时间比原先提前了数个小时。”
在对TSM进行调整以使用更多线程之后,“数据吞吐能力进一步增加至800MB每秒,而归档数据吞吐能力也提升到150MB每秒与750MB每秒之间,运行时长则由原本的16小时缩短至约2.5小时。”
由于大部分数据都被保存在Isilon阵列当中,因此现在只需要一套磁带库与之相搭配。
Radtke对于Isilon的表现作出如下总结:
在另一方面,IBM、Andre Gaschler与Nils Haustein则探讨了在GPFS存储方案之上运行TSM服务器的实际效果。
他们解释称,GPFS利用“经过优化的高性能集群文件系统为应用程序带来指向单一集群中多个节点的并发高速文件访问机制。”
这二位“进行了一系列将TSM与IBM System x GPFS存储服务器(简称GSS)相结合的测试工作。这套GSS系统提供标准GPFS文件系统,其配置在GPFS本地RAID设备(简称GNR)之上。TSM服务器软件运行所在的服务器则利用高速网络连接与GSS文件系统相对接。”GSS设备与两台TSM服务器之间的连接为56Gbit每秒InfiniBand。
他们总结出了如下结论:
他们指出:“这些性能指标明确证实,TSM服务器能够在GSS(即GPFS存储服务器)上获得线性性能扩展。”
这两位GPFS支持者总结道:“GSS将优秀性能表现与操作简化加以结合,为我们带来一套堪称完美的TSM存储环境。多TSM实例能够在基于GPFS的弹性存储云当中实现全方位向外扩展。”
TSM/Isilon组合的峰值数据吞吐能力为每秒800MB,相比之下TSM/GPFS的峰值数据吞吐能力则高达5.4GB每秒(相当于每秒5400MB)——几乎达到前者的七倍。诚然,将二者直接加以对比并不准确,但这样的结果显然说明Isilon并不是惟一值得认真考量的方案——GPFS同样具备出色甚至是更为出色的实际表现。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。