2020年,全球都受到了新冠疫情的冲击,各种备受关注的科技大会也有线下转到线上。在5月份举办的IBM think 2020也通过线上直播的方式向大家传递了IBM全新的战略和技术发展。
弹性、灵活和安全的数据基础设施的重要性日益凸显
新冠疫情让线上工作、生活、学习、购物等生产生活方式呈现爆照式的增长,在线办公助力企业复工、在线购物助力人们日常生活、在线教育帮助学生学习。。。等等这些基于互联网连接下的新型应用必将让数据量呈现海量化和多样化的增长。
除了上述线上活动,还有各种各样的应用与互联网结合,并积极利用许多技术应用和业务模式创新,来应对各种不确定环境。
而对于支撑这些业务应用的企业来讲,其面临的是基于混合云环境来管理其业务运营、处理事务,并客户提供服务。这就让支撑混合云环境的基础设施的重要性日益凸显。
同时对于数据基础设施提出了新的需求,包括能够弹性管理企业对云计算和AI、区块链等新兴技术的需求和依赖不断增加。
在IBM think 2020上,IBM全球高级副总裁,IBM系统部总经理、北美地区总裁Tom Rosamilia就总结到,企业正在加快数字化转型,以便新常态下蓬勃发展,他们迫切需要一个弹性、灵活和安全的基础设施。IBM系统部凭借其稳定安全、敏捷灵活和负载为要的服务器、存储和软件产品,正在帮助客户和合作伙伴打造这样的基础设施。
其背后是对数据基础架构的升级和重构,基于混合云的环境,企业需要一个弹性、灵活和安全的数据基础设施。
存储是现代数据基础设施的核心组件
通过最新发布的IBM存储产品,我们发现2020年以来,IBM对其存储产品进行了简化,但是能力更集中。这样IBM可以帮助客户简化存储基础架构,以解放客户的团队来做其他事情。简化之后的IBM存储解决方案主要面向两大环境,一个是混合多云存储解决方案,一个是用于 AI 及大数据的存储解决方案。
IBM提供完整的混合多云存储解决方案
在整个数据基础设施架构中,存储作为数据处理的重要环节,对其能力要求也越来越高。Tom Rosamilia在大会上多次谈到IBM存储解决方案一直以来进行技术创新和能力融合,特别是最新发布的存储产品和解决方案非常适合混合多云环境下的数据存储。
为支持混合多云,IBM基于FlashSystem全闪存以及混合存储系列结合SAN Volume Controller打造了面向混合多云的存储虚拟化解决方案 IBM Spectrum Virtualize虚拟化套件同时结合IBM z15 和 LinuxONE III强大的计算,IBM DS8900F高可靠的全闪存系统以及高性能的IBM TS7770虚拟带库,能够形成针对物理,虚拟和容器混合用例的IBM Spectrum Insights整合解决方案,在结合IBM Spectrum Protect Plus来为企业打造稳态和敏态结合的安全混合云解决方案。
IBM面向AI 及大数据的存储解决方案
IBM基于IBM Spectrum Scale 存储管理套件结合Elastic Storage System(ESS)和IBM Cloud Object Storage(COS)为AI和大数据提供数据湖的存储。
IBM Spectrum Scale 生命周期管是能够管理大规模数据的高性能解决方案,通过计算速度并提供大规模的扩展性从 TB 到 PB 再到 EB 的平滑地扩展,实现自动化数据分层简化了数据管理,结合云环境非结构化对象存储解决方案IBM Cloud Object Storage能够提供面向 PB 级文件和对象存储的现代元数据管理解决方案。
IBM Spectrum Virtualize提供了一种理想的方法,帮助管理和保护组织用于大数据分析和全新认知工作负载的海量数据,并结合IBM Spectrum Discover来实现面向收集数据、组织数据、分析数据和融合数据四步AI 阶梯来加速 AI 数据管道,结合通过简化数据视图,元数据平台跟踪,跨结构化存储和云使用,最终来提高对整个数据湖的生产力提升。
现代化的基础架构需要现代化的数据保护
基于混合云应用需要一个业界领先的稳定安全架构,IBM DS8900F 不仅是交付核心业务负载可信赖的存储方案,同时构建的多中心多活解决方案能够实现99.99999% 的高可靠,兵器即时恢复节省一半的系统重启时间。同时IBM普遍加密技术,数据隐私护照保障整个混合多云生态中的数据安全,包括能够消除在虚拟机环境下运行多个容器的安全隐患。
同时在IBM Think 2020上,IBM宣布在IBM设备上实现了云原生应用开发与部署,用户可以跨云随时随时地开发与部署新的应用,这样在数据保护方面还需要实现虚机、容器、混合多云的数据保护,而IBM Spectrum Protect Plus可以做到虚机、容器、混合多云的数据保护解决方案 。
IBM Spectrum Protect Plus是一款搭建简单的无代理架构,通过 SLA 策略和 REST APIs 实现端到端自动化,提供跨虚拟机主机和管理程序统一的工作负载保护。保护虚拟机、容器、文件、数据库、SAP HANA 和 Microsoft Office 365(Exchange Online 和OneDrive)利用永久增量技术优化备份,并能实现近即时和细粒度数据恢复。
以上的观点是笔者对于IBM Think 2020上关于存储解决方案的一些看法,当然IBM还分享了更多的关于数据基础设施的战略和技术分享,有兴趣的童鞋可以点击:http://www.zhiding.cn/special/IBM_2020_think了解全面的IBM基于现代化的架构创新。
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。