横向扩展文件存储厂商Qumulo与思科建立合作伙伴关系,在UCS服务器上运行其统一数据平台,并集成Splunk可观测性功能,用于流式处理和清理机器数据。
双方表示,这项合作"能够将数十亿个文件和PB到EB级别的非结构化数据整合到单一的全球一致性网络附加命名空间中","消除了数十年来的孤立数据,让AI系统能够完整且即时地访问构建更准确模型和获得更好结果所需的信息"。该数据平台软件在全球命名空间中提供统一的文件和对象存储,可在本地部署(边缘和核心数据中心站点),也可在云端部署,如在AWS、Azure、谷歌和甲骨文上的云原生Qumulo。
Qumulo产品高级副总裁Brandon Whitelaw表示:"这项合作通过让AI能够对数十年的非结构化数据进行推理,使在复杂环境中获得实时洞察变得极其简单。我们与思科一起,正在提供一个现代化数据平台,通过简化操作并在边缘、数据中心和云端管理PB到EB级别的数据,同时通过与Splunk可观测性云的深度集成来增强态势感知能力,从而克服'数据鸿沟'。"
思科旗下的Splunk提供软件,可实时收集、分析和可视化来自各种来源的机器生成数据,如服务器、网络、云环境、应用程序和设备。Qumulo表示,当企业数据在Qumulo和思科UCS上统一后,Qumulo数据平台可原生地将OpenTelemetry数据直接流式传输到Splunk可观测性云中。客户随后可以"获得实时故障排除的可见性,推动更快的异常检测,帮助加强对主权数据威胁的抵御能力"。
关键工作负载和数据包括医学影像、信号情报、自动驾驶遥测、生命科学研究、地理空间测绘和影像、视频监控以及企业文档管理。AI重点专注于推理而非训练。
目前这是一项本地部署解决方案,与思科与NetApp(FlexPod)的融合基础设施(CI)合作不同。Pure Storage(FlashStack)和VAST Data的合作都包含思科Nexus网络,属于机架级硬件和软件解决方案。
Qumulo统一数据平台现已在思科全球价格清单上提供,并通过思科全球渠道销售。它包括预验证的、联合支持的本地架构,未来将支持在所有主要公有云中部署云原生Qumulo。
Q&A
Q1:Qumulo统一数据平台主要解决什么问题?
A:主要解决企业数十年来积累的孤立数据问题。该平台能够将数十亿个文件和PB到EB级别的非结构化数据整合到单一的全球一致性网络附加命名空间中,让AI系统能够完整且即时地访问构建更准确模型所需的信息。
Q2:这个平台适合哪些应用场景?
A:关键应用场景包括医学影像、信号情报、自动驾驶遥测、生命科学研究、地理空间测绘和影像、视频监控以及企业文档管理等。平台主要针对AI推理应用,而非训练场景。
Q3:如何获得Qumulo统一数据平台?
A:该平台现已在思科全球价格清单上提供,可通过思科全球渠道购买。包括预验证的、联合支持的本地架构,未来还将支持在AWS、Azure、谷歌和甲骨文等主要公有云中部署云原生版本。
好文章,需要你的鼓励
卢森堡大学研究团队开发的RLDP框架首次将强化学习应用于差分隐私优化,创造性地解决了AI训练中隐私保护与模型效果的矛盾。该方法如同智能教练,能动态调整隐私保护策略,在四种语言模型上实现平均5.6%的性能提升和71%的训练时间缩短,同时增强了抗隐私攻击能力,为敏感数据的AI应用开辟了新路径。
这项由北京大学人工智能研究院完成的研究,首次从数据压缩理论角度揭示了大型语言模型存在"弹性"现象——即使经过精心安全对齐,模型仍倾向于保持预训练时的行为分布。
腾讯混元团队联合北京大学提出MixGRPO技术,通过混合ODE-SDE采样策略和滑动窗口机制,将AI图像生成训练效率提升50%-71%,同时在多项人类偏好评估指标上超越现有方法。该技术采用"从难到易"的渐进优化策略,专注于图像生成早期阶段的重点优化,并引入高阶求解器进一步加速训练过程,为AI图像生成的产业化应用提供了更高效可行的解决方案。