Google Cloud今天宣布Filestore High Scale的Beta版全面上市,这是一个新的文件存储层,为运行高性能计算工作负载的客户新增了横向扩展存储功能。
Filestore High Scale被认为是Google Cloud Filestore服务发展的下一阶段,整合了谷歌去年7月以2亿美元收购数据存储初创公司Elastifile所获得的功能,其部署的共享文件系统让用户拥有数百TB的存储容量,并可以实现每秒吞吐量数十GB,IOPS达数十万次。
谷歌产品经理Tad Hunt和Allon Cohen在发布这一消息的博客文章中写道:“无论是迁移传统应用,使用Kubernetes对现有应用进行现代化改造,还是通过扩展满足大型计算工作负载的性能要求,Filestore现在都可以轻松应对这些挑战。”
已经有早期用户在使用Filestore High Scale了。哈佛医学院瓦格纳实验室博士后研究员Christoph Gorgulla使用该服务启动了一个名为VirtualFlow的虚拟筛查程序,用于发现COVID-19的潜在治疗方法。Gorgulla解释说,这个程序让他所在的实验室能够在药物发现过程中,针对目标蛋白质测试数十亿个小分子,速度比传统方法要快得多。
Gorgulla说:“我们需要这样一个文件系统,可以处理配置了数万个vCPU的数千个客户端同时生成的负载。大多数Filestore设置都是自动化的,我们可以即时扩展容量,可以通过简单的图形界面主动监控工作流的速度。VirtualFlow可以大大缩短了发现药物和治疗措施所需的时间,有望更快地开发出针对COVID-19和其他疾病的疗法。”
谷歌表示,Filestore High Scale横向扩展存储还适用于电子设计自动化、财务建模、基因组学和视频处理等工作负载。
Hunt和Cohen写道:“文件存储是高性能计算应用的一个关键组成部分,而Filestore High Scale能够满足这些需求,包括在云中横向扩展文件存储的可预测性能,按需扩展和缩减文件系统的能力。了解你所需性能水平的相关成本之后,就可以更轻松地设计出解决方案并根据不断变化的工作负载需求进行优化。”
他们说,Filestore High Scale作为完全托管的云服务,最大的特点是易于使用,只需单击几下即可启动实例,并通过Google Cloud或API调用实现自动管理。该服务还可以与Google Cloud Monitoring配合使用,监视文件系统的运行状况,还可以集成各种工作负载管理调度系统。此外谷歌还增加了新的访问控制功能,以满足更高级别的安全要求。
Constellation Research分析师Holger Mueller认为,高性能计算应用需要可扩展的存储解决方案,这种解决方案必须能够随时服务和存储运行所需的大量数据。
他说:“谷歌通过Filestore High Scale产品提高了高性能存储能力,而且很高兴看到这个产品已经给COVID-19相关研究产生了影响,也很高兴看到谷歌对Elastifile的收购取得了成果。”
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。