在今年的世界超算大会(ISC2018)上,联想凭借117套入围的成绩,成为HPC TOP500榜单中全球最大的HPC解决方案供应商。作为首家获此殊荣的中国厂商,联想正在以“科技创新”赋能行业变革,为科研、教育、航天、气象、汽车、石油石化、生命科学等多个领域提供领先成熟的解决方案。8月31日,以“突破算力 决胜未来”为主题的2018联想全球超算峰会在京召开,会上,联想正式发布了自主研发的全新AI产品家族,展示了原创性的技术实力,分享了联想HPC促进国民经济升级,推动众多企业转型的成功实践经验,开启行业智能新时代。
联想数据中心业务集团制造行业总监许子牛、诺禾致源副总裁吴俊接受了包括至顶网等多家媒体的采访,分享了基因测序领域对于高性能计算的需求,以及联想高性能计算如何帮助诺禾致源提供强大和智能的算力。
更快、更强是基因测序领域对于高性能计算的核心需求
大家知道基因测序技术已被列为国家重点发展产业。据研究,每年的基因测序分析增长会在30%以上,数据量也将是越来越多,如何传输、保存和管理海量的基因数据是一个非常棘手的问题。为解决这一现状,HPC正被广泛应用于基因测序行业。在目前国内基因测序领域,诺禾致源是当之无愧的佼佼者,诺禾致源的业务覆盖科技服务、肿瘤基因检测及遗传检测三大领域,为全球研究型大学、科研院所、医院、医药研发企业、农业企业等提供基因测序、质谱分析和生物信息技术支持等服务。其中科研服务的内容是为科研院校、医院、药企提供测序的服务,从测序到后续的数据分析,最后给到客户分析报告,以便客户根据相应的实验设计挖掘出数据具体的生物学意义。
包括基因测序在内的生命科学研究对于高性能计算的需求是刚需。随着基因测序过程数据量的增幅速度加快。一方面需要对测序结果更快的呈现,一方面对于海量数据有极高的存储需求。
诺禾致源高级副总裁吴俊谈到“基因测序环节几年前需要7到8天,平均每天机器采集的数据量是200到300GB,现在测序环节只需要2.5天,但是数据量增减到6TB,这就面临一个问题,测序量又增大,时间减少,如何解决计算的问题。”
因此对于高性能计算的需求是一方面是高性能计算的配置要足够的优化,另外针对数据量比较大,每次数据收回意味着每一次成本都非常高,因此IO的读写速度也要跟得上,包括一些并行化的要求,吴俊谈到。
同时针对计算量和数据量海量的特征以及后续增长速度高的特点,诺禾致源采用了自建数据中心机房来解决成本以及本身业务的特殊性需求。
目前诺禾致源已在全球运行25台NovaSeq、20台PacBio Sequel、30台HiSeq X、11台HiSeq 2000/2500/4000、4台MiSeq、4台NextSeq 500、6台Life Ion Proton(DA8600)、2台S5XL和5套Q Exactive™ HF-X等最先进的基因测序仪,建立了亚洲通量规模最大的基因测序平台,将实现每年280,000人全基因组测序的超高通量。同时,全国首家引入Q Exactive™ HF-X高端质谱平台,打造最先进的生物质谱中心,为客户提供全面、深入的多组学解决方案。
联想HPC优势是能提供一个最完整的技术链
针对生命科学研究领域,联想作为国内HPC的领军者,不仅能为生物科学领域海量数据的研究提供超强计算能力和大容量存储服务等基础服务,最重要的是联想能够为整个产业提供一个完整的技术链。联想数据中心业务集团制造行业总监许子牛表示针对包括生命科学研究等在内的医疗领域,联想能够提供一个完整的链。“所谓最完整的链指的是技术需求,从研发开始,生物制药需要研发系统、数据存储,包括光谱分析,成分分析、药动力分析,再过渡到生产以及通过各种认证最后到销售等。联想可以整合边缘计算的整体方案,从物联网到前端计算平台设计” 许子牛对记者表示。
针对诺禾致源的高性能计算需求,联想做了缜密的需求分析。联想认为:生物信息学类计算的核心内容是内存密集型,存储密集型,结合联想多年来的经验,为诺禾致源提供了针对化专业化的解决方案。联想高性能计算主要解决诺禾致源对高性能、内存、存储和稳定性的四大问题。
首先,对于高性能计算而言,一方面是浮点处理性能,另一方面为CPU本身的综合性能,联想结合生物信息学行业的特点,推荐使用Intel处理器,不仅实现了较高的处理性能,并且在能效比,内存支持,以及CPU本身的架构上Intel都有很大的优势。
其次,在生物信息学应用中,先期数据的载入对于内存容量的要求越来越高,联想采用大内存服务器四路或者八路胖节点,可以在单节点中配置最高达2TB内存,充分达到应用的实际需求。
其三,海量存储系统是生物信息学计算的先决条件。联想不仅可以提供了专业级的直连存储,更有通过专有的存储节点构建并行文件系统或者是分布式存储系统,接入以太网,甚至40GB/56GB的Infiniband网络,总体容量可达到PB级,除此之外还考虑到用户的数据安全,数据备份等,从根本上解决了生物信息学的数据存储难题。
最后,一套高稳定性的系统能够使我们的生物信息学应用更加方便快捷,同时也能够高效率的处理数据,保证业务不中断,联想通过统一的集群监控管理,作业调度,结合联想高性能的服务器,从各个方面保证了整套系统的稳定性,大大提高了用户的使用稳定性和减少了故障率,为用户提高生产力提供持续不间断的支持。
据了解,联想提供的刀片式高性能运算系统,提供了将近200万亿次计算能力,配置超过10PB的存储空间,很好的承载了诺禾致源华东地区的业务,有效的改善公司在华东计算资源不够的限制。
如今诺禾致源已经拥有全球领先的高性能计算平台,数据中心运算能力已提升至1727T flops,总内存410TB,总存储60.2PB,有效地支撑着生命科学研究和医疗健康两大领域对大数据分析和存储的需求。
可以看到联想为诺禾致源提供了完整的测序数据分析服务,对数据进行自动解析,重新发现很多有用信息,实现基于预测功能的软件运行速度提升,同时还提升了对CPU的利用率。
好文章,需要你的鼓励
DeepSeek 的 AI 模型在处理效率方面取得重大突破,可能对数据中心产生深远影响。尽管引发了科技股抛售,但业内专家认为,这项创新将推动 AI 应用普及,促进大规模和分布式数据中心基础设施需求增长。更高效的 AI 算法有望降低成本、扩大应用范围,从而加速数据中心行业发展。
Rivian 正全面推进 AI 技术整合,开发下一代电动车平台,以挑战特斯拉的市场地位。公司计划于 2025 年实现免手驾驶,2026 年达到 L3 级自动驾驶。Rivian 还将在车载系统中广泛应用 AI 技术,提供语音交互等功能,并计划推出更实惠的车型,扩大市场份额。
Postman 发布了 AI 代理构建器,这是一款创新的生成式 AI 工具。它允许开发者通过整合大语言模型、API 和工作流程来设计、构建、测试和部署智能代理。这一工具旨在简化 API 交互、优化工作流程,并支持创建能执行复杂任务的智能代理,标志着 API 优先的 AI 开发迈出了重要一步。
微软第二财季利润同比增长10%,人工智能年化收入达130亿美元。然而,云计算业务未达预期,下季度指引不及预期,导致盘后股价下跌。公司资本支出创新高,以满足AI和云需求。尽管Azure增长放缓,但微软对下半年增速加快持乐观态度。同时,中国AI初创公司DeepSeek的崛起引发业界对AI基础设施投资的重新审视。