扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
三位技术业界的重量级人物走一起,希望联手打造一种迥异于以往的超级计算机集群设计,从而有针对性地处理“大数据”工作负载——同时摆脱传统高性能计算所必需的仿真及建模机制。
劳伦斯 利弗莫尔国家实验室、英特尔与克雷之间的合作关系于本周一正式揭晓,三方将共同打造一套名为“Catalyst”的高性能计算系统——该方案最重要的特性就是配备远超过此前任何系统的巨大内存。
Catalyst拥有304个双插槽计算节点,每个节点装备有主频为2.4GHz的12核心至强E5-2695v2处理器、DRAM为128GB,此外还采用了英特尔TrueScaleFabric。就目前来看,真正让这台超级计算设备与众不同的要素在于其通过PCIe直接接入每个节点的800GB闪存机制。科学研究人员们希望将固态存储设备转化为次级内存供设备整体使用。
英特尔、克雷与劳伦斯实验室将利用这套系统解决“大数据”难题,并以此为基础探索新系统如何能在设计上享受高速内存介质所带来的提升——考虑到下一代非易失性RAM(例如惠普打造的‘忆阻器’技术)在未来几年内面世的可能性,这样的考量无疑非常重要。
实验室高级技术项目副主管MattLeininger告诉我们,最初劳伦斯实验室希望利用这套系统承载一种新的“数据密集型”技术方案,即将固态硬盘映射为应用程序内存,从而“使应用程序将闪存存储视为标准DRAM”。不过他同时强调称,应用程序“需要借助某些智能化机制才能利用闪存实现DRAM缓存效果。这台设备将成为探索的起点,并逐渐由两节点、三节点、五节点最终扩展至数百个节点。”
这套系统所采用的硬件设备可能来自Fusion-io,这家闪存领域的新兴领导者将原本高于磁盘的闪存读写速度进一步提升至几乎与RAM持平,从而作为软件的数据驻留环境。Leininger坦言,在这方面需要关注的重点在于DRAM与英特尔闪存之间的访问时间差异,只有在大型应用中采取新型内存分配方式才能解决这一难题。
那么,这一切与“大数据”又有什么关系?
“在传统高性能计算领域,仿真与建模技术通常以科学模型为基础,即在底层采用数学或者物理偏微分方程,”英特尔公司高级计算部门首席技术官MarkSeager指出,“起步阶段的数据量非常小,但随着时间推移它所产生的新增数据量将变得越来越大。”
“在这种环境下,我们需要为这类计算最大限度提高每秒每美元所带来的浮点运算能力。除此之外,其它关注重点还包括互连机制、内存与IO能力等。”
小集群上的大内存
但在处理大数据应用程序时,集群必须随时分析由不同来源生成并输入的海量数据——例如远程获取来自国家电网或者地球物理勘探等设施的数据——这就对基础设施的配置提出了完全不同的要求。在此类工作面前,速度极快、容量极高的内存就成了重中之重。
“在处理大规模数据时,这些数据通常被保存在磁盘当中,因此我们必须找到一种高效方式、让计算机制能够快速将数据从磁盘中提取出来并导入文件系统,”Seager解释道,“磁盘的初始速度就不高,而且在使用过程中速度还将越来越慢……NVRAM的出现为我们实现数据的高速随机读取创造了可能。”
这套方案据称“是对美国能源部能源实验室所打造的经典仿真计算架构的一次彻底脱离,同时开启了将浮点运算性能与数据分析在同一环境内结合的新机遇,”英特尔公司在关于该系统的一份声明中表示。“因此,Catalyst的设计思路很可能成为未来商用技术采购的重要基础。”
除了NVRAM容量达到800GB之外,该系统还拥有双路四倍数据率(简称QDR-80)网络传输机制,旨在为每块CPU提供其专有的I/O服务。在此之前,只有一个插槽能获得直接网络连接,而另一个插槽只能通过QPI进行数据交互。
“在每插槽双路传输机制的辅助下,我们能够充分发挥闪存设备的性能优势、同时又不必涉及QPI插槽,”Seager指出,“我们能够将有效信息传递速率提高一倍。”
新型传输技术与NVRAM的强强联合使Catalyst具备每秒0.5TB的跨集群传输带宽,这样的成绩与2012年6月劳伦斯实验室打造的全球最快超级计算机(代号为‘Sequoia’,每秒浮点运算能力达到16千万亿次)相比也不遑多让。
二者之间的不同之处在于,Catalyst所采用的带宽机制“在成本上与‘Sequoia’根本不是一个量级,这是因为‘Sequoia’所使用的文件系统以普通磁盘为基础,”Seager表示。
整套克雷CS300集群的总体存储容量为150TB,包含304个计算节点、12个Lustre路由节点(128GBRAM与3200GBNVRAM)、2个逻辑节点(128GBDRAM)外加两个管理节点。每个计算节点的NVRAM为800GB。克雷所采用的NVRAM是来自英特尔的SSD910系列800GB单高PCIe2.0闪存产品,属于多层单元闪存。
Catalyst的面世让DataDirect网络公司执行副总裁Jean-LucChatelain喜上眉梢——他曾在一年前做出预测,称到2014年NVRAM将成为高性能计算数据的主要存储层。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者