扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共3页)
I/O问题
SAN技术已经具备了良好的灵活性和开放标准基础,当下对于SAN的研究越来越多的集中于找到I/O和计算节点最佳性能的结合点。在2006年4月IDC举办的一个HPC用户论坛调查中,参与调查的用户们认为并行I/O带宽是需要解决的关键问题。从这些调查问卷中可以看到,几乎超过2/3的受访者表示,愿意对改进存储方案中并行I/O带宽的研究进行投资。而这份调查同时也显示,当下有许多不同的选择在这些HPC用户中得到采用。例如许多用户选择了万兆以太网技术,这一技术足以满足“服务器到服务器”和“服务器到存储”的解决方案,同样它还能实现跨越众多服务器和集群的连接。另一个I/O方案当然是使用SAN,因为这部分用户使用基于块的数据访问,再配以部分基于文件访问的NAS。
一个可能存在争议的结论是,InfiniBand技术为集群打开了一条实现巨型机I/O水平的通途。由于具备高通信效率、低MPI(并行处理接口)延迟和良好的带宽容量的优势,InfiniBand以可接受的成本实现了把应用扩展到数千个节点。
HPC需要一个能够连接处理器和I/O节点的高速系统,这个系统不仅具备卓越的本地I/O总线处理能力,还要有远程消息传输通道。而独立于主机操作系统和处理器平台的I/O系统也能有助于性能提升。SAN具有足够的便于管理的特性,从而能实现从共享池中动态定位存储——例如允许在没有数据迁移的情况下,实现平滑的服务器重置和替换。
另外,随着多协议结构控制器和虚拟I/O控制器的出现,使得把SAN添加到一个InfiniBand集群中变得更加容易一些。这些新的控制器能让InfiniBand结构上的服务器能够以接近透明的方式去访问光纤通道或者以太网络,并提供如下的关键优势:
提供服务器和存储、处理期间通信和LAN/WAN网络之间的虚拟连接
这就是一种“一线式”集群计算互联解决方案,它能让服务器和I/O能够获得几乎无限制的增长。
SAN的实例
集群上运行的软件通常是为了具备快速可扩展性和可重配置特性而开发,所以集群通常可以通过采用便宜的机架式服务器来简易地扩展。当镜像具备高可用特性时,分布式数据库能够通过跨平台的方式来提升系统性能水平。
对于现在的IT管理人员而言,必须保护并且管理由集群产生的数据——它往往是企业最关键的信息资产——而此时,共享的SAN存储无疑是理想的解决途径。
如果在部署和管理大规模存储时总需要专家和麻烦的操作流程,那么这样的方案肯定会昂贵到让用户止步。实际上,SAN允许服务器和存储之间实现更优越而实用的简便连接。
SAN方案令企业用户可以动态定位存储到正在使用的集群,以实现业务的连续运营;这样的方案能够保证,即使当磁盘被数据填满后,也无需产生业务延迟或停机,就能动态地保证业务连续性。
当数据存在于集群上时,存储设备被精确地定义大小和设计,以实现最优化的空间利用。过去,系统管理员在集群的服务器上,载入一个大应用时通常是冒了许多风险的,他会划给这个应用足够多的存储空间(或许这个应用可能不需要那么多),长此以往,这直接导致了子分区利用率和高复杂度的问题——即便如此,有时仍然不能保证足够的容量。
SAN的出现结束了这个迷局,由于采用一个共享的存储池,所以能够当一个应用在载入时,能够动态侦测并精确地分配给其以需要的存储空间。
SAN特别适合使用在运行科学计算和工程应用的大规模Linux 集群上,例如大学、政府和性能导向的行业就特别青睐这样的集群方案。当然,也不排除一些集群仍然采用低速共享I/O协议(如NFS),而低速的I/O将限制集群的处理速度和吞吐量。
SAN可以给集群提供毫无风险的高可用性。HPC可以通过共享备份架构访问光纤通道的SAN,结合阵列提供高容错性能、包括以RAID算法来保障整个方案不至于因为磁盘错误而崩溃。
比起基于LAN的备份方案或是在每个服务器上配置磁带库,那么采用共享访问的磁带库或基于磁盘的备份设备是更实用的解决方案。而光纤通道交换机和主机适配器的便利之处在于,它们能促使SAN的良好增长。
由于采用了4Gb的光纤通道接口,集中式的SAN备份和恢复方案可以节省大量的时间和金钱。SAN的出现,戏剧性地提升了备份和回复的性能,特别是比起基于100兆和千兆以太网的LAN备份方案。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者