Q1、什么是分布式存储?
分布式存储将具有本地存储资源的标准服务器硬件,用高速网络连接,并通过分布式软件,聚合多个物理机上的存储空间并对外提供具有大带宽、并行 I/O、水平扩展、容错以及强一致性的数据存储系统。
典型的分布式存储具有三大技术特征:一、使用通用x86或ARM存储服务器;二、使用固体硬盘(SSD)以提升IO性能;三、软件定义存储(SDS),即采用分布式多副本/纠删码技术,实现数据保护、资源智能调配调、自动化运维和监控功能,实现存储资源的抽象、池化和自动化管理。其优势在于可显著降低总拥有成本、提高性能和 IT 团队的效率。
Q2、分布式存储与传统磁盘阵列的对比?
分布式存储与传统的集中式共享存储,俗称磁盘阵列,存在明显的技术差别。磁盘阵列,最主要的技术特征是RAID,即Redundant Arrays of Independent Disks,通过多个独立磁盘构成的具有冗余能力的阵列来实现数据保护。传统的RAID磁盘阵列,采用冗余的硬件控制器架构,具有延迟小、性能高、稳定性好的特点,但横向扩展能力较差;当硬件逼近生命期限时,需要更换全套设备并迁移数据。而分布式存储扩展能力更强,可方便地进行在线扩展或更换存储节点。但分布式存储存在延迟较大、性能较差、稳定性不够好的缺陷。
Q3、分布式存储市场的现状?
分布式存储是一个技术难度被显著低估的领域。随着HDFS、Lustre、GlusterFS、Ceph等开源分布式软件项目的兴起,一个普通软件工程师可以在一天或一周时间内搭建一个PoC分布式存储系统。包括华为、新华三、以及一些初创公司,在开源项目上优化,推出各自分布式存储产品,同质化现象严重,同时给行业带来假象,似乎分布式存储没有什么技术门槛。然而,无论是互联网公司,还是在企事业单位,由于使用分布式存储导致的业务中断、甚至数据丢失的报导屡见不鲜。
为什么(分布式)存储是一个技术壁垒很高的行业?这是由于存储最基本的核心诉求是数据不丢失、业务不中断。一个典型的存储系统包含上百万个电子元器件、上亿行软件代码,里面任何一个元器件老化失效、电子信号干扰、软件Bug、系统意外掉电,都有可能导致数据丢失。由此可见,要打造一个高可靠、高性能的分布式存储系统绝非易事。
三副本和EC纠删码是分布式存储中常见的两种数据保护机制。由于EC纠删码存在比较严重的写放大问题,小块数据的写性能严重不足,通常仅适用于视频、备份、容灾等对IO性能要求不高的业务场景。在虚拟化、私有云、数据库等块存储场景,最常见的是三副本机制,即数据块按某种随机规则,保持在三个不同节点上的不同磁盘上。
三副本分布式存储多节点硬盘损坏导致数据丢失
三副本分布式存储的数据可靠性可应对比较小的规模场景,但当存储规模扩大,或硬件老化时,系统可能出现两个、甚至多个磁盘同时发生故障的情况,可能导致业务中断和数据丢失。此外,由于数据修复依赖于网络带宽,网络的状态不稳定容易导致次生故障。因此,三副本分布式存储对运维的要求非常苛刻,隐形成本极高。
Q4、道熵分布式存储的技术路线?
针对三副本机制的弊端,道熵的铁力士分布式存储采用了双重RIAD机制,即节点内RAID与跨节点分布式两副本相结合,将磁盘阵列的本地恢复特性与分布式扩展特性融合,既有磁盘阵列的高可靠、高容错的特点,同时具备分布式横向扩展的优势。
双重raid容忍多节点磁盘损坏
基于铁力士分布式存储的优越性能,道熵可为企事业用户提供更优的私有云与统一存储解决方案,满足用户数字化与智能化业务对IT能力的持续增长的需求。
选择铁力士分布式存储,有以下六大理由:
1、业务更稳定、数据更安全
业务系统对连续性有极高要求,需要提供 7*24 的不间断服务,而数据中心一直面临着各种风险和挑战,包括停电、网络故障、硬件故障等问题,都有可能影响业务的连续性。道熵分布式存储采用双重RAID架构,采用节点内RAID数据保护与节点间副本保护相结合的方式。每个节点采用RAID10或RAID50/60 实现节点内的本地数据保护、硬件故障隔离、与本地数据修护。每个节点相当于一个小型的“磁盘阵列”,可抵御节点内单个、甚至多个硬盘故障。
这些“磁盘阵列”通过网络连接与分布式副本技术管理,形成一个可扩展的分布式磁盘阵列,保证在极端情况下,即当故障突破单台磁盘阵列的保护能力时,还可利用网络副本技术来恢复节点数据。正因为这种双层RAID保护机制,当节点硬件出现故障时,可以通过本地RAID对故障进行隔离,不影响业务正常运行。故障修复可以采用延迟修复的策略,自动避让业务,即当业务繁忙时,数据修复减慢数据;当业务空闲时,数据修复可以适当加快速度。
2、业务更敏捷、资源交付更弹性
在传统的 IT 架构下,为满足业务系统的资源需求,用户需要独立采购软件和硬件设备;一般需要经历:预算-测试-招标-采购-部署-应用上线等流程,整个过程复杂、耗时,很难达到业务快速上线的目标。由于IT基础架构资源往往是基于某个业务系统上线而建立,与业务系统有比较强的耦合关系,资源之间无法流动,容易造成信息孤岛以及资源利用率较低等问题。此外,基于资源建设缺乏通盘的考虑,导致运维管理与扩展成本比较高。
道熵分布式存储的显著优势之一就是业务更敏捷、资源交付更弹性。用户可通过Openstack、VMware虚拟化平台,K8s容器,或物理机,迅捷地上线业务,提高资源利用率。通过Web管理界面,将集群所有CPU、内存、网络、及存储等资源进行统一纳管,建设统一资源池,实现更灵活的资源划分与交付;上述资源具备“弹性伸缩”特性,可对资源进行生命周期管理,既可迅速扩展资源规模,也可及时回收“闲置”资源进行重分配。
3、性能突出的统一数据存储平台
道熵分布式存储采用分布式两级缓存加速技术,实现性能加速。一级缓存为延迟低的DRAM,二级缓存为大容量固体硬盘,最热的数据保存在一级缓存中,次热的数据保存在二级缓存中。采用自适应算法管理缓存中的数据,能自动适应复杂业务工作流的变化,智能识别业务中最近使用的数据和频繁使用的数据,将其保存在缓存中。每个节点可单独增加一级缓存容量,和二级缓存容量,也可通过增加节点来增加总缓存容量。铁力士分布式存储可管理的总缓存容量,可高达数百TB,是名副其实的分布式存储“缓存之王”,能满足用户对存储性能弹性、可扩展的需求。
基于双重RAID架构的铁力士分布式存储平台,具备磁盘阵列的高稳定、高性能的特点,以及分布式存储的弹性和高扩展性,可作为企事业单位的统一数据存储平台,替代传统的磁盘阵列。铁力士分布式存储支持几乎所有的主流存储协议和接口,包含FC、iSCSI/iSER、NFS、Samba、Openstack Cinder、VMware VAAI、K8s CSI、S3、FTP、SFTP等,以及大数据接口HDFS、高性能计算BeeGFS、并行文件系统CephFS等。
4、具有内置备份与容灾功能、性价比高
道熵分布式存储具备内置的定时备份功能,可对虚拟卷实现全量备份和持续增量备份,并支持备份数据压缩、去重以及数据加密。备份数据可保持在本地或异地的NFS存储中,同时支持备份数据保持在支持S3存储接口的公有云或私有云中。
道熵分布式存储支持伸展集群(Stretched Cluster)部署,即同城双活数据中心:将数据从一个数据中心(站点)扩展到两个数据中心(站点),以实现更高的可用性和容灾恢复。伸展集群通常部署在同一城市或园区之内,两个数据中心之间的距离通常不超过100公里,且有专用(或租用)的高速低延迟通信线路相连接。拉伸集群可实现站点维护计划以及满足容灾需求,因为一个站点的维护或意外丢失,无论是通信故障、意外掉电、火灾还是其他灾害,不会影响集群的整体运行。在拉伸集群配置中,两个数据站点都是活动站点,同时提供存储服务。如果其中一个站点发生故障,存储服务将自动切换到另一个站点。
当数据中心之间的物理距离超过100公里以上时,道熵分布式存储支持两地或多站点之间,通过异步复制技术手段实现远程容灾与恢复。其原理非常类似数据库如PostgreSQL或Mysql的主从同步机制,基于日志回放(replay)实现本地站点和远端站点数据同步。基于异步复制的远程容灾与恢复方法,可实现RTO < 数分钟,RPO 约等于零的容灾保护级别。
道熵分布式存储还具备存储虚拟化网关功能,可针对异构存储系统,实现统一数据管理与容灾备份管理,并可实现连续数据保护功能。
5、业务更稳定、数据更安全
在分布式存储的演进过程中,系统中可能会同时存在新增硬件和老旧硬件,而老旧硬件的故障率通常远高于新增硬件,这对分布式存储的数据可靠性提出了更高的要求,即要求分布式存储具有更强的抵御硬件故障的能力。而常见的三副本分布式存储,在存储规模稍大,存在硬件老化现象的情况下,系统同时出现两个或以上硬盘故障的概率不可忽视,可能导致系统崩溃或数据丢失。
双重RAID架构,由于每个节点都具有本地RAID数据保护,可容忍的故障硬盘数目随节点增加而增加,可持续对硬件生命周期进行有效管理。当系统需要扩容时,可以在不停止业务的前提下,通过增加节点给存储加增CPU计算能力,内存,SSD,机械硬盘,以及网络资源,且能够实现数据自动迁移与平衡。同时,系统可以在线对故障硬件或老化硬件进行更换,甚至剔除整个节点。通过持续增加新硬件,剔除故障或老旧硬件,从而提高硬件的生命周期,有效降低硬件采购成本。
6、故障隔离与自动化运维能力强
在传统架构下,随着 IT 规模增大,数据中心将引入更多不同的设备以及技术,这无疑增大了运维的复杂性,使得企业的 IT 人员经常上演“消防员”角色,即便是这样也难以达到“不间断”运行的目标。
道熵分布式存储的节点内RAID功能,不是采用常见的硬件RAID控制卡来实现,而是通过功能更强大的存储虚拟化管理(Storge Virtualization Manager,SVM)来实现。SVM不仅实现了RAID10/50/60等RAID功能,而且具备池化管理和IO负载均衡能力,IO工作负载均匀分布在节点内所有磁盘上。SVM具备在线数据完整性校验和数据自修复功能,对硬件故障进行在线监测和有效隔离,即使在硬件老化时仍然能保证数据安全;功能强大的Web管理页面具有专门的自动化故障诊断模块,通过图形可视化收到实现监控各种运行状态,包括CPU、内存、网络、IOPS与带宽指标,同时具备对磁盘监控状态、网络、电源、主板等硬件的故障监控、报警、及自动化诊断功能,使得整个系统的运维与管理变得简洁直观。
好文章,需要你的鼓励
后来广为人知的“云上奥运”这一说法,正是从这一刻起走上历史舞台。云计算这一概念,也随之被越来越多的人所熟知。乘云科技CEO郝凯对此深有感受,因为在2017年春节过后不久,他的公司开始成为阿里云的合作伙伴,加入了滚滚而来的云计算大潮中。同一年,郝凯带领团队也第一次参加了阿里云的“双11”活动,实现了800万元的销售业绩。
随着各行各业数字化变革的不断深入,人类社会正加速迈向智能化。作为智能世界和数字经济的坚实底座,数据中心也迎来了蓬勃发展。面