8 月 22 日 2024 DTCC 大会上(第十五届中国数据库技术大会),XSKY星辰天合正式公布了基于星海全共享架构的星飞全闪软件定义存储的最新性能,单个卷(LUN) 可达 310 万 IOPS ,领先全球范围的“云硬盘”。根据各厂商披露的公开数据,这一性能是华为云极速型 SSDV2 的 12.1 倍,是阿里云 ESSD 的 3.1 倍,也高于目前尚在邀测阶段、基于阿里云全新一代云盘架构的 ESSD PL-X 。
当下,云计算仍然是企业主要的基础架构,随着关键业务的逐步虚拟化和云化,对于块存储的性能要求也日益提高。企业对于低延迟、高稳定性的存储解决方案的需求日益迫切。为了满足这些日益增长的 IO 密集型应用场景,众多云服务提供商正在不断推陈出新,推出具有更低时延和更高 IOPS 性能的云硬盘产品。
8 月 22 日 2024 DTCC 大会上(第十五届中国数据库技术大会),XSKY星辰天合正式公布了基于星海全共享架构的星飞全闪软件定义存储的最新性能,单个卷(LUN) 可达 310 万 IOPS ,领先全球范围的“云硬盘”。根据各厂商披露的公开数据,这一性能是华为云极速型 SSDV2 的 12.1 倍,是阿里云 ESSD 的 3.1 倍,也高于目前尚在邀测阶段、基于阿里云全新一代云盘架构的 ESSD PL-X 。
在吞吐率方面,星飞全闪同样表现优异,其单卷的最大吞吐率能够达到 15,000MiB/s,是华为云极速型 SSDV2 的 3.75 倍,是阿里云 ESSD 的 3.66 倍。
此外,星飞全闪存储采用端到端 NVMe 和 RDMA 网络,平均时延仅为 100 微秒,完全可以满足高性能 OLTP 的要求。
单卷性能主要关注的是特定逻辑单元的读写速度、响应时间、IOPS(每秒输入/输出操作数)等指标。它侧重于评估该特定卷在处理数据请求时的独立表现。
集群性能则是考虑整个集群系统的综合性能,包括多个卷以及相关的存储节点、网络连接等组件之间的协同工作效果。
对于某些应用,可能对特定数据的访问和处理有较高的要求。如果单个卷性能不佳,可能导致依赖该卷的应用出现明显的延迟、卡顿,影响应用的响应速度和效率。例如:
- 在线事务处理(OLTP)应用:如关系型数据库(MySQL、Oracle、Postgre 等)。这些应用通常需要频繁地读写数据,对存储的响应时间和 IOPS 要求较高。特别是对于关键的交易处理或数据查询操作,如果单个卷性能不足,可能导致查询延迟增加,交易处理时间延长,从而影响业务的正常进行;
- 虚拟化/云环境:在服务器虚拟化/云场景中,多个虚拟机可能共享存储资源。某些对性能敏感的虚拟机,例如承载关键业务服务的虚拟机,其数据所在的单卷性能至关重要。单个卷性能不佳可能导致虚拟机运行缓慢,影响整个虚拟环境的稳定性和性能。
因此,对应用来说,如果单个卷不能满足应用的性能需求,即使整个集群性能看起来不错,该应用的运行仍可能受到严重影响,导致用户体验下降,甚至业务流程受阻。
星飞全闪块存储适用于时延敏感型和 IO 密集型的场景,包括:
- AIGC:高性能训练和推理场景;
- KV 键值存储:如 RocksDB、Etcd 等,KV 存储业务常以串行 I/O 模式落盘,对每个 I/O 处理时延要求极高,单并发时延决定了系统的整体性能。星飞全闪块存储提供 100us 的时延表现;
- 中间件:如 Redis、Kafka;
- 大型 OLTP 数据库:支持千万级行表级别的 MySQL、Oracle、PostgreSQL、SQL Server 等中大型关系数据库应用;
- 大型 NoSQL:满足 HBase、Cassandra、MongoDB 等 NoSQL 业务对存储的性能要求;
- OLAP 数据库:Clickhouse、Greenplum;
- ElasticSearch:满足 ES 对存储低时延的性能要求;
- 大数据分析:提供针对 TB、PB 级数据的分布式处理能力,适用于数据分析、挖掘、商业智能等领域;
- 核心业务系统:对数据可靠性要求高的 I/O 密集型等核心业务系统。
目前仍有很多用户在众多分布式数据库场景中使用本地硬盘,但是这种方案的弊端很多:
- TCO 居高不下:基于本地 SSD 的服务器集群中的存储容量和性能利用率不均衡,资源浪费严重;
- 运维管理困难:服务器本地盘数量众多,缺乏统一的硬盘管理工具,无法自动预警和处理存储介质故障和亚健康问题,导致业务受影响时间长、运维成本高;
- 无数据服务:没有快照等数据保护服务。本地盘无数据冗余保护,可靠性低。
星飞全闪单卷不仅在 TCO、可管理性、可靠性上完胜本地 SSD 硬盘,而且读性能是 SATA SSD 的 31 倍,写性能是 PCIE 4.0 NVME SSD 的 8 倍,可轻松替代本地 SSD 硬盘。
应用也可以用多个普通卷来提高 IOPS 性能。但是使用多个卷也存在一些缺点:
- 增加管理复杂性:使用多个卷需要更多的管理和维护工作(比如使用 LVM 和 RAID),例如需要为每个卷配置存储参数、监控性能和管理数据;
- 降低存储利用率:每个卷都会有一些额外的空间用于存储元数据和其他管理信息,因此使用多个卷可能会降低存储利用率;
- 增加成本:使用多个卷可能会增加存储成本,因为需要购买和维护更多的存储设备。
使用星飞全闪,您只需要关注容量运维,性能运维将不再成为痛点。
在存储技术领域,通过 NVMe over RoCE 技术+SPDK+硬件堆砌,虽然可以实现高 IOPS 性能,但要同时达到高性能、高可靠性(100ms 故障切换)以及高得盘率(大比例 EC 和压缩),则需要依赖于最先进的存储架构和专利技术支撑。
XSKY 凭借过去 9 年在存储产品领域积累的深厚经验和对国内外最前沿技术趋势的深入洞察,精心打造了创新的星海全闪架构。这一架构不仅能够满足当前市场对高性能、高可靠性和高得盘率的严苛要求,更具备在未来十年内保持产品竞争力领先地位的潜力。
XSKY 刚开始在测试单卷性能时候,单卷最大随机读 IOPS 只有 100 万,最大随机写 IOPS 只有 70 万,基于星海全闪架构的先进性,XSKY 的研发团队只增加了 500 行代码,就让单卷最大随机读 IOPS 提高到 310 万(提高了 2.1 倍),最大随机写 IOPS 提高到 180 万(提高了 1.5 倍)。这足以证明星海全闪架构能够游刃有余地处理各种性能问题。
我们相信,在未来面对 256 核 CPU、400Gb/800Gb 网络、 PCIE 6.0 NVME 新硬件时,星海全闪架构也能够完美适配,充分释放硬件潜能,为用户带来更卓越的性能体验,为业务提供更全面、更可靠的支持。
欲了解星海全闪架构与星飞全闪产品的更多信息,欢迎扫描下方二维码,获取《 XSKY 星飞全闪技术白皮书》。