为什么道熵分布式存储是PACS存储的更优选择

道熵分布式存储是业界率先实现无人值守自动化运维与数据自修复的分布式存储,采用双重RAID数据保护机制,具备高容错的Fail-in-Place特性,是PACS医疗影像存储的更优选择。

前言

道熵分布式存储是业界率先实现无人值守自动化运维与数据自修复的分布式存储,采用双重RAID数据保护机制,具备高容错的Fail-in-Place特性,是PACS医疗影像存储的更优选择。

一、医疗PACS影像存储现状 

医院存储的数据80%-85%来自于影像数据,随着医疗影像设备的激增、拍片设备单次拍片量的增加,以及拍片设备分辨率的不断提高,医院的医疗PACS数据量预计每年增长15%,五年翻一番,并呈加速增长的态势。PACS系统所收集的B超、X射线、CT、核磁等影像数据飙升,三甲综合性医院或胸科、肺科、骨科等三甲专科医院,一年的新增拍片量在50TB ~ 60TB。并且,根据国家电子病历保存相关规定,医疗机构保管保存医疗影像数据时间要求不少于15年。无论是从业务发展还是合规要求方面,医疗影像数据的存储都对存储系统提出了更高需求。

目前医院的医疗PACS数据普遍采用传统阵列存储FC SAN或NAS,并采用在线、近线、离线的三级存储架构。这种PACS存储架构普遍面临以下问题:

1、性能/容量扩展困难

PACS影像的典型特征是大部分文件都是小文件,其中MR文件平均大小为60KB左右;CT文件平均大小为300KB左右,也是小文件。长期以来,小文件存储都是存储系统面临的挑战:小文件读写性能低,且当存储的文件数量增多时性能会不断下降。

目前在线存储使用传统阵列存储系统时,PACS图像调阅的速度最快仅为每秒80幅左右。典型的MR检查,平均每次检查产生约3000~5000张小图片,调阅图片需要数十秒以上;在大型医院的业务高峰期,数百位门诊、临床医生同时阅片时,对存储系统产生高并发访问,阅片等待时间更长。

2、系统架构复杂、数据访问不便

三级存储架构下,PACS影像数据分散保存在三套不同的存储系统中。这会导致以下问题:

在患者进行复查时,医生需要调阅半年前或一年前的检查影像,这些影像位于近线存储中,需要将这些影像先迁移到在线存储中再调阅,操作繁琐,难以让医生立即调阅。

三级架构导致的数据隔离,难以将积累的大量PACS数据用于如AI辅助诊疗、影像数据分析与影像智能诊断等科研活动,使数据价值难以充分发挥。

不同存储系统之间的数据难以统一管理,数据迁移工作繁重。

3、总体拥有成本较高

传统中高端磁盘阵列存储设备的购置成本较高,尤其是后期扩容成本难以控制。此外,分级存储带来的数据迁移工作量巨大,三套存储的运维也增加了医院信息中心的运维成本。

二、道熵分布式存储在医疗PACS上的应用优势 

道熵分布式存储是一种具有Fail-in-Place高容错特性的阵列式分布式存储,每个存储节点是一个RAID阵列,通过分布式技术将多个RAID阵列融合为一个统一的存储平台,同时具备磁盘阵列高性能、高稳定性与分布式存储的高扩展性、易管理的特点。

道熵分布式存储相对于传统阵列存储,在大规模在线扩展、百亿级小文件管理、高性能数据吞吐、敏捷化运维管理、TCO成本优化等方面具有明显的技术优势,可以有效解决目前医疗PACS在存储上遇到的性能瓶颈、数据孤岛、运维困难、成本较高等问题,成为医疗机构存储架构的更优选择。

数据安全性

道熵分布式存储采用双重RAID架构,同时具备节点内RAID保护和节点间副本双重保护机制。而无论是传统磁盘阵列还是三副本分布式存储,都只有单层数据保护,因此数据安全性比同类产品高出一个数据级。

为什么道熵分布式存储是PACS存储的更优选择

存储硬件错误类型非常多,包括磁盘坏道、Firmware bug、静默错误导致数据损坏无法及时发现、电压不稳定导致数据未写入但返回成功、SSD长时间下线导致数据丢失、网络传输错误导致数据通过网卡后产生bits反转等。

道熵分布式存储通过对每个数据块产生一个256位校验码,作为数据块的元数据分开保存,并在数据读出时进行校验,并利用RAID功能对数据进行自修复。双重RAID机制结合数据自修复功能,可确保医疗影像数据最少保存15年而不损坏。

性能提升

道熵分布式存储对PACS应用场景进行了针对性优化:PACS影像文件的大小集中在32KB或以上,因此道熵在存储底层采用32KB块大小来匹配工作流,每个小文件的读写只需消耗1到2次读写操作,使得其性能显著高于传统存储和同类分布式存储。

PACS影像数据具有典型的双模工作流特征,即数据在刚产生时的一段时间内属于热数据,要求迅速读取,而当热数据冷却后虽然极少访问却需要长期保存。道熵分布式存储采用高速度的固态硬盘(SSD)来保存热数据,采用大容量的机械硬盘(HDD)来保存冷数据,并通过智能缓存算法,自动识别并管理热数据。每个存储节点可在线增加SSD缓冲容量,以提升性能。

统一存储平台

道熵分布式存储可同时提供块存储、对象存储、POSIX文件系统以及大数据分析存储等,并实现各种数据存储的统一管理。支持FC、iSCSI、NFS、Samba、FTP、SFTP、S3、HDFS、Openstack Cinder/Nova/Glance、VMware VAAI等多种存储协议,除了支持PACS医疗影像系统,还可支撑医院信息系统HIS、实验室信息系统LIS、电子病历EMR、临床信息系统CIS等医院多种业务系统。

按需扩容,持续演进

道熵分布式存储采用分布式元数据管理,使扩容变得极为简单:只需要通过加入新的硬盘或者服务器即可实现扩容,支持设备内增加任意数量的硬盘,性能随存储节点数线性提升,数据的迁移通过集群内部高效率的完成,用最少的操作步骤将业务影响程度降到了最低。

使用道熵分布式存储后,原来在线、近线、离线三层架构简化为一套存储,所有PACS影像都可在线调阅,并且调阅性能无差异,消除了PACS数据孤岛,有效支撑影像大数据分析、AI辅助诊疗等科研和新兴业务需求。

道熵分布式存储支持持续性硬件生命周期管理,可在线更换老旧磁盘、老旧服务器等硬件,而不影响业务连续性。新增的服务器品牌、种类可以不同,支持异构扩展。存储硬件的升级换代,只需要通过将新节点上线、旧节点下线、数据自动迁移就能实现,无需人工数据迁移。

运维简化,成本节省

道熵分布式存储实现了无人值守的自动化运维,具有自动化报警、自动化故障诊断和极强的自我修复能力。支持平滑的在线扩容能力,使随需扩容成为可能。

由于PACS影像数据量在快速增长,同时PACS影像按合规要求保存的时间更长,PACS影像数据的存储成本问题逐渐显现出来。采用性能和扩展性更高,TCO成本更经济的分布式存储将成为越来越多医联体或大型医疗机构的考虑方案。

来源:至顶网存储频道

0赞

好文章,需要你的鼓励

2021

05/12

14:09

分享

点赞

邮件订阅
白皮书