作者:Hitachi Vantara对象存储技术专家 陆骁
互联网的飞速发展不但带动了科技的飞速进步,也推动了各行各业的发展,进而产生了庞大的数据量。IDC在其发布的《数据时代2025》白皮书中预测,到2025年,全球数据圈将扩展至163 ZB。同时,该白皮书指出了数据时代发展的五大关键趋势:由商业数据向生活关键型数据的转化、嵌入式系统和物联网的广泛应用、移动和实时数据增多、认知/AI系统改变格局、安全成为一种重要的基础。这些趋势加剧了数据规模呈爆炸式增长、要求生产处理更加实时化和智能化并加速了数据上云。
IDC在该白皮书中指出,随着无线宽带和高速网络的普及,数据正大量涌入云端,促使数据中心从内部扩大至采用微软等大众化服务的云基础设施。同时,个人电脑、智能手机和其他消费电子产品以及嵌入式设备等边缘终端的兴起,对数据的处理和分析也提出了随时和直接的需求,推动了边缘计算平台的高速增长。
分布式存储,是边缘计算平台的重要组成部分。分布式存储具有高扩展性、高效作业等优势,迎合上述关键趋势的发展,预计该市场将持续增长。赛迪顾问电子信息产业研究中心分析师预测,分布式存储市场将在2025年增长至211.4亿元。HPC(High Performance Computing,高性能计算)、内容存储和备份归档、大数据分析、云/虚拟化等场景需要分布式存储,亦加速了该市场的增长。
企业分布式数据管理挑战重重,HCP Anywhere Enterprise应时而生
在企业发展的初期,数据挑战可能并不明显,往往少量存储设备,甚至一台NAS存储就能解决大多数和文件存储以及共享相关的问题。但是,随着规模逐步扩大,企业将面临更加严峻的数据挑战;特别是当拥有分支站点之后,企业如何管理多个站点和总部之间的分布式数据便会成为难题。通常情况下,企业会在总部或数据中心部署核心存储,并将企业内部所有数据都放在该存储上,并不断地对其进行扩容。除在核心站点部署比较大的核心存储设备以外,企业还会在边缘站点或者其他部门等较大的分支站点部署较小的NAS存储。然而,这样的存储布局便可能会为企业IT部门带来各种各样的问题。
当设备数量增多后,单台存储设备会形成孤岛,进而在数据保护、跨部门的数据共享、跨站点的访问控制、防勒索软件和病毒防护等方面带来挑战。此外,也有许多企业选择将全部数据放置于公有云上。然而,当数据迁至云端之后,如何确保数据的保密性和安全性,以及如何防止网络问题影响数据访问性能等等连带问题也将引发更多挑战。
为帮助企业应对棘手的挑战,Hitachi Vantara 应时推出 HCP Anywhere Enterprise (HCP AWE),这是一款能够提供安全的、从边缘到核心的云文件服务,为企业提供文件共享和文件管理功能。
HCP AWE的整体框架
HCP AWE提供安全的、从边缘到核心的云文件服务,助力企业应对挑战
为了解决行业用户在更多边缘计算的应用场景中遇到的困难,也为了简化边缘计算的复杂性,提高系统的可靠性,以及帮助用户充分利用边缘计算的优势,HCP AWE实现了多项突破。
首先,针对数据孤岛挑战,HCP AWE的单一命名空间和全局缓存功能能够最大限度地提高存储效率,消除数据孤岛。通过单一命名空间的文件共享和网络,企业能够将云网关和个人云盘之间的数据打通,实现内部文件的双向同步。
针对数据扩展问题,HCP AWE支持横向扩展到PB级别的数据和上千个边缘站点,集中到数据中心实现多租户企业级数据管理;内嵌的文件迁移工具,支持从NAS和文件服务器迁移数据。
针对数据的安全性保护,HCP AWE能够提供全生命周期的数据安全性保护并为企业提供主动的勒索病毒预防。在边缘站点,企业通过HCP AWE激活本地内置的防病毒软件功能,在任何数据写入和读取的时候,对数据进行病毒扫描。在数据中心的门户端,通过HCP AWE内置的杀毒软件,企业能对所有的边缘站点以及个人用户的数据访问,做实时监控。同时,HCP AWE平台也能与企业内部的主要防病毒服务器集成,帮助企业利用现有的杀毒软件进行病毒防范工作。此外,HCP AWE还集成了保护数据免受内部威胁和网络攻击的领先提供商Varonis的软件,能够为所有用户的数据访问和共享做更为全面、细致的分析。
HCP AWE集成Varonis公司的Data Security Platform
在节省成本方面,HCP AWE进行数据重删能够减少65%的网络流量、边缘和数据中心的存储空间;缓存机制能够帮助企业减少80%的边缘基础架构;DevOps SDK提供可编程APO实现功能定制,降低总体拥有成本。此外,HCP AWE的多云架构,没有硬件绑定,且内置数据迁移工具。
HCP AWE适用场景广泛,满足用户多项需求
HCP AWE是一个基于企业内部的、整体的、单一的平台,能够管理企业内部的所有非结构化数据,适用于企业内部许多场景,能够实现数据的管理和共享。例如,HCP AWE适用于多分支机构、多站点或多部门之间的数据存储和共享访问;用于远程办公场景,员工可以通过个人云盘的方式来访问个人数据;用于边缘计算方面,包括高性能、云的扩展性、超融合平台等;此外,HCP AWE也在金融和医疗等行业发光发热,帮助企业搭建非结构化数据平台和影像数据湖。
事实上,目前HCP AWE已帮助许多企业解决了分布式数据管理方面的挑战。例如,某全球领先的、专注于电子数据归档的企业,其主要客户群是银行、保险企业等。该企业需要将文件合同、收据等纸质档案扫描成电子档案,然后放置于存储设备进行长期保存。在过去,该企业将纸质文档全部收集后,用车运送到数据中心来进行统一处理。当其业务扩展到几十个城市后,这种传统做法便会产生大量的运输成本。于是,该企业采用HCP AWE,实现了分站点的数据上收,再在总部对数据进行集中处理。现在,该公司业务规模已经扩展到了整个欧洲、美洲和部分亚洲地区,在全球的数十个国家建立了数百个站点,每天自动扫描和归档数百万份纸质文件。
写在最后
物联网、云计算、AI等技术的发展,以及移动互联网和社交媒体的深入应用,加剧了数据量呈爆炸式增长、数据类型愈发多样。企业对数据合规和数据安全的要求越来越高,对数据即时处理和分析的需求也越来越多,这就推动分布式存储迎来高速增长期。未来,随着千行百业数字化转型的深入,我们相信分布式存储的作用会愈发凸显,HCP AWE以及HCP解决方案的其他产品将会在更多行业和业务场景中发光发热。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。