日前,IDC正式公布2018年第一季度《中国企业级存储系统市场调查数据报告》。数据显示,2018年第一季度存储出货容量达4,097.9PB,同比增速102%。浪潮存储出货容量389.4PB,居中国市场第一,出货量增速162.7%,以六倍业界的增速引领市场。
智慧驱动新数据时代
在智能时代驱动下,存储要面对云计算、大数据、人工智能等新应用。一方面半结构化、非结构化数据呈现持续爆发式增长,另一方面数据之间的智能交互和融合提出更高需求。比如阿里推出的刷脸支付,将生物识别技术首次提高到了商用级别的精度。又如,郑州铁路公安开始使用人脸识别墨镜保障春运安全,对人像识别的响应速率达到了毫秒级,极大地提升了安防效率。
智慧驱动的新数据时代,表现出数据存储新常态。一是PB成为通常的测量单位,一些行业甚至开始出现EB、ZB级存储需求;二是存储性能要求更高,某些核心应用已经要求百万级IOPS、TB级带宽;三是对数据的智能管理和流动提出高要求,需要对几百个乃至更多的数据存储节点提供一体化管理运维并保障数据流动。
PB新常态 落地系列PB大工程
在数据动辄PB级的时代,浪潮存储在Scale-up和Scale-out两大架构基础上不断进行创新和产品迭代,以满足企业级应用对数据的"容量+可靠性/高性能"需求和AI、大数据、云应用对数据的"容量+多类型数据融合"需求。
基于Scale-up架构重构的浪潮智能存储G2系列,具备三高优势。目前浪潮智能存储G2中标广东省高级人民检察院项目、25PB华中科大脑科学研究项目、重庆国土项目,金额都达到千万级。
同时基于Scale-out架构的浪潮海量存储系列,可融合多类型数据。在"All in One"架构下可支持文件、块、对象和大数据四种数据服务。浪潮成功部署实施了大量PB级大工程,在中国移动分布式存储集采中获得30%份额,预计容量会超过50PB;在某卫星项目实现中国最大规模的软件定义存储部署,达到单系统239个节点、70PB容量;在广电总局,AS13000持续部署超过10PB容量。
新应用需求 百万级IOPS性能
伴随数据规模的指数增长,对数据实时处理的要求更加苛刻,呈现百万级IOPS、TB级带宽性能要求。如大数据或者AI应用,十亿或者百亿的文件构成一个庞大的数据链,而如此庞大规模的数据,业务却需要能够实时响应。比如平安城市中,除海量超高清视频流并发吞吐外,强调图帧动态抽取、人脸识别等新兴应用,需要大数据实时分析能力支持。
前不久进行的浪潮软件定义存储AS13000模拟真实业务环境的测试震撼了业界,整个集群裸容量达到72PB,共288节点,其中元数据集群128节点,系统实测性能达到380万IOPS、324GB/s聚合带宽,性能可随节点规模的增加而呈拟线性增长。
新技术、新应用刺激数据存储演进
IDC预测,到2025年全球数据规模将达到163ZB。数据爆炸式增长的趋势下,容量(裸容量/可用容量)扩张将成为各行业、各组织的长期需求。政府、金融和通信行业仍将是主要投资者,而教育和医疗行业则显示出巨大的潜力。同时,新技术、新应用将极大刺激存储演进,据IDC研究,云存储已引起政府、通信行业客户的广泛关注,大型企业的数据中心升级产生了对存储虚拟化的大量需求,同时全闪存阵列预计将迅速增长,以提供数据密集型解决方案。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。