特殊的2020年在前行,其不确定让我们愈发期待智能世界的到来。对于关注数据基础设施的企业和个人来讲,一个万物互联,万物智能的世界,需要一个怎么样的数据基础设施,成为大家思考的问题。
人真是适应极快的,进入4月份在线采访已经稀疏平常,昨天华为云与计算BG副总裁,数据存储与机器视觉产品线总裁周跃峰接受了至顶网等媒体的在线采访。就华为OceanStor存储的战略布局、研发能力、技术创新,客户实践等方面进行了深度分享。
看到华为业务线的整合变化,于是一个词出现在我的脑海里,“共鸣”。就是面对数据智能的发展方向大家有一个相同的看法。2019年8月,我基于对内蒙古白塔国际机场在安检、验票等AI系统的体验有感而发的短评《计算机视觉这只“蝴蝶”能否引起智能应用大爆发?》一文,认为计算机视觉将加速AI应用落地。
看到华为大投入的对计算视觉的基础研究,并把数据存储与机器视觉产品线的结合是对海量数据和万物识别结合从而向知识智能进化的前进方向,感到兴奋。
全球正在进入数字经济时代,数字化正在改变各行各业,我们看到从智慧交通到自动驾驶到智慧工厂都会产生海量的数据,深圳目前200万摄像头平均每天产生80PB的数据量,这些数据平均要存储30天;自动驾驶汽车每天要对海量的数据进行训练从而让自动驾驶更加聪明。因此数字化面临的巨大挑战就是海量的数据如何被采集、存储和应用。
面向数据构建“采、存、管”能力,破解企业数据管理难题
“从软件定义摄像头、智能协作的智真会议系统、企业智慧屏等数据采集终端,到存储海量数据的分布式OceanStor Pacific存储,高性能的OceanStor Dorado的存储,实现数据的全生命周期管理,从而发挥数据作为生产资料的价值。”周跃峰表示新的产品线让华为能够围绕数据的采集、存储、治理、管理来为企业和政府的数据赋能。
大家可能会问,华为存储目前有这么大的技术实力吗?要让数据来说话,其实华为公司在数据存储的投入已经近20年的历史了,到今天有4000多个工程师在做研发,并积累了很多专利。而且根据Gartner最新市场研究报告显示,2019年华为存储排名全球第四、中国区第一,全闪存存储连续8个季度保持全球第一的高速增长,继续保持年度31%的全球第一高速增长率。
华为存储进阶图,通过持续的技术创新和研发投入逐步成为全球存储领导者。
在最近流行的任正非关于人才的看法是,选人要简单,“简单不是头脑简单,而是思想简单,心里不长草,唯有目标和效果。”
在我看来华为存储取得的成绩就是战略透明“不长草”,技术投入“不长草”, 对于华为存储取得的成绩,战略上透明,就是持续的投入和创新,存储技术的核心是创新,在面向核心业务场景的高端存储市场,华为是世界上能够研发高端存储三个厂商之一。
华为存储的发展没啥窍门
“实际上在华为公司很多领先的产品之所以能领先也没有什么特别的窍门,无非就是投入和持续的创新。”周跃峰谈到。
在我看来,没啥窍门就是最大的窍门,华为每年在研发上的基础投入巨大,在存储方面投入了大量的芯片技术,周跃峰首次透露一个信息说明华为在存储领域的研发力度,目前华为推出的企业级高性能鲲鹏芯片,最早是为存储设计的,在实际应用中发现性能非常好,于是成为目前华为的重要引擎。
华为是目前业界唯一自研存储控制器、SSD盘和存储芯片的厂商,通过在控制器、硬盘框和SSD三个层面实现深度配合,结合软硬融合设计理念的FlashLink 2.0技术,打造2000万IOPS的性能标杆。华为还积极在中国引入SPC性能测试标准,来推动华为存储的创新和发展。华为存储从可靠性来说,是全球唯一一个能够容忍九级地震考验,而且能确保业务持续在线的存储。
同时从客户数据需求的实际出发,来进行创新,大家知道随着数据量的增长,要求IT系统处理效率同比增长,但数据量成倍增长情况下,存储系统成为时间的瓶颈,因此要求更高的并发处理能力,及更低的处理时延成为需求。比如中信银行要实现核心业务、网银、信贷系统 、信用卡等数据源的整合步骤,来实现经营分析、产品管理、风险控制和监管报送,这些数据需要的时间越少越好,采用华为OceanStor全闪存,实现了在闲暇时间进行数据整合,从7小时缩短到3小时,确保夜间闲时完成,不再影响营业后的大数据分析与决策工作。
专有硬件是数据存储的基础
对于存储系统来讲,芯片、存储介质和操作系统最重要,华为有鲲鹏芯片、有自研的闪存存储,有保证高可靠性的SmartMatrix架构以及智能的数据管理系统。这样华为存储基于华为鲲鹏、SSD控制器的自主研发,稳定可靠的架构,智能的数据管理系统,实现了包括数据库在内的结构化数据和包括网页、图片、视频等半结构化、非结构化数据的融合管理。
华为OceanStor全闪存存储能够对高性能数据处理的需求,华为OceanStor分布式存储系统能够对海量数据存储的需求。在线上采访中,周跃峰透露今年华为要针对HPC领域的存储需求,推出创新的产品。“因为HPC的需求量非常大,像基因检测、芯片制造需要高速的数据计算,同时HPC的数据量特别大,对数据的处理能力和存储能力有新的需求。”
当然华为存储的技术和研发目前最基本的前提是为客户提供一个高可靠的产品。因此我们也看到从华为的产品布局我们看到,华为对于存储策略的认知就是专业化。包括针对核心业务推出的全闪存系统,包括针对海量数据推出的分布式存储系统,以及包括即将推出的HPC领域的存储系统。
周跃峰认为数据存储需要专有硬件去支撑,因为服务器的维护与存储维护两码事,当通用服务器和分布式软件结合作为专业的存储使用时,反而让存储的管理更复杂。
一方面,软硬解耦降低了存储的使用门槛,用户可以DIY,但商用特性的缺乏,带来性能调优、故障定位、生产运维等都需要大量的学习成本,从这个意义上来讲是安装简单、使用复杂。
另一方面,用户面向不同场景的硬件很难归一化,比如计算型配置、存储型配置、均衡型配置,需要配置更多类型和数量的设备,同时需要遵循木桶原理,一个池的硬件尽量要保持一致,这些同样带来维护的复杂,让业务上线并非一帆风顺。
第三,软硬解耦还给客户带来了大量维护的负担。首先是部署时,需要协调软、硬件厂商的档期;使用期间,出现问题时厂商互相推诿;兼容性问题,软硬件厂家谁是第一责任人;并且由于来自不同厂商,软件无法对硬件进行全面的管理,反而带来更多的问题,导致软硬解耦恰恰是维护最复杂的一种模式。
所以华为更加推崇的是专用硬件,无论是分布式存储还是集中式存储、边缘存储,都希望通过专用的硬件里面运行高质量的软件来实现让客户的运维效率最高,让客户能够享受到最高的可靠性。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。