《失控》《必然》作者凯文·凯利(KK)认为科技趋势性是这样判断的。比如电话的出现是必然的,但不一定是苹果iPhone;互联网发展是一种必然,但是推特的出现是无法预料的。如此看来,今后数据增长是必然,但是围绕数据崛起的厂商是无法预料的。同时机遇和挑战并存,谁更能洞察数据,谁将引领未来。近日,国际数据公司(IDC)发布的白皮书《数据时代2025》(希捷赞助)预测2025年,全球的数据信息总量将会升至163ZB,是目前的10倍之多。同时围绕白皮书,希捷科技全球部总裁暨亚太和中国区总裁孙丹女士和IDC移动、安全、消费电子、半导体、电信、客户端计算和图像/打印/文件解决方案高级副总裁David Reinsel解读白皮书并接受至顶网在内的媒体采访。
这里的163ZB(1ZB指的是1百万PB)数据是指在一年内全球所有被采集、创建和复制的新数据。这其中涵盖了包括各个行业的50余种内容创建/内容采集设备。
数据量的爆炸式增加是因为今后数据的实质在改变,从互联网到移动互联到社交再到IOT/VR,单一设备的数据流从MB到GB再到10TB以上。IDC给出的答案是数据增长的驱动因素是从人到物的变化,同时报告认为数据的爆炸式增长来自全新的存储领域,包括新设备、嵌入式系统和物联网、云、安全和监控系统、认知系统和大数据分析以及即时及实时数据流。
消费者终端数据将会持续增长。但未来十年终端数据的增长将主要依托嵌入式设备和物联网。而大数据分析和云将会推动核心和边缘数据的创建。IDC还认为2025年,全球企业创造的数据将占到163ZB的60%。这些数据包括传统数据中心以及云数据中心核心数据和企业级设备里面的边缘数据。
数据存储的必然性,是因为数据的不可预测性。没有人能够知道未来哪些数据是重要的,所以需要尽可能更多的存储数据存储,然后在挖掘数据价值。这必然带动存储介质、存储管理、数据分析等产业的蓬勃发展。孙丹认为我们必须理智的看待数据的存储,如何我们知道哪些是需要的数据,哪些是不需要的数据,那么存储效率就会非常高。但是事实上,冷数据、热数据、温数据都是数据产生之后才发生的。是不可预测的。因此站在数据价值的角度看,从海量数据挖掘有价值的数据是大数据专家要做的事情。前提是你必须有海量的数据。而成为大数据专家也不是一个简单的事情,首先大数据专家应该是数学家,同时还必须了解每个行业、特定公司的需求。“如果不了解业务,数学家建立的模型就有可能南辕北辙,该存的数据没有存储、不需要的数据存储起来。但是动业务的又不会算法。这也是未来机器学习、人工智能的一个优势,就是未来可以智能化的建立一个正确的模型,对数据存储的效率会有很大的提升。”
David Reinsel和孙丹共同的观点是认知系统、分析和人工智能需要元数据。未来80-90%的数据都是非结构化数据。对像照片、视频、录音、音乐等非结构化数据,未来要做的就是给这些非结构化数据以一定的结构,比如说元数据,数据的数据,要捕捉的就是关于数据的信息,就像监控数据也是非结构化的,它是对实时信息的捕捉,在捕捉过程中同时要有相应的软件进行视频内容的分析,比如你在寻找视频中出现的红色物体,蓝色汽车,或者是戴蓝色帽子穿黄色衬衫的人,这个是有相应的管理软件来做。孙丹谈到希捷跟安防企业研究过数据分析和存储。安防的视频是非机构化数据会存在存储端,但是做智能分析的时候,一定要结构化数据,所以相当于把非结构化数据做一个索引,实际上把非结构化变成结构化以后,结构化数据是在后台做数据分析的。所以结构化和非结构化数据都要存储,但是分析的时候是结构化,是把非结构化数据变成标签化的结构化数据进行分析。所以对于所有非结构化数据的结构化的分析就可以影响在未来的商业模式,也会影响我们的生活。
数据带来的全方位的变化,包括在后端做云的数据分析企业级客户,还是前端的消费者用户,其实需求确实是在改变。这对像希捷这些提供解决方案的厂家带来新的机遇和挑战。这也是希捷和IDC合作推出白皮书的原因。通过白皮书让整个行业了解数据发展趋势在哪里,哪些是驱动这个领域发展。
对于希捷来说,孙丹认为技术创新和业务模式创新是希捷最大的突破口。比如说前端用户希望数据是延时越来越小的实时数据,包括无人机的数据从上面拍下来,实时在电脑就可以看到。这方面希捷和无人机厂商大疆联合开发的专为无人机视频/图片专业拍摄人员野外拍摄定制的存储解决方案。业务模式的创新,希捷不断帮助数据中心降低管理成本,降低运维成本帮助企业很快的诊断数据中心的电力、安全等方面,降低管理成本,这些希捷有很多的经验。希捷不是只做一个产品,给你提供一个硬盘或者是SSD,而是有更多的根据客户需求的变化,给他更多的解决方案。
比如安防领域,希捷与包括海康威视、大华科技、宇视科技等国内领先的安防系统供应商通力合作,来共同推进中国智慧城市的安防系统建设。
通过两位嘉宾的访谈,我们认识到,到2025年全球大概产生163ZB的数据,可能存储的数据1%都不到。这还是随着人工智能、机器学习、各种大数据专家建模、分析不断进步的结果。只有做出正确的智能分析,才能让数据存储更有效。未来企业的竞争力就是面对海量数据浪潮的时候,在保证数据的安全和用户的隐私情况下,能够按照数据的重要程度进行分析,最终分析提取到最珍贵及最重要的数据。那么企业的竞争力就凸显出来。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。