每年被创建、采集或是复制的数据集合就是全球数据圈,2018至2025年全球数据圈将增长5倍以上。IDC预测,全球数据圈将从2018年的33ZB增至2025年的175ZB。
全球数据圈增长的主要驱动因素在世界各地基本保持一致,但各地的增长速度有所不同。娱乐数据和视频监控图像长期以来(并将继续)是全球数据圈的重要推动因素。然而,物联网(IoT)设备信号、元数据(对分析、情境化和人工智能至关重要)和生产力数据在当今日益数字化的世界中增长速度更快。
然而,相似之处之外,各地区还存在着微妙的差异。这些差异取决于某地区的消费者和企业的技术采用和数字化转型情况。
中国数据圈增速最为迅速,平均每年的增长速度比全球快3%。2018年,中国数据圈占全球数据圈的23.4%,即7.6ZB。预计到2025年将增至48.6ZB,占全球数据圈的27.8%,中国将成为全球最大的数据圈。与全球动态相似,中国数据圈将受到来自物联网设备信号、元数据、娱乐相关数据、云计算和边缘计算增长的驱动。越来越多的物联网设备在数据的创建位置处理并分析原始数据,以及建筑、桥梁、智慧城市等智能基础设施利用边缘设施和计算来赋能实时世界,在中国数据圈,边缘创建和复制的数据所占比例几乎翻了一番——占比将从数据总量的13%增加到23%。
更多关于IDC:2025年中国将拥有全球最大的数据圈报告的信息,请参考:https://www.seagate.com/files/www-content/our-story/trends/files/data-age-china-regional-idc.pdf?tdsourcetag=s_pcqq_aiomsg
好文章,需要你的鼓励
英特尔携手戴尔以及零克云,通过打造“工作站-AI PC-云端”的协同生态,大幅缩短AI部署流程,助力企业快速实现从想法验证到规模化落地。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。