日前,中共中央政治局就实施国家大数据战略进行第二次集体学习。至顶头条先简单解读一下短短的一句话包含的意思:
第一,国家大数据战略已经是属于最高级别的战略之一。
第二,“学习”代表了未来在推动实施大数据战略过程不是“无的放矢”。
第三,可以预见2018年将是大数据蓬勃发展新的开年。
我国首次提出推行实施国家大数据战略是2015年11月3日,《十三个五年规划的建议》首次提到的。当时的完整表述是“拓展网络经济空间,推进数据资源开放共享,实施国家大数据战略,超前布局下一代互联网。”
推动实施国家大数据战略的重要性,我这里不在赘述。这里只是说明一下在推动实施国家大数据战略进程中,IT产业应该如何发展来加速大数据战略落地。
大数据战略的实施不能是空中楼阁,需要一个坚实的基础。所以需要在现有的IT基础架构上对数据基础设施进行完善升级。
Garter预计2017年中国IT支出2.34万亿人民币。而此次国家大数据战略的推动,相信IT支出在未来几年是一个更大的增长。IT技术作为大数据战略实施的核心技术,也将迎来新的爆发点和增长期。围绕IT形成的经济圈也将是一个巨大的产业。IDC预测到2021年中国数字经济比重将达到55%。
数据基础设施与大数据战略实施是一个螺旋式影响的模式,完善数据基础设施能够加速数字经济的发展,同样数字经济的发展能够更好的推动大数据战略的落地,再次需要更好的数据基础设施。如此形成一个可持续的健康的增长模式。
完善数字基础设施。其中包括基于存储、计算和网络的数据中心不断升级的下一代数据中心的建设。包括云计算、大数据、人工智能的深度融合。包括5G网络技术、半导体芯片技术等核心技术的支撑。
这里至顶头条简单梳理一下,新的数据基础设施需要哪些进化?
在存储介质方面,需要更快、更大容量和更稳定的存储介质。现在这方面的技术包括基于3D NAND闪存颗粒的闪存通过不断增加层数来增加数据存储的容量。就像同样的一块地,建设高楼存放的人更多一样。这方面紫光旗下的长江存储成功研发 32 层 64G 的 3D NAND 芯片,抢下中国存储自制芯片的第一名。
存储系统方面,基于大数据存储的对象存储成为下一个增长点。IDC对象存储市场趋势预测2020年,对象存储占文件存储总容量的70%以上。这需要存储系统厂商的不断通过软件定义的方式来让存储计算和网络技术更平衡。基于大数据的存储,这方面包括国际存储厂商Hitachi Vantara、IBM以及华为、新华三、浪潮、中科曙光、宏杉等存储系统国产厂商的不断创新推动存储系统的发展。
在计算方面,需要结合人工智能、深度学习技术的处理器芯片,提到计算能力,人们第一时间想到的是传统的CPU,但是在大数据时代,基于低功耗、低存储和高并行、高效率处理AI专用芯片成为新的战场。这方面我们也看到了中国芯片的力量,包括排名第一的超级计算机神威太湖之光就采用了自研国产CPU。也看到了包括马云已投资了包括寒武纪在内的5家中国本土AI芯片公司。其中寒武纪最新发布了三款全新的智能处理器。北京君正成功量产全球首款机器视觉芯片。
在网络方面,需要聚焦在5G,物联网技术等。目前包括华为、新华三等主流网络硬件厂商的参与。
同样数据安全也将更加重要。要加强关键信息基础设施安全保护,强化国家关键数据资源保护能力,增强数据安全预警和溯源能力。这需要包括网络安全厂商、数据保护厂商、备份和恢复软件厂商等共同发力。来实现大数据战略发展过程中对于数据安全的需求。
当然我们能看到的是在存储、计算等技术方面的创新,以及数据安全的重要性。但是有没有人想还缺少什么?答案是“人才”,是真正懂数据、懂算法的“数据家”。
完善数字基础设施,这里不仅需要更先进的计算力,更快的网络以及更大的存储空间。还需要让新的计算、网络、存储在一起更加协同的“灵魂”---算法。因此推动实施国家大数据战略,还有一个核心是算法的重要性。而算法,至顶头条认为需要的是“数据家”来创造出来。如何成为新型的“数据家”?就是这个人才不仅仅是最顶级的数学家而且还需要是是懂的数据价值的专家融合在一起。因此培养顶级的新型的数学家也成为未来国家大数据战略实施的重要推动力。
好文章,需要你的鼓励
Citrix宣布通过XenServer产品重返主流虚拟化市场,尽管该公司承认产品尚未完全就绪。云软件集团表示XenServer正扩大支持范围以涵盖各类工作负载。Citrix早在2010年代初就基本放弃了XenServer作为主流虚拟化产品的定位。产品管理高级总监认为当前虚拟化市场正经历前所未有的变化,特别是主要厂商的激进许可变更给IT预算带来压力,为Citrix提供了重返市场的机会。
这项由加州大学伯克利分校、香港大学和Adobe联合开展的研究,开发了名为X-Planner的AI图像编辑规划系统,解决了现有AI工具难以理解复杂编辑指令的问题。该系统能将"让图片看起来像夏天"等自然语言指令智能分解为具体编辑步骤,并自动生成精确的控制信息,显著提升了AI图像编辑的准确性和可控性。
Docker公司发布重大新功能,旨在简化智能体AI应用的构建、运行和部署。公司扩展了Docker Compose工具以支持AI智能体和模型的大规模部署,并推出Docker Offload服务,允许开发者将AI工作负载转移到云端。新功能还支持模型上下文协议网关的安全连接,并与谷歌云、微软Azure等合作伙伴集成。
本研究提出了VLM2Vec-V2多模态嵌入模型和MMEB-V2评估基准,首次实现对文本、图片、视频和文档的统一理解。该模型在78个任务上全面领先现有基线,展示了从专门化向通用化发展的重要趋势,为多媒体内容理解、智能搜索和人机交互带来突破性进展。