上周去内蒙古呼和浩特参加第十五届全国高性能计算学术年会。在返京的时候,体验了内蒙古白塔国际机场安检验票处的人脸识别系统。第一感觉是检测速度快,外观看应该是最新装备的系统。除了人脸识别,还配套崭新的人机交互设备,以及智能机器人等整个方案。因此走在安检处,同时听着带有科技感的智能语音,视觉和听觉上感觉走进一个科幻的场景,就像走在科幻电影里面的感觉。
之前因为科技类大会基本上都是在北上深以及杭州、成都等这些发达城市。所以并不太了解中西部这些城市的发展情况。此次看到内蒙古机场的AI应用,深刻感受到了云计算、AI等科技技术给整个社会带来深刻的变化。
一直以来,大家主观的印象是城市经济越发达,包括科技、人文、教育也会首先收益。但是移动互联、AI的发展,真的打破了这个界限。就像科技应用,并不是所在的城市经济越发达,科技利用就越早。就像我亲身的感受,别的不说,单是人脸识别系统的应用,个人感觉内蒙古白塔国际机场在智能应用方面走在了很多一线城市前面。
从内蒙古白塔机场的景象可以看到,全国各个机场应该都是在积极的利用云计算,利用人工智能等数字化转型工具来改善人们的出行。
而这仅仅是AI技术在机场出行方面的小小应用,推而广之,在城市交通、智慧城市、智能安防、智慧农业、智能制造方面,新的技术相信已经在全国各地遍布开花。
体验了机场的AI,又想到多个人脸识别的应用场景。乘坐高铁的体验,目前支付宝的人脸识别自助式购物等等。笔者突然意识到,未来计算机视觉会成为人工智能应用爆发的首要突破口。
我们知道,目前人工智能领域主要有这几个方向,计算机视觉,语音识别,自然语言理解。语音识别和自然语音理解更多的是对人的行为的探索。而计算机视觉是对万物的捕捉。按照目前的AI应用趋势,个人认为计算机视觉应该是应用场景最深最广,也是人工智能领域最重要的方向之一。
大家想象一下,计算机视觉不仅仅是对人的观察,也是对实体世界的关注,通过对万物的理解,通过对万物的数据的采集,可以说计算机视觉AI是智慧物联网时代最大的数据入口,目前谈到火热的自动驾驶、智能机器人都是基于计算机视觉来设计的。
如果说计算机视觉是消费者感受人工智能应用的直观技术和体验方式。那么其背后一定需要一个智能的操作系统在支撑。回首过去,以Windows系统为代表的操作系统,让人们进入PC时代;以苹果OS和安卓为代表的移动操作系统让人们进入移动互联时代;那么智能时代肯定也必须出现一种或多种智能操作系统来满足智能时代的需求,目前来看华为鸿蒙算是一个。
这个系统应该能满足计算机视觉背后对于深度学习算法的超高性能的需求,需要连接虚拟世界和物理世界的超高带宽需求,需要对实时交互的超低时延的需求。
而这些需求的满足,5G只能算起步。
好文章,需要你的鼓励
CIO们正面临众多复杂挑战,其多样性值得关注。除了企业安全和成本控制等传统问题,人工智能快速发展和地缘政治环境正在颠覆常规业务模式。主要挑战包括:AI技术快速演进、IT部门AI应用、AI网络攻击威胁、AIOps智能运维、快速实现价值、地缘政治影响、成本控制、人才短缺、安全风险管理以及未来准备等十个方面。
北航团队发布AnimaX技术,能够根据文字描述让静态3D模型自动生成动画。该系统支持人形角色、动物、家具等各类模型,仅需6分钟即可完成高质量动画生成,效率远超传统方法。通过多视角视频-姿态联合扩散模型,AnimaX有效结合了视频AI的运动理解能力与骨骼动画的精确控制,在16万动画序列数据集上训练后展现出卓越性能。
过去两年间,许多组织启动了大量AI概念验证项目,但失败率高且投资回报率令人失望。如今出现新趋势,组织开始重新评估AI实验的撒网策略。IT观察者发现,许多组织正在减少AI概念验证项目数量,IT领导转向商业AI工具,专注于有限的战略性目标用例。专家表示,组织正从大规模实验转向更专注、结果导向的AI部署,优先考虑能深度融入运营工作流程并产生可衡量结果的少数用例。
这项研究解决了AI图片描述中的两大难题:描述不平衡和内容虚构。通过创新的"侦探式追问"方法,让AI能生成更详细准确的图片描述,显著提升了多个AI系统的性能表现,为无障碍技术、教育、电商等领域带来实用价值。