上周去内蒙古呼和浩特参加第十五届全国高性能计算学术年会。在返京的时候,体验了内蒙古白塔国际机场安检验票处的人脸识别系统。第一感觉是检测速度快,外观看应该是最新装备的系统。除了人脸识别,还配套崭新的人机交互设备,以及智能机器人等整个方案。因此走在安检处,同时听着带有科技感的智能语音,视觉和听觉上感觉走进一个科幻的场景,就像走在科幻电影里面的感觉。
之前因为科技类大会基本上都是在北上深以及杭州、成都等这些发达城市。所以并不太了解中西部这些城市的发展情况。此次看到内蒙古机场的AI应用,深刻感受到了云计算、AI等科技技术给整个社会带来深刻的变化。
一直以来,大家主观的印象是城市经济越发达,包括科技、人文、教育也会首先收益。但是移动互联、AI的发展,真的打破了这个界限。就像科技应用,并不是所在的城市经济越发达,科技利用就越早。就像我亲身的感受,别的不说,单是人脸识别系统的应用,个人感觉内蒙古白塔国际机场在智能应用方面走在了很多一线城市前面。
从内蒙古白塔机场的景象可以看到,全国各个机场应该都是在积极的利用云计算,利用人工智能等数字化转型工具来改善人们的出行。
而这仅仅是AI技术在机场出行方面的小小应用,推而广之,在城市交通、智慧城市、智能安防、智慧农业、智能制造方面,新的技术相信已经在全国各地遍布开花。
体验了机场的AI,又想到多个人脸识别的应用场景。乘坐高铁的体验,目前支付宝的人脸识别自助式购物等等。笔者突然意识到,未来计算机视觉会成为人工智能应用爆发的首要突破口。
我们知道,目前人工智能领域主要有这几个方向,计算机视觉,语音识别,自然语言理解。语音识别和自然语音理解更多的是对人的行为的探索。而计算机视觉是对万物的捕捉。按照目前的AI应用趋势,个人认为计算机视觉应该是应用场景最深最广,也是人工智能领域最重要的方向之一。
大家想象一下,计算机视觉不仅仅是对人的观察,也是对实体世界的关注,通过对万物的理解,通过对万物的数据的采集,可以说计算机视觉AI是智慧物联网时代最大的数据入口,目前谈到火热的自动驾驶、智能机器人都是基于计算机视觉来设计的。
如果说计算机视觉是消费者感受人工智能应用的直观技术和体验方式。那么其背后一定需要一个智能的操作系统在支撑。回首过去,以Windows系统为代表的操作系统,让人们进入PC时代;以苹果OS和安卓为代表的移动操作系统让人们进入移动互联时代;那么智能时代肯定也必须出现一种或多种智能操作系统来满足智能时代的需求,目前来看华为鸿蒙算是一个。
这个系统应该能满足计算机视觉背后对于深度学习算法的超高性能的需求,需要连接虚拟世界和物理世界的超高带宽需求,需要对实时交互的超低时延的需求。
而这些需求的满足,5G只能算起步。
好文章,需要你的鼓励
购买笔记本电脑时,用户现在需要了解Copilot+ PC、NPU和本地AI处理等新概念。搭载专用神经处理单元(NPU)的Copilot+ PC能提供至少40 TOPS的AI算力,支持实时字幕翻译、视频通话优化、AI图像编辑等功能,同时提升续航表现。戴尔最新产品线涵盖多种选择:Dell 14 Plus适合学生和通勤族,Dell 16 Plus适合多任务办公用户,XPS 14面向轻度创作者,XPS 16则以31小时超长续航和3.6磅轻薄机身成为内容创作者的旗舰之选。
上交大与爱丁堡大学提出InfoKV,将信息熵与注意力权重结合用于KV缓存压缩,让大模型在仅保留12.5%缓存的条件下实现接近甚至超越完整缓存的长推理性能。
圣安德鲁斯大学博士Henry Legg在《自然》杂志发表同行评审论文,对微软拓扑间隙协议(TGP)框架提出质疑,认为该框架在推断Majorana粒子量子态存在方面存在缺陷,且实验数据分析结论可能有误。微软此前宣称将于2029年实现可扩展量子计算机,并推出Majorana 2芯片。对此,微软坚持立场,表示已发表正式反驳并获《自然》收录,对研发路线图充满信心。
强化学习训练AI时悄悄留下的"进展优势"信号,可作为免费的步骤级评分器,无需额外训练,在多个智能体任务上超越专用奖励模型。