1915年出版的《进化中的城市》当中写道:“城市必须不再像墨迹、油渍那样蔓延,一旦发展,他们要像花儿那样呈星状开放,在金色的光芒间交替着绿叶。”意思是说,城市的发展应该是有序、和谐的,而不是无序地蔓延。
尽管一百多年过去了,让城市的发展从无序到有序,仍然是城市管理者们所要面对的难题,在城镇化的进程中,人口持续向城市集中,由此引发的道路堵塞,房价高涨,工业和水污染,不稳定的安全等问题不断滋生。
智慧城市的理念,就是为了解决上述难题而诞生的,但从信息化时代走来,几乎每一个智慧城市的模板,都仅能做到局部的智能,很难实现对整个城市做到全域的智能化升级。
我们知道,“新质生产力”和AI大模型是今年的两大关键热词,这两者结合是否能够帮助城市迈向全域智能化?
AI和数据让城市生产力重塑
如今,城市已成为社会经济最重要的载体,价值创造的来源和枢纽,人口向城市集中的趋势也愈发明显。城市巨大化的速度和规模更加惊人,数据显示,中国城市的人口在过去35年里增加了4倍。
无疑,新型城镇化极大地推动了中国现代化进程,但同时也带来许多城市治理方面的问题和挑战。从管理者的角度,大城市由原来静态的复杂系统,变成活跃的复杂系统,这就需要比过往更为精细化的管理模式。
这绝不是简单的系统升级,而是一次城市生产力的重塑,同时这与新质生产力的发展方向不谋而合。
新质生产力的核心,是以科技创新驱动生产力向新的质态跃升做到“以新提质”。一座城市要在高质量发展上发挥产业转型的领军作用,同样需要拥抱人工智能和大模型等创新技术。
与此同时,数据的生产要素化,不仅可以提升数据资源的开发利用价值,还可以提升政府治理水平和服务效能,连接民生保障服务场景,催生新的产业发展机遇,加快城市智能化升级的速度。
这两者的结合,显然带来了城市产业升级的新机遇。华为政务一网通军团研发总裁陈金助提到了一个“智能经济”的新概念,他表示,“未来的智能经济的增长率,会远高于非数字经济,这将会成为今后产业升级的一个关键要素。”
“而随着新质生产力的蓬勃发展,城市智能体也迎来了新升级。华为将鸿蒙生态、数据要素和AI大模型都融入城市智能体,通过这些新技术的加持,城市智能体拥有了四个新引擎。”陈金助说。
“四化”新引擎
随着城市化率的提升,城市治理对象规模不断扩大,城市治理效率低的问题逐渐显现,市民办事依然不够便捷,城市服务体验比较差,燃气泄漏、爆炸等城市安全隐患随时可能出现。
要解决这些琐碎、零散的问题,就势必要做到整个城市“一盘棋”,以全域的视角来管理城市,这就需要一个智能化的中枢,这将是一个根据城市体量、企业、产业等等多维度情况,综合部署的算力+AI底座。
这就是构建底座智能化的意义,通过构建城市孪生底板、打造城市智能底座,支撑城市全域数字化、智能化升级。
AI大模型技术的出现,给城市的智能升级带来了很多新的期待。城市每天都在变化,传统的ICT技术,没有办法对于需求的演进进行预处理,这是很多过去智慧城市项目无法成功的症结。而大模型技术源自对数据和知识的学习,持续迭代,可以时刻与城市的智能化发展节奏同步。
陈金助说,“我们可以把行业知识,专家经验融入到知识大模型里面去,通过大模型的加持,可以实现自主化的模型,通过不断地学习和训练,越学越聪明,实现对业务的快速支撑,以AI为支点构建原生业务智能。”
这就是业务模型化,它在算法和算力上更有可塑性和可扩展性,同时因为业务知识已经沉淀到大模型里面,所以不需要很多定制,带来了业务开发的敏捷性。当然还有AI技术与场景结合带来的极致体验。
而数据价值化显然是随着数据要素化趋势而出现的,陈金助说,“中国的数据量占全球数据量的近1/4,但是中国的数据收益只占全球的5.5%,这说明中国的数据潜能还远远没有发挥出来。”
对此,华为已经发布了“1234N”数据要素流通解决方案,通过可信、可控、可证的数据要素流通基础设施,加速释放数据的价值,赋能数字经济的高质量发展。
在城市的智能化建设中,以人为本是最根本的思路,却也是最难以实现的方向。人作为城市当中的最小因子,遍布于城市的各个角落,“人”这个因素本身就代表了城市中一切复杂的场景。
城市智能体的理念之一,就是从人的价值角度,重新思考、构建、实现城市与人的良好关系。如陈金助所说,“城市里的应用,关系到老百姓的满意度和体验感,为此我们要把创新技术和应用进行深度融合,并携手伙伴打造各层的智慧应用。”这其实也是华为创新技术与应用深度融合,携手伙伴为客户提供智慧高效的业务体验,去实现应用智慧化的意义。
底座智能化、业务规模化、数据价值化和应用智慧化,这四个新的引擎,也是华为城市智能体的四个“抓手”,为城市打造能够满足全域智能化的“新质生产力”。
照见城市全域智能化升级的未来
今年5月,国家发改委、国家数据局、财政部和自然资源部联合发布《关于深化智慧城市发展 推进城市全域数字化转型的指导意见》。
要实现全域数字化转型,就要全面提升城市数字化转型的整体性、系统性、协同性,以数据融通、开发利用,贯穿城市规划、建设、管理、服务、运行全过程。
“全域”意味着城市要走向整体协调发展,要以全局视角对城市的每一个角落都保持洞察,唯有通过AI的辅助才能做得到,所以底座智能化是“全域”数字化转型的基础。而有了AI作为支撑点,以算法和算力升级为代表的业务模型化自然是顺理成章。
建立在数据要素化基础之上的数据价值化实现,让整个城市数据得以拉通,数据链条的完整性,才能让应用更智慧。
不难理解,“四化”新引擎本身也是环环相扣,相互补益,在四个新引擎支撑下的城市智能体,无疑已经照见了城市全域数字化、智能化升级的未来。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。