戴尔科技集团全球首席技术官John Roese表示,经过一段时间的试水与经验积累,企业广泛采用AI成果的客观基础已经落实到位。
戴尔科技集团全球首席技术官兼首席AI官John Roese表示,得益于关键技术的发展成熟与现成工具的陆续涌现,企业人工智能(AI)市场有望在明年迎来增长。
在最近接受技术媒体Computer Weekly采访时,Roese描绘了他心目中的AI格局,其中涵盖三大截然不同但又相互关联的市场:前生成式AI、AI模型训练与企业AI。
他指出,虽然其中前两大市场已经相当成熟,但最为核心的潜力却来自企业AI市场,只是采用曲线相对较缓。Roese解释称,“AI并非单一市场,而是囊括三大完全独立但又相互关联的市场。”他指出,计算机视觉与机器人等前生成式AI技术正是将数据提炼为生成式AI可用格式的关键一层。
第二部分市场专注于训练大规模AI模型,目前由超大规模企业以及争夺搜索及社交网络霸主地位的各大科技巨头所主导。而戴尔在提供必要基础设施方面则发挥着核心作用。
至于第三大市场,也就是企业AI业务,Roese认为正处于转型的边缘。他指出,虽然训练市场在各科技巨头对于“巨型集群”的大规模投入而屡屡登上头条新闻,但企业市场其才是更专注于将AI科技应用于业务流程的领域。
他表示,“企业AI的基本定位,在于体现那些负责支撑企业正常运转的重要流程,并通过应用AI技术以显著改善这些流程。”换句话说,就是思考如何运用AI以优化供应链、改善客户服务并加强产品开发。
据Roese介绍,其中一大关键区别,在于企业更多关注推理环节——即通过现有模型运行数据、而非训练自有模型。这对于基础设施提出了完全不同的要求:需要一种分布式、针对推理进行优化并可能扩展至边缘的方法。Roese指出,“过去六个月以来,我们看到企业市场正日趋成熟”,现成的AI工具与功能正在兴起。这些工具和功能更多面向企业,即通常更强调技术的消费端、而非技术的生产端。
Roese还概述了六大核心能力,这些能力可以解决大部分企业AI用例,并敦促首席信息官们专注于这些基础要素,而非忙于构建大量实用价值存疑的能力。这将有助于他们优先在其核心竞争力与竞争的优势领域之上分配AI投资。
这六大能力包括基于检索增强生成(RAG)的聊天机器人、编码智能体、内容AI引擎、数据管理智能体、分析智能体以及微调基础设施。Roese表示,单凭这六种能力足以支撑起戴尔当前实施的超过300种AI用例。
具体来讲,AI智能体架构的兴起代表着一个重要转折点。这些架构由体量更小但专业性更强的AI模型组成,它们就像一支“数字劳动力团队”,能够执行特定任务以提供更强的控制力、可解释性以及通过微调整合专有数据的能力。
Roese解释称,“我们实际上是在建立一支由具有不同技能的成员共同组成的团队”,这意味着人类和AI之间得以建立一种更具协作性的方法,其中由人类负责协调并监督这些数字智能体的工作产出。
Roese预计,智能体架构将逐步走向主流化和标准化,进而推动企业从2025年年中开始部署面向智能体的AI系统。“届时我们很可能将亲眼见证企业AI的首轮显著生产加速。”
而在谈到对于数据泄露和智能体管理方面的担忧时,Roese认为不同类型的智能体将需要配合不同的生命周期管理方法。
例如,具有稳定处理特定任务能力的智能体将可以像传统软件包一样接受更新和管理;而与动态实时数据交互的智能体则应使用RAG来实现数据访问,而不再将数据嵌入智能体本身。
为了更好地对企业AI进行控制和解释,组织还需要部署一组专门的智能体,这也与过往全功能集于一身的传统智能体思路有所区别。集合中的每个智能体,可能都拥有针对其特定功能量身定制的不同管理生命周期。
举例来说,在本地机器上运行的通信智能体可以使用LangChain等工具与整体大语言模型或者能够访问组织库存实时信息的智能体进行对话。Roese具体解释称,“这两个智能体之间的协作能够为用户提供在感知上近乎实时的答案,但从生命周期的角度看,其实真正实时的只是第二个智能体背后的数据库。”
他也承认,企业在应对复杂AI课题时仍然面临挑战,并指出治理和“供应商随机性太强”确实大大影响了业务部门对多数AI项目的推动能力,尤其导致项目的成本可预测性难以捉摸。
不过Roese对于未来仍然抱持着乐观态度,他建议企业应专注于推进符合自身核心竞争力的战略性AI方案,并充分发挥现有技术工具的力量。他总结道,“随着我们实施更好的治理方案以及更多现成技术解决方案的出现,后续的AI应用速度只会越来越快。”
好文章,需要你的鼓励
智谱AI率先推出了 AutoGLM,试图打造一款能够理解、规划、执行,并最终实现“无人驾驶”操作系统的 AI Agent。
该处理器采用16nm工艺技术设计,拥有 48 个ARM Cortex-A75内核,六通道DDR4 3200 MHz 内存 - 每插槽高达 768 GB(每通道 128 GB)
谷歌DeepMind研究人员则直接把这项技术集成到AI Agent中开发了Talker-Reasoner框架,让其具备“快”、“慢”两种拟人化思考方式。
数据密集型工作负载的激增,导致计算系统需要处理的数据量大幅增加。这种不断拓展的数据环境,迫切需要具备更大容量和更高带宽的