| 失效链接处理 |
|
天天说的 Agent,到底是啥???
相关截图:
![]() 主要内容:
一、先撇开术语:我们到底在聊什么
如果你最近刷技术社区、产品发布会或招聘 JD,多半见过 Agent 这个词。中文里有人译成「智能体」,也有人直接说「代理」——听起来像科幻片里的角色,其实讨论的大都是同一件事:让大语言模型(LLM)不只是「接一句回一句」,而是能在多步操作里自己拿主意、调工具、改计划,最终完成一个目标。
所以,当你听到「我们做了一个 Agent」时,别先往「人格」或「意识」上脑补。在工程语境里,它更接近:一个围绕大模型搭建的、带循环与工具的小系统。
下面这张图用「感知—规划—行动」的循环,概括了多数 Agent 架构里反复出现的主线(细节各家实现不同,但思路相近):
二、一句话版定义,够用了
若只记一句,可以这么理解:
Agent = 大语言模型 + 明确的目标 + 可调用的工具(或环境)+ 多步推理与尝试的循环。
它不像传统脚本那样每一步都写死在代码里,而是根据当前结果决定下一步——包括要不要查资料、要不要改方案、要不要向用户再确认。这正是大家说的「自主性」在日常产品里的含义(注意:是任务层面的自主,不是哲学上的自由意志。)
三、和「只会聊天」的模型差在哪
普通对话模式:用户问 → 模型答 → 结束。 单次生成里可能没有「真的会去执行」某件事。
Agent 模式往往多了几件事:
目标分解:把「帮我订一张下周去上海的票」拆成查日程、查航班、比价、下单等子步骤。
对外动作:调用搜索、日历 API、订票接口、公司内部知识库检索等——也就是 Tool use / 函数调用。
试错与迭代:一条路不通就换一个工具或重写计划,而不是只说一句「我无法完成」。
下面这张对比图,大致对应「只会聊」和「能办事」两种形态的差异(示意用,具体产品会有更多变体):
|


苏公网安备 32061202001004号
