AI Agent

发布日期: 2025-08-18

文章字数: 1.6k

阅读时长: 5 分

阅读次数:

前言

刚开始接触大语言模型（LLMs）时，我以为关键在于写出完美的提示词。只要给它足够的上下文 —— 然后，砰的一下 —— 它就该能正常工作了，对吧？事实并非如此。

起初我意识到，自己基本上就是在对着一个高级版自动补全工具堆砌文字。生成的内容看起来很聪明，但模型其实什么都不懂。它不会规划、不会调整，也不会推理。只要措辞表达稍有改动，整个输出就会出问题。

真正的智慧不只是给出答案，更在于答案的形成过程。这个过程至关重要。

这促使我研究起智能体模式—— 一种能赋予大语言模型更多 “目的性” 的设计技巧。它能让模型进行规划、反思、使用工具，甚至与其他智能体协作。借助这些模式，可以很好的摆脱那些时灵时不灵的提示词，找到了能真正解决问题的方法。

下面就来具体讲讲这五种对我帮助最大的模式，解释会尽量通俗易懂、便于实践。

一、反思（Reflection）：Teach Your Agent to Check Its Own Work

你有没有过这样的经历：问了 ChatGPT 一个问题，读完答案后总觉得 “听起来还行…… 但好像哪里不对劲”？

这时候，反思（Reflection）就派上用场了。这是个简单的技巧：让模型在给出最终答案前，先自己检查一遍输出内容。

基本流程是：

提出问题。
让模型给出答案。
然后再提示它：“这个回答完整吗？有没有遗漏什么？怎样能更好？”
让它自己修改完善。

说实话，单这一步就能减少很多粗心的错误 —— 尤其是在代码、总结这类对细节要求高的内容上。可以把这理解为给你的模型加了个暂停键和一面镜子。

二、使用工具（Tool Use）：Don’t Expect the Model to Know Everything

大语言模型（LLM）并不知道你的数据库里有什么，也不知道你的文件内容或今日新闻。不过没关系 —— 因为你可以让它自己去获取这些信息。

使用工具（Tool Use）的模式能把模型和现实世界的工具连接起来。这样一来，它就不用凭空编造内容了，而是可以查询向量数据库、在交互式解释器（REPL）中运行代码，或者调用外部 API，乃至你内部的接口。这种设置需要一些 “管道搭建”：函数调用、路由配置，或许还得需要用 LangChain 或 Semantic Kernel 这类工具，但付出是值得的。你的智能体不再靠猜，而是能调取真实数据了。人们总以为大语言模型天生就该很聪明。其实并非如此。但当它们能使用合适的工具时，就会变得聪明得多。

三、推理与行动（React）：Let the Model Think While It Acts

“反思” 模式很好，“使用工具” 模式也很棒。但如果让你的智能体在思考和行动中形成循环，效果会更好。这就是 “ReAct” 模式的核心：推理（Reasoning）+ 行动（Acting）。Cursor和Trae这种AI IDE便是很好的实践。模型不会一次性给出所有答案，而是会逐步推理，并在了解更多信息后调整自己的行动。

要让 ReAct 模式发挥作用，你需要三样东西：