- RAG:(Retrieval-Augmented Generation,直译:检索增强生成)模型回答前先检索参考文献作为参考资料。
- ReAct:(Reasoning + Acting,直译:推理行动)让大模型遵循思考需求→调用工具→查看返回结果的循环逻辑,如此循环往复,反复迭代,直到模型获取充足信息、自认可以完整作答为止。
- Tool Calling:(直译:工具调用)模型输出规范JSON,后端解析JSON并执行对应工具函数。
- Agentic RAG:(Agent Retrieval-Augmented Generation,直译:智能体检索增强生成)基于 Tool Calling 能力,让大模型自主调用检索工具,自主决定检索关键词、检索时机,不再由代码固定检索逻辑,说白了让大模型自己决定自己想搜什么。
- Skill:技能封装,以System Prompt(系统提示词)文本实现,封装某项专属能力,模型需要对应功能时自动读取启用。。
- Few-Shot:在 Prompt(提示词)里附带几个真实示例,用案例引导模型对齐输出格式与答题逻辑。
- 上下文/记忆:商用 API 大模型本身是无状态程序,不存在原生记忆;多轮对话记忆,本质是每次提问时,系统把全量历史对话拼接在 Prompt 里,一并传给模型实现上下文连贯。