AI大模型面试必问八股大合集
一、理解主流AI名词原理
1.LLM(大语言模型)
LLM本体定位:一个强大的文本生成器
它只负责做事,不负责生成,核心能力是生成,
2.Prompt(指令)
你给模型的直接输入,包括具体的任务指令、约束条件、输出格式要求以及示例等等。
3.、Context(上下文)
为了让模型“理解当前处境”而提供的背景信息,是模型生产回答的参考依据
4、Memory(记忆)
将历史对话或关键信息整理摘要后,重新放回上下文,避免模型在长对话中“断片”
5.Agent(智能体)
Agent是连接智能模型与程序执行的中间层
Agent = 流程控制 + 工具调度 + 状态管理 + 少量提示词策略
。
6.RAG(检索增强)
RAG就是通过“塞证据”来减少模型幻觉。![]()
功能:
1、减少AI在回答的时候胡编乱造
2、当召回率,精度过关的时候,AI回答的质量也会更高。
7.Function Calling 与 MCP 的层级差异
Function Calling解决的是:模型与agent的交互,把意图变成一个结构化的调用
MCP解决的是:解决Agent与工具的服务。
8.Workflow 和 Skill
Workflow 、 Langchain
流程固化:用硬编码或者低代码拖拽的方式固定流程
优势:极其稳定,可控,适合标准作业程序。
劣势:灵活性差,难以应对多变的输入输出组合。
Skill(技能包)
按需加载:打包“提示词+说明+脚本”,由Agent动态选择
优势:在灵活与稳定之间折中,可扩展性强
劣势:对Agent调度能力有一定的要求
建议:固定流程选Workflow;需求多变,组合复杂的程序选Skill。
9.总结
二、请谈谈大模型开发中 Prompt、RAG和微调的区别,O你该如何根据业务场景进行选型?
快速验证:优先使用prompt,快速调通业务和基本格式。
知识驱动:若涉及大量私有数据或频繁的知识更新,必选RAG。
定制灵魂:若需要模仿真人语气或在窄领域达到专家精度,采用Fine-tuning。
pompt跑逻辑,rag供知识,微调打磨专业度
组合:微调定格式与口吻,RAG提供事实与知识
三.请对比Workflow(工作流)和Agentic(自主智能体)的优劣
workflow工作流:
优点:路径高度可控、结果可以预测、降低token成本
缺点:难以处理开放式任务、灵活性较差
Agentic自主智能体:
自主智能体是给他一个目标,他自己去拆解任务完成任务。具有感知 - 思考 - 行动 - 观察能力
优点:极强的任务拆解能力、自适应复杂的环境。
缺点:容易产生逻辑死循环、运行成本不可控、存在幻觉风险
如何破解Agentic的不确定性?
状态机约束:通过代码约束Agent的动作空间,给Agentic焊一个边框,某个节点只能在ABC三个工具里面选,不能乱跑。
多层级反射机制:智能体干完一步,让另一个智能体来充当“审核员”,对中间步骤进行反思与纠错,通过循环验证来提高准确率。
人机协作(HITL):在高风险操作(转账,发送)添加一个人工确认按键,将AI自主性锁定在安全范围以内。
核心总结:
确定性为基:核心主干业务,坚决走Workflow
灵活性为翼:复杂长尾场景,按需接入Agentic
混合架构:用workflow锁死下限,用Agentic提高上限
四.Langchain、LangFlow、LangGraph这三者有何区别?
核心定位与关系:
LangChain:地基:他帮我们把提示词、向量数据库、大模型等零散的组件装成了标准的接口。
工作流:是线性的。第一步做什么,第二步做什么是线性的。
LangFlow:它是一个低代码入口,相当于给Langchain穿了一个好看的衣服,可以通过拖拽与连线来构建流程,可以快速制作出原型。
LangGraph:它是为了创造智能体而生,他让大模型有了像人一样的大脑回路
核心痛点解答
架构选择:
LangChain是手和脚,用来干总活累活
LangFlow是用来轻量演示的
LangGraph是大脑,负责规划,记忆和决策。
五.Prompt Engineering是怎么驾驭大模型的?
1、底层逻辑映射
概率坍缩:大模型本质上是一个概率预测机器,在没给出prompt之前,预测空间是无限大的,当你给出prompt以后,就强制大模型把原本发散的概率压缩到一个特定的专业子集里
激发上下文学习:根据上下文的举例(few—shot)他就能在推理的一瞬间学习你的风格
拉长token换推理:在提问的时候总是让模型一步步思考,这一步是为了让强制模型输出中间内容,为复杂问题分配更多计算资源。
2、prompt战术推进(tactics)
3、工程化难点与防御架构
面试回答策略:
1.信息论维度概率坍缩:Prompt 的本质是通过增加上下文熵,强制模型在隐空间中选中预期的知识概率分布。
2.认知维度-ICL 激发:利用元学习能力,通过少样本(Few-shot)让模型在不更新权重的情况下完成任务对齐。
3.算力维度-思维链推理:解释CoT如何通过拉长生成序列,为逻辑推理分配更多的计算步数,提高复杂任务胜率。
4.工程维度-闭环防御:上升到工程高度,谈论RAG事实注入、Agent插件调用以及量化的评估体系。
六.什么是提示词?什么是提示词工程?
提示词是由角色,背景,明确的任务和边界,输出约束来构成的
提示词工程是把运气变成方法,由策略(zero/few shot)、参数(温度,TOP P )、增强(RAG,检索)、目标构成(稳定的质量 )
总结:
结构化思维:写提示词要有核心框架,不能随心所欲
策略化引导:懂得用zero/few shot来诱导模型
工程化迭代:不要想着一次性成功,要测试,评估,再优化
七.Prompt Engineering 和 Context Engineering有什么区别
我理解 Prompt Engineering 和 Context Engineering 的区别在于,Prompt Engineering 更偏模型交互层,是通过设计指令、角色、示例和输出格式,让模型在某个任务上给出更好的回答,他的核心是教模型怎么思考,怎么推理,怎么组织答案。而Context Engineering 更偏系统和产品层,它关注的是模型回答前需要哪些业务上下文,包括用户信息、历史对话、知识库、实时数据、工具调用结果和权限约束等。
在早期 Demo 或简单任务中,Prompt Engineering 很重要;但在真实 AI 产品里,仅靠 Prompt 很难保证效果,因为模型需要依赖正确、完整、实时的上下文。因此Context Engineering 更像是 AI 产品的基础设施设计,决定模型能不能稳定、准确、可控地完成任务。
举个例子,做 AI 客服时,Prompt 可以告诉模型“你是客服,语气要礼貌,不能编造”;但 Context Engineering 要解决的是把用户订单、物流状态、售后政策、历史沟通记录等信息正确地提供给模型。这样模型才能真正回答“我的订单为什么没到”这个问题。
缺少prompt会怎么样?
模型就像一个没人引导的学生,知识乱,逻辑混乱,经常给出来低质量的回答。
缺少context会怎么样?
模型就像一个闭门造车的工人,再聪明也没用,因为根本没有可用信息。
prompt是你写死的,context是你预设的,只有未来是未知的,所以有了Agent,他可以动态输入prompt给大模型 + 可以自动管理context
标准回答:
①prompt是指导大模型怎么思考的机制,他解决的是“How”的问题,怎么推理怎么组织答案。Context是为大模型提供信息的机制,解决的是“What”的问题。
②prompt的核心技术包括zero/few shot,角色扮演等用来激发内部已有的知识。
context的核心技术是RAG,通过检索将外部的知识注入模型
两者缺一不可,前者决定质量,后者决定准确性。
③在实际工程中,prompt面临脆弱性和幻觉问题。我们用自动优化和self-Consistency解决。
context面临中间迷失和噪声问题,我们用重排策略和自反思来解决优化。
未来的发展方向是Agent,让他系统化的生成和管理这两者实现真正的生态协作。
Self-Consistency(自洽性) 指的是系统(尤其在AI大语言模型中)在面对相同或相似输入时,通过多条推理路径生成逻辑一致、结论稳定的输出能力;在语言学中,它泛指“内部各部分无矛盾”的特性。
重排策略:将检索到的关键信息放到prompt的开头或者结尾
自反思:让模型先判断检索内容是否有效,剔除后在进行思考
八.大模型针对文档摘要,怎么设计分层提示词?
分层提示词的本质:它是一种“分而治之”的Prompt工程策略。他可以把一个复杂的任务,拆解为“局部提取-逻辑聚合-全局精炼”的多个树状或者线性或树状步骤,从而引导大模型进行高难度的推理。
它解决了什么痛点?
①上下文瓶颈:突破单词Token限制
②中间信息丢失:解决模型对长文本中间注意力下降的问题
③逻辑连贯性:防止模型面对复杂长文本时出现幻觉或先后矛盾
微观领域:
原子数据提取层:对文档进行物理切割(Chunking),切成一个个有重叠的小块,重叠度在15%左右,防止语义在切分的地方断开。此阶段不需要模型发挥,只要求高召回率。
中观领域:
中观逻辑聚合层:写prompt去引导大模型将第一层的chunk进行主题类聚,然后生成章节综述,进行第一次去重。
宏观领域:
宏观决策精炼层:按照聚合信息生成最终摘要。需要编辑来负责语义对齐、一致性检查,以及最终文案的润色。
九.为什么思维链(CoT)能显著提高大模型的推理能力?
CoT的本质:
①本质是时间换空间,强行增加他解决这个问题的消耗token量。(FLOPs)
②防止大模型看到中间步骤是对前面的文本模糊,相当于给了大模型一张草稿纸,让大模型把前面的内容总结到草稿纸上面,对内容有更清晰的理解,对后文的预测熵更低。
③CoT把概率很低的非线性跳转解析成了线性并且概率很高的线性步骤。就像是把大象塞进冰箱给变成了开门,放大象,关门一样。
④让模型从System1变成System2,从脱口而出变成逻辑推测。
痛点以及解决方案
痛点:
错误传播:推理途中出错导致全局崩盘
解决方案:
PRM过程奖励:对中间每一步推理进行验证和打分。
痛点:
模型规模屏障:小模型不具备很大的知识量,会胡言乱语
解决方案:
推理蒸馏:用大模型的CoT数据进行微调小模型。
痛点:
推理成本高:生成大量中间Token,花钱费时间
解决方案:
动态路由:按需触发,只有复杂问题出发,简单问题直接秒杀。
关于“为什么CoT有效”的满分回答总结
思维链的本质是模型推理的“时间换空间”。它通过将复杂的非线性思考路径显式化,利用额外的计算步长和上下文空间,将LLM从不稳定的“模式匹配”提升为可验证的“符号推演”。它是大模型从感知能力迈向认知能力的里程碑。
