
面向转行零基础学员与在职进阶程序员,莫瑶教育(AI培训部)依托一线AI产业真实项目落地经验,打磨出一套从基础铺垫、原理深耕、实战训练到工程商用的全闭环大模型开发课程体系。课程摒弃空洞理论,精准对标企业岗位核心用人标准,循序渐进搭建完整技术能力体系,既能帮助零基础学员快速入门、掌握落地技能,也能助力在职程序员突破技术瓶颈、完成高阶进阶,真正实现学完即可适配企业AI项目落地需求。
一、课程整体体系架构
课程采用基础前置→模型原理→微调实战→RAG检索增强→AI Agent智能体→工程部署→商用项目实战的科学化学习路径,层层递进、闭环赋能,覆盖AI大模型开发全流程核心技能,兼顾入门友好性与技术专业性,适配不同基础、不同学习目标的学员。
二、七大核心课程模块(全链路系统化教学)
模块一:前置基础铺垫|零基础入门核心保障
本模块专为零基础学员打造,有编程基础的学员可快速加速跳过。核心目标是夯实大模型开发必备的编程、数学、框架与NLP基础,彻底扫清深度学习与大模型开发的入门障碍,为后续高阶课程筑牢根基。
1. Python编程专项(自研案例驱动教学)
告别纯理论枯燥学习,全程以企业实战案例贯穿教学。系统讲解Python核心语法、数据结构、面向对象编程、文件操作、多线程与异步编程等核心能力;深耕数据分析刚需的NumPy、Pandas、Matplotlib工具库;全覆盖企业项目高频技能,包括Requests网络请求、JSON数据处理、日志配置、Anaconda/Miniconda环境管理等,全方位适配项目开发场景。
2. 深度学习前置数学
摒弃冗余学术内容,聚焦大模型工程落地刚需数学知识。核心讲解线性代数(向量、矩阵、张量实战应用)、微积分基础、概率统计、梯度原理、损失函数核心逻辑,帮助学员读懂模型训练底层逻辑,理解参数更新核心机制,摆脱“看不懂原理、只会调包”的困境。
3. 深度学习框架入门
以企业主流大模型微调首选框架PyTorch为核心,搭配TensorFlow框架对比教学,适配行业主流技术栈。重点实操张量运算、基础神经网络搭建、GPU加速训练、数据集加载与预处理、完整训练循环搭建等核心技能,让学员熟练掌握深度学习实验全流程。
4. NLP自然语言基础
铺垫大模型文本交互底层逻辑,涵盖文本分词、词向量原理、Word2Vec、文本清洗预处理、文本分类、文本摘要等传统NLP经典任务,打通传统NLP与大模型技术的衔接壁垒,为后续微调、RAG项目开发奠定核心基础。
模块二:大模型底层核心理论|吃透原理、摆脱调包局限
本模块核心目标是打破浅层学习弊端,让学员吃透大模型底层运行机制,做到知其然、更知其所以然,具备独立分析、优化、解决模型问题的能力。
课程完整拆解Transformer核心架构,精讲自注意力、多头注意力、位置编码、编码器/解码器核心结构及适配场景;系统梳理GPT、BERT、LLaMA、Qwen、GLM、Mistral等主流预训练模型的演化脉络,对比各类模型的优劣与落地场景选型逻辑。
深度解析行业核心技术概念,涵盖Token机制、上下文窗口、温度参数、Top-p采样、KV缓存等推理核心参数;拆解大模型涌现能力、思维链CoT、少样本/零样本学习核心原理,精准剖析模型幻觉的产生原因与主流抑制方案。同时全面普及通义千问、ChatGLM、InternLM、百川等国产开源大模型生态,掌握国产模型落地选型与应用逻辑。
模块三:大模型微调专项|工业级低成本实战核心
聚焦企业真实落地场景,覆盖全算力梯度微调技术,让学员精通不同场景下的模型定制方案,掌握低成本、高效率的行业专属大模型开发能力。
1. 全参数微调(Full Fine-tune)
针对企业高精准定制、算力充足的落地场景,详解全参数微调核心逻辑,实现模型权重完整更新。实操讲解专属训练数据集构建、训练轮次配置、学习率调优、梯度裁剪、显存优化等核心技巧,满足高精度行业模型定制需求。
2. 轻量化微调(企业90%落地首选)
主打企业主流低成本落地方案,核心精讲LoRA低秩适配技术,实现低显存消耗、快速定制行业专属模型;重点教学QLoRA 4bit/8bit量化微调,支持消费级显卡完成大模型训练,大幅降低落地算力门槛。同时对比Adapter、Prefix Tuning、Prompt Tuning等轻量化方案,详解不同业务场景的技术选型策略。
3. 微调全流程工业实战
完整复刻企业级微调全流程,涵盖行业数据集清洗、人工/自动标注、ShareGPT/Alpaca标准格式转换;训练环境搭建、多卡分布式训练实操;模型权重合并、导出与性能评测。通过困惑度计算、人工评测、自动指标评估多维度验证模型效果,针对性解决模型过拟合、回答跑偏、输出格式混乱等行业高频问题。
模块四:RAG检索增强生成|打造高精度无幻觉企业知识库
针对大模型知识滞后、内容虚假、无法适配企业私有数据的核心痛点,手把手教学搭建可溯源、高精准、无幻觉的企业专属问答系统。
系统讲解Chroma、FAISS、Milvus、Pinecone等主流向量数据库的部署与实操;适配PDF、Word、TXT等企业常见文档格式,精通文档智能解析、文本分块切片优化策略,大幅提升检索精准度。
深耕BGE、all-MiniLM、m3e等主流文本向量化模型,拆解相似度匹配、Rerank重排序、关键词+向量混合检索核心逻辑。同时赋能工程级优化技巧,包括上下文压缩、多轮对话记忆留存、分层检索、检索污染防护等。配套完整商用级实战项目,学员可独立开发可直接上线的企业私有知识库问答系统。
模块五:AI Agent智能体开发|前沿自主化智能业务落地
作为当下AI热门前沿方向,本模块旨在让学员掌握AI Agent核心开发技术,赋予大模型自主规划、工具调用、闭环解决复杂业务问题的能力。
深度拆解AI Agent四大核心组件:思考规划模块、工具调用模块、记忆模块、行动执行模块,吃透智能体底层运行逻辑。精讲LangChain、LlamaIndex、AutoGen、OpenAI Agent等主流开发框架实战用法。
手把手教学自定义工具开发,涵盖专属API对接、联网搜索、代码解释器、文件读写等实用功能;详解多智能体协作机制,实现多Agent分工协同处理复杂业务流程。配套智能数据分析助手、自动化办公Agent、电商客服智能体等多个热门落地项目,贴合市场主流AI应用场景。
模块六:大模型工程化部署|生产级全流程交付能力
打通模型从实验环境到线上生产服务的最后一环,补齐工程化、产品化短板,让学员具备完整的项目交付与运维能力。
深耕模型推理优化技术,涵盖KV缓存优化、模型量化、GPTQ/AWQ量化算法、vLLM高速推理引擎实操,有效提升模型推理速度、降低显存占用。掌握FastAPI/Flask接口封装技术,完成高性能API服务、流式输出SSE对话接口开发。
适配多场景部署方案,涵盖单机GPU部署、Docker容器化部署、阿里云/腾讯云GPU云端部署。同时覆盖企业级运维能力,包括负载均衡、高并发处理、会话存储、日志监控、异常排查,配套前端对接教学,完成Web对话页面开发与前后端联调,实现完整产品化交付。
模块七:行业商用综合实战|结业交付专属作品集
课程全程以商用项目为核心,摒弃纸上谈兵,结业交付多套可直接展示、可复用的行业级项目作品集,全方位适配求职面试、商业落地场景,核心项目包括:
-
垂直行业专属大模型:法律、医疗、教育领域轻量化微调对话大模型项目
-
企业级私有知识库问答平台:RAG全流程落地商用项目
-
自动化办公AI Agent:实现Excel数据处理、智能报表生成、全网数据查询
-
内网私有化部署方案:大模型本地安全对话系统搭建
-
多模态拓展项目:图文理解、LLaVA多模态大模型微调实战
三、高阶增值拓展模块|突破行业落地瓶颈
配套专属高阶增值内容,助力学员突破基础开发能力,规避行业落地坑点,适配中高级工程师进阶需求:
-
大模型评测体系:掌握MMLU、CEval通用评测标准,可自主搭建行业自定义评测集
-
提示词工程进阶:精通系统提示词设计、Few-shot小样本提示、结构化输出约束技巧
-
对话优化技术:精细化管理多轮对话记忆、优化长文本上下文处理方案
-
安全与合规开发:实现内容智能过滤、用户隐私数据脱敏、Prompt越狱防护
-
行业落地避坑指南:精准控制显存成本、规范训练数据、规避模型版权风险
四、分人群专属学习侧重|精准适配不同需求
课程针对两类核心人群定制差异化学习重点,因材施教、高效赋能:
1. 零基础转行学员
优先夯实Python编程与PyTorch框架基础,聚焦低成本、高落地性的核心技术,重点掌握QLoRA轻量化微调、RAG知识库项目开发、模型API部署技能,弱化复杂数学原理与全量参数训练等高难度内容,快速具备企业上岗落地能力,高效实现转行就业。
2. 程序员/算法进阶学员
深耕Transformer底层核心原理、多卡分布式训练机制,重点突破vLLM高速推理优化、多Agent智能体协作、多模态模型开发、大规模GPU集群部署等高阶技术,深度提升技术壁垒,适配中高级AI开发岗位求职与企业核心项目研发需求。
五、莫瑶教育AI培训部核心特色
-
真实项目驱动教学:全模块配套商用级落地案例,拒绝纯理论灌输,所学即所用,完全贴合企业业务场景
-
算力友好型教学方案:主打QLoRA轻量化微调技术,普通消费级显卡即可完成全流程训练实战,降低学习硬件门槛
-
就业导向作品集交付:结业输出多套完整行业级实战项目,可直接用于求职展示、项目答辩、商业落地
-
实时技术迭代更新:紧跟大模型开源生态与行业技术趋势,持续优化课程内容,同步最新落地实践,杜绝技术滞后
