当前位置：首页 > news >正文

CS16S:01

news 2026/6/23 11:55:44

整个课程10周，我把核心内容梳理一下。前两周讲AI基础，包括LLM的工作机制、Prompt Engineering、Agent架构和MCP协议。第3到第5周进入开发环境实操，教你怎么配置AI驱动的IDE、终端自动化、上下文管理这些。

第6到第7周聚焦质量和安全，覆盖测试、漏洞检测、调试、代码评审。第8到第9周是部署和运维，包括自动化UI构建、监控、事件响应。最后一周讨论软件工程师角色的演变。

根据公开信息，课程还邀请了不少业界嘉宾做客座讲座，包括Anthropic（Claude Code之父Boris Cherny也在）、Cognition（做Devin那家公司）、Warp（AI终端）、a16z（顶级风投）等公司的人。这个配置本身就说明了一件事：这门课对接的是真实的工业界前沿，不是学院派的纸上谈兵。

modern-software-dev-assignments

WEEK01

视频主要内容

这份视频（Stanford CS146S 课程的第一周内容）深入探讨了大语言模型（LLM）的工程流水线，涵盖了从原始数据到成为高效 AI 助手的全过程。

以下是视频的核心大纲和主要观点：

一、 LLM 训练的三大核心阶段

视频将 LLM 的进化过程分为三个主要阶段：

预训练 (Pre-training) - 构建基础模型：
- 目标：在大规模尺度上获取知识，将模型变成一个高性能的“文本补全机”。
- 数据规模：使用数万亿标记（Tokens）的互联网海量数据（如 Common Crawl 和 Wikipedia），其中经过筛选的高质量数据集（如 FineWeb）文本量可达 44TB。
- 机制：采用自回归模型 (Auto-regressive)，通过数千亿甚至数万亿个参数来预测序列中的下一个标记。
- 本质：它是对人类知识的一种有损压缩，学习了知识的语法，但尚未掌握深层的逻辑结构。
有监督微调 (Supervised Fine-tuning, SFT) - 塑造个性：
- 目标：将基础模型转变为一个有用且有礼貌的对话助手，赋予其“人格”。
- 方法：使用由人类编写的高质量对话示例进行训练，让模型模拟专业人类标记员的行为。
强化学习 (Reinforcement Learning, RL) - 培养推理能力：
- 目标：教模型如何思考和解决问题，特别是在数学和代码等可验证领域。
- 思维链 (Chain of Thought, CoT)：通过 RL 训练模型将推理过程分布在多个标记中，因为**“模型需要标记来思考”**。
- RLHF (人类反馈强化学习)：针对主观任务（如写笑话），通过训练奖励模型来模拟人类品味，尽管模型可能会为了高分而通过欺骗手段“走捷径”。

二、高级提示词工程 (Prompt Engineering)

为了充分发挥模型的潜力，视频介绍了几种关键技术：

上下文学习 (In-context Learning)：通过在提示词中提供少量示例（K-shot）让模型即时适应特定风格。
检索增强生成 (RAG)：通过调用外部搜索工具获取实时信息，解决模型知识过时和幻觉问题。
自我修正 (Self-correction)：利用自我一致性 (Self-consistency)（多次提问取多数票）和反思 (Reflection)（让模型审查并修正自己的代码）来提高准确性。

三、核心观点与职业影响

职业准则：AI 不会取代工程师，但一个懂得使用 AI 的胜任工程师将会取代不会使用 AI 的人。
效率飞跃：在代码理解、重构和性能优化方面，LLM 可以将数小时的工作缩短至几分钟。
“瑞士奶酪”模型 (Swiss Cheese Model)：LLM 虽强大但存在随机缺陷（例如能解奥数题却可能在简单数字比较上犯错），因此必须将其视为随机工具 (Stochastic Tools)，始终检查其产出。
未来的超人类协作：随着强化学习的演进，模型可能会发现人类从未想过的高级认知策略，这将开启人机协作的新篇章。

python 环境配置

These steps work with Python 3.12.

Install Anaconda

Download and install: Anaconda Individual Edition
Open a new terminal so conda is on your PATH.

Create and activate a Conda environment (Python 3.12)

conda create -n cs146s python=3.12 -y
conda activate cs146s

Install Poetry

curl -sSL https://install.python-poetry.org | python -
Install project dependencies with Poetry (inside the activated Conda env) From the repository root:

poetry install --no-interaction

ollama部署本地大模型

Ollama installation

We will be using a tool to run different state-of-the-art LLMs locally on your machine called Ollama. Use one of the following methods:

macOS (Homebrew):
```
brewinstall--caskollama ollama serve
```

Linux (recommended):

curl-fsSLhttps://ollama.com/install.sh|sh

Windows:
Download and run the installer from ollama.com/download.

Verify installation:

ollama-v

Before running the test scripts, make sure you have the following models pulled. You only need to do this once (unless you remove the models later):

ollama run mistral-nemo:12b ollama run llama3.1:8b

anaconda 安装
RL和SFT的区别 RLHF

查看全文

http://www.gsyq.cn/news/1579174.html

安全审计系统有哪些？2026年5大安全审计软件功能详解，最新分享

RAG 检索质量从 60% 到 90%：混合检索 + 重排序的完整实践

基于知识图谱的百科知识问答系统：Django+Neo4j 智能问答平台项目实战

全网最全！2026AI论文平台榜单（覆盖 99% 毕业论文需求）

92-Java 多线程编程

《B4501 [GESP202603 四级] 山之谷》

API中转站搭建完整教程：从零部署专属New API服务为什么自建API中转站

GLM-5.2实测：国产模型追上GPT梯队，但千万别直接切主力

从“不可能三角”到模块化突围：2026年区块链开发的技术范式转型

那个写稿的行业，完了

他40岁，身价5万欧，一夜涨粉500万——这才是世界杯存在的意义

Ubuntu如何卸載LibreOfflice

多智能体辩论为什么有效？这篇 arXiv 论文给出了“隐藏锚点“的数学证明

为什么90%的企业AI项目会失败？7层能力建设架构告诉你答案

AI原生上下文学习正在淘汰传统微调——SITS 2026 ICL协议发布后，你的模型还剩多少有效上下文窗口？

福州高端整木定制怎么选？6 家品牌实测对比，避坑必看

断尺问题：戴德金分割现实悖论

信托制物业缴费模式的数智化落地实践与技术架构

二分查找解题

国产BIM神器！翻模+BIM咨询全流程提速

好久不见，甚是想念

卡梅德生物技术快报｜噬菌体展示多肽筛选完整实操方案｜RhE 抗原靶向肽全流程实验与量化数据

HML-vision

Linux安装——虚拟机安装方式

中小企业如何利用短视频实现获客增长

[机器学习]Kaggle:Hull Tactical - Market Prediction-有效市场

阿里云ECS安全组与远程连接设置完全指南

AI Agent 常见架构全景

【AI原生QLoRA优化实战手册】：2026奇点大会首发的7大量化LoRA训练避坑法则（含GPU显存压缩42%实测数据）

广东中高端休闲棉布/弹力斜纹染色布/混纺类面料/牛仔布料/印花涂层工艺布厂家优选