当前位置：首页 > news >正文

《我看见的世界：李飞飞自传》第7-12章阅读笔记：从ImageNet到以人为本的AI

news 2026/5/25 22:17:46

前言

在上一篇文章中，我们跟随李飞飞的脚步，走过了她从移民少女到找到人生"北极星"的前半段旅程。她在AI寒冬中坚守，提出了一个当时被视为"疯狂"的假设：如果我们给计算机提供足够多、足够丰富的数据，它就能像人类一样学会"看见"世界。

今天，我们将继续解读这本书的后6章，看看李飞飞是如何用ImageNet验证这个假设，如何引爆了席卷全球的深度学习革命，以及她在功成名就之后，如何面对科技与伦理的冲突，最终找到自己的"下一颗北极星"的。

这6章不仅是一部技术发展史，更是一位科学家的心灵成长史。它告诉我们：真正的伟大，不在于你创造了什么，而在于你用你创造的东西，为这个世界带来了什么。

07 一个假设：数据是人工智能的新石油

章节核心：这一章详细阐述了李飞飞提出的"数据驱动AI"的核心假设。在当时算法至上的主流观点中，这个假设显得格格不入，但它最终改变了人工智能的发展轨迹。

7.1 当时的主流认知：算法为王

2006年前后，计算机视觉领域的主流观点认为：算法的优劣是决定性能的关键因素。大多数研究者都在致力于改进特征提取算法，比如SIFT、HOG等，认为只要找到更好的特征描述子，就能解决计算机视觉的核心问题。

李飞飞在书中写道：“当时的计算机视觉界就像一个盲人摸象的游戏。每个人都在研究大象的不同部位，却没有人愿意退后一步，看看整头大象是什么样子。”

研究者们普遍认为，数据只是验证算法的工具，而不是推动技术进步的核心动力。他们满足于在小规模数据集上取得的微小进步，却没有意识到，数据规模的限制才是计算机视觉发展的真正瓶颈。

7.2 李飞飞的颠覆性假设

李飞飞从人类的学习过程中得到了启发。一个孩子在成长过程中，会看到数百万张不同的图片，接触到成千上万种不同的物体。正是这种海量的视觉经验，让孩子学会了识别和理解世界。

她提出了一个颠覆性的假设：“如果我们能够为计算机提供与人类相当的视觉经验数据，那么即使是相对简单的学习算法，也能表现出惊人的性能。”

这个假设可以用一个简单的公式来表示：
AI性能∝f(数据量,算法复杂度,计算力) \text{AI性能} \propto f(\text{数据量}, \text{算法复杂度}, \text{计算力})AI性能∝f(数据量,算法复杂度,计算力)

在当时，大多数人都认为算法复杂度是这个函数中最重要的变量。但李飞飞却认为，数据量才是决定AI性能上限的关键因素。

7.3 一个孤独的先行者

当李飞飞提出这个假设时，她几乎遭到了所有人的反对。

"这是一个愚蠢的想法。"一位资深教授对她说，“计算机视觉的问题不是数据不够多，而是我们没有找到正确的算法。”

"收集这么多数据需要花费数百万美元，没有人会为你提供资金。"另一位同事警告她。

甚至连她的学生都不理解她：“李老师，我们为什么要做这种费力不讨好的事情？我们可以写几篇算法论文，很快就能毕业。”

但李飞飞没有动摇。她在书中写道：“我知道我是对的。历史会证明这一点。”

她开始用自己的科研经费购买服务器，亲自从互联网上爬取图片。这个过程非常缓慢，但她一步一个脚印，坚定地朝着自己的目标前进。

08 实验验证：ImageNet与深度学习的黎明

章节核心：这一章讲述了ImageNet从一个疯狂的想法变成现实的全过程，以及2012年AlexNet在ImageNet挑战赛上的历史性胜利。这一天，不仅是计算机视觉的转折点，也是整个人工智能领域的转折点。

8.1 创建ImageNet的艰辛历程

创建ImageNet的过程，比李飞飞想象的还要艰难。

首先是数据收集的问题。她和她的团队需要从互联网上爬取数十亿张图片，然后筛选出符合要求的图片。这个过程不仅需要大量的计算资源，还需要解决版权、内容过滤等一系列问题。

然后是数据标注的问题。他们需要为每一张图片标注出它所属的类别。如果按照传统的方式，雇佣专业的标注人员，这将花费数千万美元和数年的时间。

就在李飞飞一筹莫展的时候，她发现了亚马逊的Mechanical Turk众包平台。这个平台允许她将标注任务分发给全球各地的工作者，每个人只需要完成简单的标注任务，就能获得少量的报酬。

这是一个革命性的想法。通过众包，李飞飞将原本需要数年才能完成的标注工作，压缩到了几个月。最终，ImageNet包含了1400万张标注图片，涵盖了22000个物体类别，是当时世界上最大的图像数据集。

8.2 ImageNet挑战赛的诞生

2009年，ImageNet正式发布。但李飞飞并没有就此止步。她意识到，仅仅有一个数据集是不够的，还需要建立一个统一的基准，来比较不同算法的性能。

于是，她发起了ImageNet大规模视觉识别挑战赛(ILSVRC)。这个挑战赛每年举办一次，吸引了全球顶尖的研究机构和科技公司参加。

挑战赛的任务很简单：给定一张图片，算法需要从1000个类别中识别出图片中包含的物体。评分标准是Top-5错误率，即算法给出的前5个预测中，没有包含正确类别的比例。

在第一届ImageNet挑战赛中，最好的算法的Top-5错误率是26%。这个结果在当时已经非常不错了，但李飞飞知道，这还远远不够。

8.3 2012年：深度学习革命的引爆点

2012年，第三届ImageNet挑战赛如期举行。这一年，一个来自多伦多大学的团队提交了一个名为AlexNet的算法。

当结果公布时，所有人都惊呆了。AlexNet的Top-5错误率只有15.3%，比第二名低了整整10个百分点！

这是一个历史性的时刻。在此之前，深度学习还只是一个边缘领域，很少有人相信它能解决实际问题。但AlexNet的胜利，向全世界证明了深度学习的巨大潜力。

李飞飞在书中写道：“那一刻，我知道，一个新的时代开始了。我们的假设被验证了。数据驱动的方法，确实是解决计算机视觉问题的正确道路。”

AlexNet的胜利，引发了席卷全球的深度学习革命。一夜之间，几乎所有的科技公司都开始投入巨资研究深度学习。人工智能，终于从实验室走向了现实世界。

09 万物以外是什么：从物体识别到理解世界

章节核心：ImageNet的成功，让计算机视觉领域迎来了前所未有的繁荣。但李飞飞并没有沉浸在胜利的喜悦中。她开始思考一个更深刻的问题：计算机视觉的终极目标是什么？仅仅是识别物体吗？还是理解整个世界？

9.1 计算机视觉的黄金时代

2012年之后，计算机视觉领域进入了一个黄金时代。新的算法层出不穷，性能不断刷新纪录：

2014年，GoogLeNet将Top-5错误率降低到6.7%
2015年，ResNet将Top-5错误率降低到3.57%，已经超过了人类的平均水平(5%)

计算机视觉技术也开始在各个领域得到广泛应用：

人脸识别：解锁手机、支付验证
自动驾驶：识别道路、车辆、行人
医疗影像：诊断癌症、糖尿病视网膜病变
安防监控：异常行为检测、人脸识别

李飞飞在书中写道：“我们曾经梦想的事情，正在一个个变成现实。计算机终于学会了’看见’世界。”

9.2 超越物体识别

但李飞飞很快意识到，物体识别只是计算机视觉的第一步。人类的视觉系统不仅能识别物体，还能理解物体之间的关系，理解场景的语义，甚至能预测未来会发生什么。

她在书中提出了一个著名的问题：“一张图片胜过千言万语，但计算机能说出这千言万语吗？”

为了回答这个问题，李飞飞和她的团队开始研究更高级的计算机视觉任务：

图像描述：用自然语言描述一张图片的内容
视觉问答：回答关于图片的问题
视频理解：分析视频中的动作和事件
场景图生成：构建图片中物体之间的关系图

这些研究，将计算机视觉从"感知"阶段推向了"认知"阶段。

9.3 人工智能的终极目标

在这一章的结尾，李飞飞对人工智能的终极目标进行了深刻的思考。

她写道：“人工智能的终极目标，不是创造出比人类更聪明的机器，而是创造出能够与人类合作、帮助人类更好地生活的机器。”

“计算机视觉的终极目标，也不是让机器像人类一样’看见’世界，而是让机器能够理解人类的意图，能够与人类进行自然的交互，能够帮助人类解决那些我们自己无法解决的问题。”

这个观点，为她后来提出"以人为本的AI"核心理念奠定了基础。

10 似易实难：从实验室到现实世界的跨越

章节核心：当深度学习技术在实验室取得巨大成功之后，李飞飞开始思考如何将这些技术应用到现实世界中。这一章讲述了她离开斯坦福加入谷歌云，以及创建AI4ALL的经历。她发现，将技术从实验室带到现实世界，比在实验室里发明技术要困难得多。

10.1 加入谷歌云：将AI民主化

2016年，李飞飞做出了一个让所有人都感到意外的决定：离开斯坦福大学，加入谷歌云，担任首席人工智能科学家。

她在书中解释了自己的决定：“在斯坦福，我可以培养最优秀的AI人才，可以做出最前沿的研究。但我想做更多。我想让AI技术惠及每一个人，而不仅仅是少数科技公司和研究机构。”

在谷歌云，李飞飞的目标是将AI民主化。她带领团队开发了Google Cloud AI平台，让任何企业和个人都能轻松地使用最先进的AI技术，而不需要拥有自己的AI团队和计算资源。

她推出了AutoML，这是一个自动机器学习平台，即使是没有机器学习背景的人，也能通过简单的操作，训练出自己的AI模型。

10.2 创建AI4ALL：让AI更包容

在推动AI技术落地的同时，李飞飞也注意到了一个严重的问题：AI领域的多样性严重不足。

她在书中写道：“AI正在塑造我们的未来，但参与塑造这个未来的人，却不能代表我们整个社会。女性、少数族裔、来自发展中国家的人，在AI领域的代表性严重不足。”

这种多样性的缺乏，会导致AI系统产生偏见，甚至会加剧社会的不平等。

为了解决这个问题，李飞飞在2017年创立了AI4ALL组织。这个组织的使命是：培养来自不同背景的下一代AI人才，让AI技术的发展更加包容和公平。

AI4ALL为高中女生和少数族裔学生提供免费的AI教育和实习机会，帮助他们进入AI领域。截至2025年，AI4ALL已经培养了超过10000名学生，其中70%是女性，60%来自低收入家庭。

10.3 现实世界的挑战

在谷歌云的工作经历，让李飞飞深刻体会到了将AI技术从实验室带到现实世界的困难。

她在书中写道：“在实验室里，我们只需要关心算法的性能。但在现实世界中，我们需要考虑更多的问题：数据隐私、算法偏见、安全风险、法律合规、用户体验等等。”

例如，一个在实验室里表现完美的医疗AI模型，在实际应用中可能会因为数据分布的差异而表现不佳。一个用于招聘的AI系统，可能会因为训练数据中的偏见而歧视女性和少数族裔。

这些挑战，让李飞飞更加坚定了"以人为本的AI"的理念。她认为，AI技术的发展，必须始终以人类的福祉为中心。

11 无人可控：站在科技与伦理的十字路口

章节核心：这一章是全书最沉重、也最深刻的一章。李飞飞讲述了她在谷歌期间经历的Maven项目争议，以及她对AI伦理和责任的思考。她意识到，AI技术的威力越大，它带来的风险也就越大。如果我们不能很好地控制它，它可能会给人类带来灾难性的后果。

11.1 Maven项目的风暴

2017年，谷歌与美国国防部签署了一份合同，参与Maven项目。这个项目的目标是利用AI技术分析无人机拍摄的视频，帮助军方识别目标。

这个消息曝光后，在谷歌内部引发了轩然大波。超过4000名谷歌员工签署了联名信，抗议谷歌参与军事项目。他们认为，AI技术不应该被用于战争，谷歌应该坚守"不作恶"的原则。

作为谷歌云的首席AI科学家，李飞飞被推到了风暴的中心。她面临着一个艰难的抉择：一边是公司的商业利益，一边是自己的科学良知。

她在书中写道：“那是我人生中最艰难的一段时光。我每天都在思考，我做的事情是对的吗？我是不是在帮助制造武器？我是不是在背叛自己的理想？”

11.2 AI的威力与责任

Maven项目的争议，让李飞飞对AI的伦理和责任有了更深刻的认识。

她在书中写道：“AI是人类有史以来发明的最强大的技术之一。它可以用来治愈疾病、消除贫困、改善环境，也可以用来制造武器、监控人民、操纵舆论。”

“技术本身是中性的，但使用技术的人是有善恶的。作为AI研究者，我们不仅有责任推动技术的进步，更有责任确保技术被用于善的目的。”

这让她想起了2018年在国会听证会上说过的话：“人工智能的威力越大，责任也就越大。”

11.3 以人为本的AI

在Maven项目争议之后，李飞飞更加坚定地倡导"以人为本的AI"理念。

她提出了"以人为本的AI"的三个核心原则：

AI应该服务于人类福祉：AI技术的发展应该以改善人类生活为目标
AI应该尊重人类权利：AI系统应该保护用户的隐私和数据安全，避免歧视和偏见
AI应该是透明和可解释的：人类应该能够理解AI系统的决策过程，能够对其进行监督和控制

她呼吁全球的AI研究者、企业和政府共同努力，建立一个全球性的AI治理体系，确保AI技术的发展始终沿着正确的方向前进。

2018年底，谷歌宣布不会续约Maven项目。李飞飞也在同年离开了谷歌，回到了斯坦福大学。

12 下一颗北极星：AI的未来与人类的使命

章节核心：这一章是全书的总结和升华。李飞飞回顾了自己的人生旅程，分享了她对AI未来的展望，以及她找到的"下一颗北极星"。她告诉我们，人生的意义不在于你取得了多大的成就，而在于你为这个世界留下了什么。

12.1 回到斯坦福：重新出发

回到斯坦福大学后，李飞飞并没有停下脚步。她成立了斯坦福以人为本人工智能研究院(HAI)，致力于研究AI的伦理、政策和社会影响。

她的研究方向也发生了转变。她不再仅仅关注技术本身，而是更加关注技术与人类的关系。她开始研究医疗AI，希望用AI技术帮助医生更好地诊断和治疗疾病。她也开始研究AI教育，希望培养更多有社会责任感的AI人才。

她在书中写道：“我回到斯坦福，是为了重新出发。我想做一些更有意义的事情，一些能够真正改变世界的事情。”

12.2 下一颗北极星

在全书的结尾，李飞飞再次提到了"北极星"这个隐喻。

她写道：“小时候，我在成都郊外的星空下第一次知道了北极星。它是夜空中最亮的星，也是唯一一颗永远不会移动的星。它指引着迷路的人找到回家的路。”

“在我的人生中，我也有过很多颗北极星。小时候，我的北极星是考上大学，让父母过上好日子。后来，我的北极星是创建ImageNet，让计算机学会’看见’世界。再后来，我的北极星是倡导以人为本的AI，让技术服务于人类福祉。”

“现在，我找到了我的下一颗北极星：用AI解决人类最紧迫的问题，让这个世界变得更加美好。”

12.3 给下一代的寄语

最后，李飞飞给下一代AI研究者留下了一段深情的寄语：

“亲爱的年轻朋友们，你们生活在一个伟大的时代。AI技术正在改变着我们的世界，也为你们提供了前所未有的机会。”

“我希望你们能够保持好奇心，永远对世界充满探索的欲望。我希望你们能够保持坚韧不拔的毅力，在遇到困难的时候不要轻易放弃。我希望你们能够保持人文关怀，永远不要忘记，技术的最终目的是服务于人类。”

“愿你们都能找到自己的北极星，愿你们都能在自己的人生道路上，发出属于自己的光芒。”

后6章核心感悟与启示

读完《我看见的世界》全书，我有以下几点深刻的感悟：

1. 伟大的创新源于敢于挑战主流观点

李飞飞的成功，首先源于她敢于挑战主流观点的勇气。在所有人都认为算法为王的时候，她提出了数据驱动的方法；在所有人都认为创建ImageNet是不可能完成的任务的时候，她坚持了下来。

真正的创新，往往不是在主流观点的基础上修修补补，而是颠覆主流观点，开辟一条全新的道路。

2. 坚持长期主义，做难而正确的事

创建ImageNet用了李飞飞整整3年的时间。在这3年里，她没有发表多少论文，也没有获得多少荣誉。但她知道，这是一件难而正确的事情。

今天，我们生活在一个浮躁的时代，每个人都追求快速成功。但真正有价值的事情，往往都需要长期的坚持和付出。只有那些愿意坐冷板凳、愿意做难而正确的事的人，才能最终取得伟大的成就。

3. 科技的发展不能脱离人文关怀

李飞飞的人生旅程，给我们最大的启示就是：科技的发展不能脱离人文关怀。

AI技术是一把双刃剑。它可以给人类带来巨大的福祉，也可以给人类带来巨大的灾难。作为AI研究者和从业者，我们不仅要关注技术的进步，更要关注技术的社会影响。我们要确保AI的发展始终沿着正确的方向前进，让技术成为推动社会进步、改善人类生活的力量。

4. 人生是一场持续寻找北极星的旅程

李飞飞的人生告诉我们，人生不是一条直线，而是一场持续寻找北极星的旅程。在不同的人生阶段，我们会有不同的目标和追求。重要的是，我们要始终保持对生活的热爱，对理想的追求，不断寻找属于自己的北极星。

结语

《我看见的世界》是一本非常值得一读的书。它不仅是李飞飞的个人自传，也是一部人工智能的发展史，更是一部关于人生、理想和责任的思考录。

李飞飞用她的经历告诉我们："看见"不仅是一种视觉能力，更是一种人生境界。

看见自己，知道自己想要什么，知道自己该往哪里去
看见他人，理解他人的痛苦和需求，用自己的能力帮助他人
看见世界，了解世界的复杂性和多样性，用开放的心态拥抱变化
看见未来，洞察技术的发展趋势，用自己的智慧创造更美好的明天

愿我们都能像李飞飞一样，在自己的人生道路上，不断"看见"，不断成长，最终找到属于自己的北极星。

查看全文

http://www.gsyq.cn/news/1384407.html

TShape框架：基于多尺度卷积与双注意力机制的时间序列形态异常检测

2026年全球ODM电脑代工公司综合实力排行盘点 - 奔跑123

C#一维数组

HTW1000 烧录器/仿真器 TENX（十速）/海速芯 MCU在线/串联烧录器单片机开发嵌入式系统应用

绘图工具 | Origin 2025b全流程下载及安装步骤实录

5款小众神仙宝藏软件工具APP，实用又强大

一体机电脑代工企业实力排行：五大核心玩家深度解析 - 奔跑123

企业内统一API网关与Taotoken聚合平台对接方案

终极Chrome画中画扩展：如何在浏览器中实现高效视频多任务处理

深度解析网络设备权限管理工具：中兴光猫工厂模式与Telnet服务完整指南

Hindsight测试策略：单元测试、集成测试和端到端测试

英语阅读_a violent volcanic eruption

AGC 040

LegacyUpdate PowerShell集成：通过COM对象自动化Windows更新管理

自制低成本电感测量仪：基于ATmega328P与LC振荡原理

Unity战斗角色资源包深度解析：动画事件与状态机工程实践

单片机毕业设计——基于STM32智能温室控制系统设计与实现要怎么设计与实现呢（全程可免费指导）

基于雷达与光敏传感器的低功耗智能窗防设备设计与实现

Win11Debloat深度解析：Windows系统优化与预装软件清理技术实现

手把手教你用C语言http-parser库解析HTTP报文（附完整回调函数示例）

自然语言处理的核心技术：这5个模型，NLP从业者必知

Spring Cloud Zuul RateLimit自定义扩展指南：实现自定义Key生成器与错误处理器

Dramatron终极指南：如何用AI快速创作专业剧本的3种简单方法

13-2 IO流原理及流的分类

ESP32+DS3231+ILI9341构建工业级气象预报终端：低成本替代方案

APKToolGUI中的Baksmali/Smali工具链：Android逆向工程的终极指南

ImageSearch错误处理：常见问题排查与解决方案的完整清单

AI Agent从Demo到商用：揭秘10大工程思想，助你避开90%落地坑！

深入解析WinFsp：如何构建用户态Windows文件系统的技术架构

前言