当前位置: 首页 > news >正文

OUC《软件工程原理与实践》- 实验2:深度学习基础 - OUC

实验2:深度学习基础

姓名:qhb 学号:
姓名和学号?
本实验属于哪门课程? 中国海洋大学25秋《软件工程原理与实践》
实验名称? 实验2:深度学习基础
博客链接: 选做

实验内容

代码练习

pytorch练习

练习过程和结果如下:

定义数据

定义数据

定义操作

其中我发现 v = torch.arange(1, 5) $v$默认创建为整数类型,导致$m$与$v$不能做向量积,所以我将$v$转换成浮点型再做运算。

定义操作

螺旋数据分类

使用线性模型和两层神经网络,在相同的学习率($0.001$)和 L2 正则化参数下,分别用 SGD 和 Adam 优化器进行分类,都训练 1000 次。

基础数据绘制

基础数据绘制

构造线性模型分类

构建线性模型分类

构造两层神经网络分类

构建两层神经网络分类

问题总结与体会

【第⼆部分:问题总结】思考下⾯的问题

1、AlexNet有哪些特点?为什么可以比LeNet取得更好的性能?

  • AlexNet的特点:
    • 它具有更深的网络结构和足够大的数据集
    • 它将更深的网络结构和足够大的数据集相结合
    • 它使用ReLU激活函数,有效的缓解了梯度消失问题
  • 为什么可以比LeNet取得更好的性能?
    • ALexNet有八层(5卷积 + 3全连接),而LeNet有五层(2卷积 + 2全连接);更深的层次就意味着网络可以学习到更复杂的层次。所以AlexNet性能更好。
    • AlexNet 是第一个成功大规模使用 ReLU 作为激活函数的 CNN。ReLU 只是一个简单的 max(0, x)操作,比涉及指数运算的 Sigmoid/Tanh 快得多。所以AlexNet的计算更高效。
    • AlexNet使用Dropout正则化,来防止模型过拟合。而LeNet的正则化技术简单,不如AlexNet的正则化技术。
    • AlexNet的数据集规模大于LeNet。

2、激活函数有哪些作⽤?

答:

激活函数是神经网络的基石,没有激活函数,神经网络就失去了大部分的能力。

  • 引入非线性的特征:激活函数一般是非线性的,使整个神经网络具有非线性的拟合能力。如果没有激活函数,无论网络多深,它也只是一个线性模型。
  • 激活函数可以决定神经元的激活状态:激活函数决定了神经元接收到多强的信号才能被激活或触发。
  • 激活函数的梯度特性直接关系到反向传播算法的效果,也就是模型是否可以有效学习。

3、梯度消失现象是什么?

答:

首先说一下梯度下降的含义:参数沿负梯度方向更新可以使函数值下降。

梯度消失现象:

  • 在深层神经网络中,因为在反向传播算法中,从输出层向输入层方向传播的梯度会随着层数的增加快速降低,最终趋近于零;导致网络前面的层的权重参数得不到有效的更新,使网络早期层无法有效从数据中学习。所以增加深度会造成梯度消失,误差无法传播。同时多层神经网络会陷入局部极值,难以训练。
  • 原理:因为计算第$i$层权重的梯度时,需要将损失函数对网络输出的梯度,一层一层的乘以中间层的偏导数;而连乘中每一项都包含激活函数的导数,在梯度小时问题中,罪魁祸首就是这些导数值小于1,导致结果是一个趋于零的数字,也就是梯度消失。

4、神经网络是更宽好还是更深好?

答: 更深比较好。

  • 当神经元总数一定时,增加网络的深度比增加宽度带来更强的网络表示能力,也就是可以产生更多的线性区域。

  • 因为深度和宽度对函数复杂度的贡献是不同的,深度的贡献是指数增长的,而宽度的贡献是线性的。

5、为什么要使⽤Softmax?

  • softmax可以通过指数化和归一化,将抽象的值转化为一个真实的概率分布。
  • softmax可以方法差距,优化训练,为模型的训练过程提供了清晰强大的优化信号。
  • 为梯度下降算法提供了明确的优化方向,让训练更高效、稳定。

6、SGD 和 Adam 哪个更有效?

答:

螺旋数据分类这一实验中,我们发现在学习率为$0.001$和L2正则化参数的情况下,SGD 模型的准确率为 50.4%,而 Adam 模型的准确率为 94.9%。在螺旋数据分类这个任务中,我们发现Adam明显优于SGD。

之后通过查阅资料我发现在追求极致性能的场景下,SGD可以帮你突破性能瓶颈,达到比Adam更高的精度。所以没有绝对的最优,只有更合适的选择。

体会与感悟

过程中遇到的问题

在pytorch练习中,我发现 v = torch.arange(1, 5) $v$默认创建为整数类型,而$m$是float类型,所以$m$和$v$不能做向量积。报错后通过询问AI得以改正。

体会

在本次实验中,我对深度学习基础原理的理解深化了,尤其凸显了模型架构设计的关键性。在螺旋数据集分类任务中,单纯的线性模型表达能力有限,最终准确率仅为50.4%,与随机猜测无异;而通过引入带有非线性激活函数的两层神经网络,模型性能实现了飞跃,准确率显著提升至94.9%。这一对比直观地揭示了激活函数为模型赋予非线性决策能力的核心价值。本次实验也让我关注到优化器选择对训练的影响,Adam的表现明显好于SGD。

http://www.gsyq.cn/news/18842.html

相关文章:

  • 类型转化
  • 事件驱动重塑 AI 数据链路:阿里云 EventBridge 发布 AI ETL 新范式
  • 我把Excel变成了像素画板!用Python实现图片到单元格的映射
  • 2025 年山东染井吉野樱 / 高杆染井吉野樱花 / 染井吉野樱花小苗厂家推荐:绿影园林的培育技术与全规格供应解析
  • 云存储成本自动优化技术解析
  • SAP 中CONCATENATE 空格的时候,空格不生效
  • OIFHA251011 比赛总结
  • 一种智能调度分布式路径计算解决方案
  • 实用指南:SDN 控制器深度剖析:架构、对比与实践部署
  • Halo RAG!
  • 2025 自动门生产厂家最新推荐榜:权威筛选优质品牌,含选购指南与实力厂家深度解析
  • 医德出诊排班挂号管理系统:医院高效运营与便民服务的智能解决方案
  • 2025 年北京市清理化粪池公司最新推荐排行榜:聚焦高压技术与全城服务的权威甄选朝阳区/丰台区/海淀区/通州区清理化粪池厂家推荐
  • 报表方案Stimulsoft 2025.4 重磅发布!新增AI报表助手、C#脚本支持、全新图表类型等多项功能!
  • Prometheus的Exporter的数据采集机制
  • 2025 年珠三角 / 中山 / 东莞 / 佛山厂房出售公司推荐:中创集团产业生态型厂房的价值与服务解析
  • 拷贝和上传文件,涉及隐私协议
  • 2025储罐厂家,钢衬塑储罐,钢塑复合储罐,化工储罐,防腐储罐,PE储罐,盐酸储罐,硫酸储罐,聚丙烯储罐,不锈钢储罐,次氯酸钠储罐各类型最新推荐榜:品质卓越与技术创新的行业先锋!
  • 2025 年国内标志牌生产厂家最新推荐排行榜:聚焦优质企业助力客户精准选择道路/限速/公路/施工/警示/限高/三角/安全标志牌厂家推荐
  • 在Scala中,如何在泛型类中使用类型参数?
  • Maple 2025 来了!AI 赋能 + 6000 + 命令,破解数学计算、科研与教学痛点
  • 2025 护眼台灯厂家最新推荐榜单:权威解析明可达等五强品牌,护眼参数与选购指南全攻略
  • UPage 正式开源!
  • 2025 年无线耳机源头厂家最新推荐榜单:覆盖头戴式 / 电竞 / 平价 / 电脑 / 游戏多品类且聚焦全产业链与精益制造的权威名录
  • 2025 年最新蓝牙耳机源头厂家口碑推荐榜:含琉璃 X 热销 64 万台企业及各类型高性价比品牌优选运动/真无线/头戴式/骨传导/游戏蓝牙耳机厂家推荐
  • OFD文档落地技术路径研究
  • 人工智能与教育pre
  • 2025 仙桃电梯生产厂家推荐榜单:专注多场景垂直交通解决方案!
  • AMD、CMD、UMD、ESM和CommonJS
  • 2025年六角钢厂家最新推荐榜:品质过硬与性价比之选