当前位置：首页 > news >正文

零基础学AI人工智能：10.3 ANN人工神经网络

news 2026/6/25 14:43:41

承接上一篇 PyTorch 框架的工程基础内容，我们正式进入神经网络的基础结构学习。ANN（人工神经网络）是所有深度学习网络的底层原型，它模拟生物大脑神经元的连接逻辑搭建计算结构，具备极强的非线性拟合能力。本篇将从结构概述、激活函数、参数初始化、损失函数、优化策略、正则化、工程搭建全流程拆解 ANN 的完整知识体系。

一、ANN 人工神经网络概述

1.1核心定义

ANN 通过神经元相互连接搭建计算网络，模拟生物神经网络的信息传递逻辑，实现对现实复杂事物规律的拟合，完成分类、回归等各类机器学习任务。

1.2网络结构组成

标准全连接 ANN 分为三层结构：

输入层：神经元数量等于样本的特征列数，负责接收原始输入特征；
隐藏层：可以设置多层，为网络引入非线性拟合能力，让网络可以处理复杂任务；同层神经元之间无连接，本层每个神经元会和上一层所有神经元建立全连接，搭配专属的权重w与偏置b；
输出层：根据任务类型设置神经元数量，输出最终预测结果。

二、常用激活函数

激活函数是给神经网络引入非线性能力的核心组件，若无激活函数，多层全连接网络等价于单层线性模型，无法拟合复杂模式。主流激活函数特性与适用场景如下：

激活函数	取值范围	特性与适用场景
Sigmoid	输出(0,1)，导数(0,0.25)	兼顾正负样本，易出现梯度饱和，多用于二分类任务的输出层
Tanh	输出(-1,1)，导数(-1,1)	正负样本区分效果更明显，多用于隐藏层
ReLU	正数保留、负数置 0	仅考虑正样本，缓解深层网络梯度消失；衍生变体 Leaky ReLU、PReLU 解决了原生 ReLU 神经元死亡的缺陷，是深层网络隐藏层的首选
Softmax	所有输出和为 1	将加权结果转化为类别概率分布，专门用于多分类任务的输出层

2.1 激活函数选择通用策略

隐藏层：ReLU 及变体优先 > Tanh > Sigmoid
二分类输出层：Sigmoid
多分类输出层：Softmax
回归输出层：线性恒等映射 Identity

三、参数的初始化

3.1初始化目的

合理设置权重、偏置的初始值，可以有效加快模型收敛速度，避免训练初期就出现梯度消失 / 梯度爆炸问题。

3.2常用初始化方案

1. 基础通用初始化：

均匀分布uniform_、正态分布normal_、全零zeros_、全一ones_、自定义常数constant_；

2. 适配激活函数的优化初始化：

1. Kaiming 初始化（kaiming_uniform_/kaiming_normal_）：专门适配 ReLU 系列激活函数；

2. Xavier 初始化（xavier_uniform_/xavier_normal_）：适配 Tanh、Sigmoid 类激活函数。

四、损失函数

损失函数用来衡量模型预测结果和真实标签的差距，是模型优化的目标依据，根据任务类型分为三类：

4.1回归任务（连续值预测）

常用指标：MSE 均方误差、MAE 平均绝对误差、RMSE 均方根误差、SmoothL1 平滑 L1 损失。

4.2分类任务（离散类别预测）

深度学习主流使用交叉熵损失：二分类任务用二分类交叉熵，多分类任务用多分类交叉熵。

4.3聚类任务

常用 SSE 误差平方和、CH 轮廓系数这类聚类评估指标作为优化目标。

五、梯度下降优化介绍

梯度下降是 ANN 更新参数、最小化损失的核心算法，原生梯度下降存在训练瓶颈，有两类主流优化方向：

5.1原生梯度下降的痛点

在参数空间的平缓区域下降速度极慢，且容易陷入局部最优，无法找到全局最优解。

5.2优化改进方案

梯度层面优化（动量 + 自适应学习率）：依次衍生出动量 Momentum、AdaGrad、RMSprop，最终整合出工业界广泛使用的 Adam 自适应优化器；
学习率策略优化：分为手动调整固定学习率、自适应学习率优化两大类。

六、正则化相关

正则化的核心目标是缓解模型过拟合，思维导图介绍了两种最常用的方案：

6.1 Dropout随机失活

训练阶段会以设定概率p（通常取0.2∼0.5）随机让部分神经元失效，同时用1/(1-p)缩放保留神经元的权重；测试阶段会关闭该机制。可以削弱批次训练中样本差异带来的过拟合问题。

6.2 BN批量归一化

对每一批次的输入数据做标准化处理，再加入平移、缩放参数修正分布，解决训练过程中的内部协变量偏移问题，大幅加快训练收敛速度，提升模型泛化能力。

七、如何搭建人工神经网络

7.1前期思路分析（编码前必做）

统计数据集的特征列数，确定输入层神经元数量；
规划隐藏层的层数、每层的神经元个数；
分析输出层：判断任务是二分类 / 多分类 / 回归，确定输出神经元数量；
为每一层匹配适配的激活函数、参数初始化方式。

7.2 PyTorch实现流程

自定义网络类，继承nn.Module基类；
在__init__()方法中定义、搭建网络各层结构；
在forward()方法中编写前向传播逻辑，最终返回预测结果。

7.3扩展调试工具

可以使用torchsummary库的summary()函数，一键统计网络的参数量、每层维度等信息，方便结构调试。

八、总结

ANN 是深度学习所有复杂网络的基础原型，完整掌握它的结构设计、激活函数选型、参数初始化、损失与优化、正则化、工程落地全流程，就具备了搭建基础神经网络的能力。后续会基于 ANN 的原理，拓展适配图像任务的卷积神经网络 CNN。

http://www.gsyq.cn/news/1587324.html

相关文章：

终极AI视频插值指南：使用Flowframes轻松提升视频帧率的完整教程

FPGA数据流编程与HLS优化实战指南

2026 年易柯森特：北京民营企业借工程监理优化施工管理

终极指南：689款开源macOS应用全收录，打造你的专属生产力工具箱！

注塑模与冲压模

5分钟掌握Android台球辅助神器：精准瞄准终极指南

Sunshine游戏串流终极指南：打造专属云游戏服务器的完整教程

HS2-HF Patch：5分钟构建Honey Select 2专业级模组生态系统技术指南

DDD-031：案例：电商订单系统 DDD 建模

智能体A/B测试：两套prompt线上比效果

路径遍历漏洞深度解析：从原理到实战修复

【2026年华为暑期实习-非AI方向(通软嵌软测试算法数据科学)- 6月24日-第三题- 容器镜像Top-K大小统计】（题目+思路+JavaC++Python解析+在线测试)

英国邮编级医疗可及性分析管道：量化健康空间不平等

“伪”字系列的认知异化：论证伪主义在AI时代的意识形态扭曲与科学精神的系统性溃败

泛基因组 | 分享一套“数据下载、质控、组装、矫正、注释到泛基因组统计与绘图“的泛基因组分析组装代码

MC9S08SE8中断与看门狗实战：从寄存器配置到系统稳定设计

3个步骤搭建你的专属游戏串流服务器：Sunshine完全指南

向量检索退化危机

【Agent Harness】Gliding Horse 的Token经济学：用 IRI 指针替代文本，让 Token 花在刀刃上

minimind系统学习教程 - 基础组件02：位置编码（Position encoding）

工程师视角的AI技术简报：如何将Newsletter转化为可执行知识

从HDMI规范看HDMI接口电路设计

FanControl完整指南：如何免费掌控Windows电脑风扇，告别噪音烦恼

你AI的 localhost:3000，可以立刻在网上访问了！

Poly Haven Assets：Blender中获取免费3D资源库的终极指南

从AI用户到建造者：2025年可落地的AI系统工程实践指南

可以边录边编辑的音乐平台，多款录音修音一体化工具实操分享

AI录音后期处理软件：录歌、修音、剪辑导出一体化工具梳理

Ryujinx：终极Nintendo Switch模拟器完整指南与快速上手教程

为什么创作者要关心 CLI