导航菜单

神经网络基础

神经网络结构可视化

输入层隐藏层输出层

前向传播与反向传播流程

输入数据前向传播输出/损失反向传播参数更新

神经网络的基本概念

神经元模型

神经元是神经网络的基本单元,模拟了生物神经元的工作方式:

  • 输入:接收多个输入信号
  • 权重:每个输入都有对应的权重
  • 偏置:用于调整神经元的激活阈值
  • 激活函数:引入非线性变换
  • 输出:产生单个输出信号

网络结构

神经网络由多层神经元组成,主要包括:

  • 输入层:接收原始数据
  • 隐藏层:进行特征提取和转换
  • 输出层:产生最终预测结果
  • 层间连接:全连接或部分连接
  • 前向传播:信息从输入层流向输出层

学习过程

神经网络通过以下步骤进行学习:

  • 前向传播:计算预测值
  • 损失计算:评估预测误差
  • 反向传播:计算梯度
  • 参数更新:优化网络权重
  • 迭代训练:重复以上步骤

激活函数

常用激活函数

  • Sigmoid函数
    • 输出范围:(0,1)
    • 特点:平滑、可导
    • 缺点:梯度消失问题
  • ReLU函数
    • 输出范围:[0,∞)
    • 特点:计算简单、缓解梯度消失
    • 缺点:死亡ReLU问题
  • Tanh函数
    • 输出范围:(-1,1)
    • 特点:零中心化
    • 缺点:梯度消失问题

激活函数的选择

选择激活函数时需要考虑的因素:

  • 任务类型:分类/回归
  • 网络深度:深层网络常用ReLU
  • 计算效率:ReLU计算简单
  • 梯度特性:避免梯度消失/爆炸
  • 输出范围:根据任务需求选择