简单神经网络
概述
简单神经网络是深度学习的基础,通常指包含一个或少数几个隐藏层的前馈神经网络,是理解复杂神经网络架构的起点。
主要特点
- 前馈结构:信息从输入层单向流向输出层
- 全连接:相邻层的神经元全部连接
- 非线性激活:使用激活函数引入非线性
基本结构
1. 输入层 (Input Layer)
- 接收原始特征数据
- 节点数量等于特征维度
2. 隐藏层 (Hidden Layer)
- 提取数据特征
- 可以有多个隐藏层
- 节点数量影响模型容量
3. 输出层 (Output Layer)
- 产生最终预测结果
- 节点数量取决于任务类型
激活函数
常用激活函数
- Sigmoid:将输出映射到(0,1)区间
- Tanh:将输出映射到(-1,1)区间
- ReLU:修正线性单元,max(0,x)
训练过程
1. 前向传播
- 计算各层输出
- 得到预测结果
2. 计算损失
- 使用损失函数衡量预测误差
- 常用均方误差、交叉熵等
3. 反向传播
- 计算梯度
- 更新权重和偏置
应用领域
- 分类问题
- 回归问题
- 模式识别
- 函数逼近