Softmax回归

概述

Softmax回归(也称为多项逻辑回归)是逻辑回归在多分类问题上的推广,用于将输入分类到多个类别中的一个。

主要特点

  • 多分类:适用于类别数大于2的分类问题
  • 概率输出:输出属于各个类别的概率
  • 互斥类别:假设类别之间互斥

基本概念

1. Softmax函数

  • 将实数向量映射为概率分布
  • 公式:softmax(z_i) = exp(z_i) / Σexp(z_j)
  • 输出概率之和为1

2. 决策边界

  • 线性决策边界
  • 通过权重矩阵W和偏置b定义

3. 损失函数

  • 交叉熵损失
  • 衡量预测概率与真实标签的差异

训练过程

1. 前向传播

  • 计算线性变换:z = Wx + b
  • 应用softmax函数得到概率

2. 计算损失

  • 使用交叉熵损失函数
  • 衡量预测与真实标签的差异

3. 反向传播

  • 计算梯度
  • 更新权重和偏置

与逻辑回归的关系

  • 逻辑回归是Softmax回归的特例(类别数=2)
  • Softmax回归是逻辑回归的推广
  • 两者都使用线性变换和softmax函数

应用领域

  • 图像分类
  • 文本分类
  • 手写数字识别
  • 情感分析