导航菜单

监督学习算法

监督学习概述

监督学习是机器学习中最常用的方法之一,它通过已标记的训练数据学习输入到输出的映射关系。主要包括分类和回归两大类问题。

分类问题

  • 目标:预测离散类别
  • 应用:垃圾邮件检测、图像分类
  • 评估:准确率、精确率、召回率

回归问题

  • 目标:预测连续值
  • 应用:房价预测、销量预测
  • 评估:MSE、RMSE、R²

常用算法详解

1. 线性回归

通过线性方程拟合数据,预测连续值

  • 原理:最小化均方误差
  • 优点:简单直观、计算效率高
  • 缺点:只能处理线性关系
  • 应用:房价预测、销量预测

2. 逻辑回归

用于二分类问题,输出概率值

  • 原理:Sigmoid函数映射概率
  • 优点:可解释性强、训练速度快
  • 缺点:只能处理线性可分问题
  • 应用:信用评分、疾病诊断

3. 决策树

通过树形结构进行决策

  • 原理:信息增益/基尼系数
  • 优点:可解释性强、处理非线性关系
  • 缺点:容易过拟合
  • 应用:客户分类、风险评估

4. 支持向量机

寻找最优分类边界

  • 原理:最大化分类间隔
  • 优点:泛化能力强、处理高维数据
  • 缺点:计算复杂度高
  • 应用:文本分类、图像识别