监督学习算法
监督学习概述
监督学习是机器学习中最常用的方法之一,它通过已标记的训练数据学习输入到输出的映射关系。主要包括分类和回归两大类问题。
分类问题
- 目标:预测离散类别
- 应用:垃圾邮件检测、图像分类
- 评估:准确率、精确率、召回率
回归问题
- 目标:预测连续值
- 应用:房价预测、销量预测
- 评估:MSE、RMSE、R²
常用算法详解
1. 线性回归
通过线性方程拟合数据,预测连续值
- 原理:最小化均方误差
- 优点:简单直观、计算效率高
- 缺点:只能处理线性关系
- 应用:房价预测、销量预测
2. 逻辑回归
用于二分类问题,输出概率值
- 原理:Sigmoid函数映射概率
- 优点:可解释性强、训练速度快
- 缺点:只能处理线性可分问题
- 应用:信用评分、疾病诊断
3. 决策树
通过树形结构进行决策
- 原理:信息增益/基尼系数
- 优点:可解释性强、处理非线性关系
- 缺点:容易过拟合
- 应用:客户分类、风险评估
4. 支持向量机
寻找最优分类边界
- 原理:最大化分类间隔
- 优点:泛化能力强、处理高维数据
- 缺点:计算复杂度高
- 应用:文本分类、图像识别