分类预测
分类预测基本概念
1. 基本定义
分类预测是一种监督学习方法,用于预测离散的类别标签。
# 基本概念
1. 分类(Classification)
- 预测离散类别
- 二分类问题
- 多分类问题
2. 评估指标
- 准确率(Accuracy)
- 精确率(Precision)
- 召回率(Recall)
- F1分数
3. 混淆矩阵
- 真阳性(TP)
- 假阳性(FP)
- 真阴性(TN)
- 假阴性(FN)
# 示例
数据集:
X = [
[1, 2],
[2, 1],
[8, 9],
[9, 8]
]
y = [0, 0, 1, 1]
预测结果:
y_pred = [0, 0, 1, 1]
准确率 = 1.02. 分类算法
分类算法可以根据不同的特征进行分类。
# 分类算法 1. 基于树 - 决策树 - 随机森林 - 梯度提升树 2. 基于概率 - 朴素贝叶斯 - 逻辑回归 - 最大熵模型 3. 基于距离 - K近邻 - SVM - 神经网络 # 特点比较 1. 决策树 - 优点:可解释性强 - 缺点:容易过拟合 2. 随机森林 - 优点:抗过拟合 - 缺点:计算复杂度高 3. SVM - 优点:泛化能力强 - 缺点:对大规模数据慢
3. 应用场景
分类预测在各个领域都有广泛的应用。
# 应用场景 1. 金融风控 - 信用评分 - 欺诈检测 - 风险评估 2. 医疗诊断 - 疾病预测 - 药物反应 - 治疗方案 3. 图像识别 - 目标检测 - 人脸识别 - 场景分类 4. 自然语言 - 文本分类 - 情感分析 - 垃圾邮件检测 # 实际案例 1. 信用评分 - 基于历史数据 - 基于行为特征 - 基于社交网络 2. 医疗诊断 - 基于症状 - 基于检查结果 - 基于基因数据