支持向量机分类回归
省流
### **支持向量机(SVM)**
**1. 核心作用**
- **分类**:寻找最大间隔超平面,**高维小样本数据分类能力强**(如文本、基因数据)。
- **回归(SVR)**:拟合误差容忍范围内的最优函数,**抗噪声干扰**。
- **核技巧**:通过核函数(线性/高斯/多项式)处理**非线性可分问题**。
**2. 能解决的问题**
- **高维分类**:图像识别(手写数字、医学影像)、文本分类(情感分析)。
- **回归预测**:小样本连续值预测(如股价波动、工业参数控制)。
- **异常检测**:通过间隔边界识别离群点(如金融欺诈、设备异常)。
- **非线性建模**:复杂边界数据分类(如螺旋分布数据)。
**3. 典型应用场景**
- **生物医学**:癌症亚型分类、基因表达数据分析
- **金融**:信用评分、高频交易信号识别
- **工业**:传感器数据异常检测、质量控制
- **计算机视觉**:人脸识别、目标检测
**4. 常用方法**
- **分类(SVC)**:软间隔优化(处理噪声)、核函数选择(RBF高斯核最常用)。
- **回归(SVR)**:ε-不敏感损失函数控制拟合误差容忍度。
- **多分类扩展**:一对多(OvR)或一对一(OvO)策略。
**5. 使用建议**
- **数据预处理**:标准化(SVM对特征尺度敏感)。
- **参数调优**:重点调节惩罚系数C、核函数参数(如高斯核的γ)。
- **适用场景**:样本量适中(千级以内)、特征维度高或需强非线性建模时优先。
- **对比选择**:与随机森林、神经网络对比精度与计算效率。
---
**简练总结**:SVM是 **高维小样本、非线性问题** 的强效工具,数学建模中适合图像、文本分类及复杂回归题,需注意 **核函数选择** 和 **计算复杂度** 平衡。