指标

真阳率(True positive)： \(TP_{r} = \frac{TP}{(TP+FN)}\) 真正的1中，被预测为1的比例

假阳率(False positive)：\(FP_{r} = \frac{FP}{(FP+TN)}\) 真正的0中，被预测为1的比例

精确率(Precision)：\(Precision = \frac{TP}{(TP+FP)}\) 预测出来的1中，真正为1的比例

召回率(Recall)：\(Recall = \frac{TP}{(TP+FN)}\) 真正的1中，被预测为1的比例

准确率(Accuracy)：\(Accuracy = \frac{(TP+TN)}{(TP+FN+FP+TN)}\) 所有样本中能被正确识别为0或者1的概率

人们通常用精准率和召回率这两个指标，来评价二分类模型的分析效果。

但是当这两个指标发生冲突时，我们就很难进行判断，因此使用调和平均数。

\[ F_1 = 2 \cdot \frac{precision \cdot recall}{precision + recall} \]

因为预测出来的评分需要有一个阈值，才能把他划分为1或者0。

一个阈值对应一组（TPR, FPR），多个阈值就能够得到多组（TPR, FPR），就能得到 ROC曲线。我们希望一组（TPR, FPR）中，TPR越大越好，FPR越小越好。

就是ROC曲线下的面积。