AUC

shiiiilong / 2023-04-28 / 原文

AUC （Area Under Curve）

定义

定义1：ROC曲线所围成的面积
定义2：分别随机从正负样本集中抽取一个正样本，一个负样本，正样本的预测值大于负样本的概率。

ROC曲线

横坐标为伪阳性率 (FPR: False Positive Rate)，纵坐标为真阳性率 (TPR: True Positive Rate)

		预测
		1	0
实际	1	TP	FN
	0	FP	TN

FPR：负样本中判为正例的概率

\[\frac{FP}{FP+TN} \]

TPR：正样本中判为正例的概率（Recall）

\[\frac{TP}{TP+FN} \]

ROC曲线上的每一个点对应于一个threshold，对于一个分类器，每个threshold下会有一个TPR和FPR。比如Threshold最大时，TP=FP=0，对应于原点；Threshold最小时，TN=FN=0，对应于右上角的点(1,1)

AUC的优点

评估效果不受阈值选择的影响。
当测试集中的正负样本分布发生变化了，ROC曲线可以保持不变。在实际的数据集中经常会出现类不平衡（class imbalance）现象，即负样本比正样本多很多（或者相反），而且测试数据中的正负样本的分布也可能随着时间变化。

在上图中，(a)和(c)为ROC曲线，(b)和(d)为Precision-Recall曲线。

(a)和(b)展示的是分类其在原始测试集（正负样本分布平衡）的结果，(c)和(d)是将测试集中负样本的数量增加到原来的10倍后，分类器的结果。

可以明显的看出，ROC曲线基本保持原貌，而Precision-Recall曲线则变化较大。

AUC计算方式

方法一：

积分算面积

方法二：

任意给一个正类样本和一个负类样本，正类样本的score有多大的概率大于负类样本的score。

然后在有限样本中用频率估计概率

\[AUC=\frac{\sum{Score_p >S core_n}}{positiveNum*negativeNum} \]

举个例子：

score	0.9	0.8	0.7	0.7	0.7	0.5	0.4
	正	负	负	正	正	负	正

score为0.9的正样本，后面有3个负样本

score为0.7的两个正样本，后面各有1.5个负样本（0.7的负样本因为和他们同分，算0.5 个）

\[AUC=\frac{3+1.5+1.5}{4*3} \]

改进：Group AUC

以广告领域，在样本中有多个用户时，A用户的正例和B用户的负例就没有比较意义的（因为用户广告之间的排序是个性化的，不同用户的排序结果不太好比较，可能auc这个指标失真了）

所以可以先求每个用户的AUC，再求加权和

\[GAUC=\frac{\sum_{i\in Person }{W_i*AUC_i}}{\sum_{i\in Person}{W_i}} \]

AUC更多相关文章

Redis持久化机制（面试考点）与位图API

NOIP2024模拟赛20 & 11.1 小记

20241101 数据结构与算法期中机试收获

什么是IT技术

即将到来！

舍得-时间-工作是人的一生最重要的事情-自己要有私房钱-人的一生最重要的事情是书写自己的人生

2.TiUP 部署 DM 集群

ubuntu 24.04 部署 mysql 8.4.3 LTS

随机推荐

NOIP2024模拟赛20 & 11.1 小记

20241101 数据结构与算法期中机试收获

Java，启动！

什么是IT技术

即将到来！

2024/11/1日日志关于JavaScript简介&引入方式以及基础语法的学习

舍得-时间-工作是人的一生最重要的事情-自己要有私房钱-人的一生最重要的事情是书写自己的人生

2.TiUP 部署 DM 集群

原型模式的C++实现

python bytecode解析

09-XSS键盘监听、cookie窃取&文件上传绕过

ubuntu 24.04 部署 mysql 8.4.3 LTS

国标GB28181公网平台LiteGBS国标GB28181视频平台建筑工地无线视频联网监控系统方案

imes完工下线

android 13 更改手机信号调整

BFS(Breath First Search 广度优先搜索)

Visual Studio Code（VSCode）中设置中文界面

影响黄金价格大幅波动的因素主要有哪些？

winform用Dev的TreeList滚动到指定节点的位置

Angular 18 上手开发

AUC