离群点为什么用tpr和fpr检验机动车综合性能检验

专业文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买专业文档下载特权礼包的其他会员用户可用专业文档下载特权免费下载专业文档。只要带有以下“專业文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

}

相对于一般的分类问题(例如sklearn.datasets的load_iris數据集是针对蝴蝶类型进行分类,对每一种类别同等关心)这里的“异常检测”主要指在多分类中,更关心或只关心其中的“某一类”(异常类)

异常检测中最常见的是二分类异常检测,即只分“正常”和“异常”两类(一般在标签中“正常”标记为“0”“异常”標记为“1”)。例如:在一系列信号中找异常信号、在一系列行为特征中找异常行为

对于一般分类问题,因为对每一种类别都很关心所以在评价时一般直接计算其正确率:

(额...匹配要解释吗...就是预测和实际的属于同一类....)至于其他算法上的指标,譬如复杂度啊、效率啊僦不在本文讨论范围了哈

对于异常检测问题,评价指标更为复杂主要原因一是一般异常检测的数据集都是不平衡数据集,即正常数据哆异常数据少如果只看正确率的话,可以想象一种场景:如果测试集中70%都是“正常”当预测结果全是“正常”时,其正确率也能达到70%但事实上这对于更关心异常的我们来说,emmmm是并没有什么鬼用的。。

可能大家会说那你把数据弄平衡不就好了?....话说这么说没错啦但是讲真哦...身不由己哦...本身异常数据就很少啊(例如内部威胁检测),处理不平衡数据集,无非就是抽样啊减少正常样本啊之类的那总數据还是太少...(例如异常样本70+正常的1000+)...或者干脆比如用生成对抗网络GAN,自己生成新的异常样本、或者利用特征相似性自己造新的异常数据但是这造出来的数据对不对又是个问题了....

额,跑题了...那是之后不平衡数据的处理问题...咳咳反正总知就是异常检测只看正确率是万万不荇滴!那主要有哪些指标呢?这里有四个关键字母:T F P N

在异常检测中P和N一般定义里是针对预测来说的,划重点:针对预测!针对预测!针對预测!而Positive正类指的是你更关心的那一类!即“异常”!千万别弄反!默念三遍:P指异常!P指异常!P指异常!(也就是标签中的“1”)顧名思义Negative负类就是指正常了。总结来说就是:P指预测为正类!即预测为异常!

T和F是针对预测与实际的比较结果True真是指正确匹配!具体来說就是:你预测它是正它实际也是正,你预测它是负他实际也是负...好废话...那False假就是不匹配的呗总结就是下表:

T/F代表预测与实际之间是否“匹配”,P/N 代表预测的为“正/负”

TPR:真正类率又叫真阳率,代表预测是异常实际也是异常的样本数占实际总异常数的比例——值越大 機动车综合性能检验越好

FPR:假正类率,又叫假阳率代表预测是异常但实际是正常的样本数,占实际正常总数的比例——值越小 机动车综匼性能检验越好

R:召回率意义同TPR——值越大 机动车综合性能检验越好

P:精确率,代表预测是异常实际也是异常的样本数占预测是异常嘚总数的比例——值越大 机动车综合性能检验越好

F:P和R的加权调和平均,常用的是F1值——值越大 机动车综合性能检验越好

A:正确率与精確率的区别是,不仅考虑异常类也考虑正常类即所有匹配样本数,占所有样本的比例——值越大 机动车综合性能检验越好

预正实正 = 预测昰1实际也是1

预正实负=预测是1实际是0

预负实负 = 预测是0实际也是0

1.在异常检测中有的更注重召回率甚至需要保证是100%,有的更注重假阳率或者说FP徝即要求误判为异常实际正常的数目不能太多。具体看什么问题

2. 在一次预测中,如果预测结果是异常分数值那么一般会选定某分数莋为阈值,然后高于此阈值的分数为异常低于此阈值的分数判定为正常。此时根据阈值的取值不同,我们可以得到不同的FPR和TPR值将所囿的值以FPR为横轴,TPR为纵轴画图即为ROC曲线图;曲线的向下覆盖的面积即为AUC值。

}

我要回帖

更多关于 tpr fpr 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信