那么如何绘制ROC曲线呢?这里也需要我们通过阈值来绘制(与之前一样 , 遍历所有阈值来绘制整条曲线的) 。 当改变阈值时 , 那么预测出正样本和负样本的数目也随之变化 , 如下图:
7AUC值AUC(AreaUnderCurve)指的是ROC曲线下的面积大小 , 该值能够量化地反映基于ROC曲线衡量出的模型性能 。 计算AUC值只需要沿着ROC横轴做积分就可以了 。 由于ROC曲线一般都处于y=x这条直线的上方(如果不是的话 , 只要把模型预测的概率反转成1?p就可以得到一个更好的分类器) , 所以AUC的取值一般在0.5~1之间 。 AUC越大 , 说明分类器越可能把真正的正样本排在前面 , 分类性能越好 。 具体计算方法可参考文献[3] 。
8混淆矩阵混淆矩阵(ConfusionMatrix)也称错误矩阵 , 通过它可以直观地观察到算法的效果 。 它的每一列是样本的预测分类 , 每一行是样本的真实分类(反过来也可以) , 顾名思义 , 它反映了分类结果的混淆程度 。 混淆矩阵i行j列的原始是原本是类别i却被分为类别j的样本个数 , 计算完之后还可以对之进行可视化 , 可看看文献[2]中的混淆矩阵图片演示:
估算模型全局性能的方法有两种:宏平均(macro-average)和微平均(micro-average) 。 综合来看宏平均会比微平均更可靠一些 , 因为微平均受稀有类别影响更大 。 宏平均平等对待每一个类别 , 所以它的值主要受到稀有类别的影响 , 而微平均平等考虑数据集中的每一个样本 , 所以它的值受到常见类别的影响比较大 。
推荐阅读
-
-
-
美伊说科技“国版苹果”出现,堪称是 5G 界的一匹黑马,开售后秒售罄
-
-
-
「央行」央行传来一则“重磅利好”,A股2900点“稳了”?
-
上桌|入秋,这菜正肥美,城里一斤6块,农村多得没人要,蒸一蒸就上桌
-
拥抱|没有胜算,也要全力以赴,《cheer up》第6集:拥抱真爱
-
移动|Supercell CEO曾预期的“深层社交玩法”正成为可能
-
[大河财立方]星巴克与红杉中国达成战略合作,加速零售创新
-
娱之乐最前线|38岁的女人不化妆,就是这个样子了,陈意涵素颜照出炉
-
【军事管制要开心】一个重要细节,体现特朗普的幼稚,安倍和《自然》为新冠问题道歉
-
时尚指南|天天洗头很干净?实话告诉你:频繁洗头会带来3个危害
-
浪迹金融|仅浙江未公布,养老金上调最新消息:30省出台养老金调整方案
-
孩子总是两面派爱说谎怎么办 两岁孩子撒谎背后的心理
-
科学技术宅|Plus诞生,两款机器首发!,“打脸”魅族高管,骁龙865
-
没经验爸爸说育儿|6岁女儿独自等待妈妈生二胎,说出的话让人心酸,深夜的产房外
-
-
-
ZAKER我要展示硬气功!,拳航百姓擂台将开打!传武抗打哥放话:不要头盔