在sklearns confusion_matrix中 "归一化 "参数是什么意思?

我正在使用sklearns confusion_matrix 包来绘制结果,再加上准确率、召回率和精度分数等,图表的显示效果也是如此。然而,我有点困惑的是,不同的值对于什么是 normalize 参数的平均值。我们为什么要这样做,这3个选项之间有什么不同?如引用他们的文档。

normalize{‘true’, ‘pred’, ‘all’}, default=None
Normalizes confusion matrix over the true (rows), predicted (columns) conditions or all the population. 
If None, confusion matrix will not be normalized.

如果数据集太大,它是否会将点归一化为百分比格式,以方便视觉?还是说我在这里完全错过了重点。我搜索了一下,但问题似乎都是在说明如何做,而不是背后的意义。

解决方案:

是的,你可以把它看成一个百分比。默认情况是只显示混淆矩阵中每个单元格的绝对计数值,即真实和预测类别水平的每个组合出现的频率。

但如果您选择例如 normalize='all'每一个计数值都会被所有计数值的总和所除,因此您的相对频率在整个矩阵中的总和为1。 同样,如果您选择了 normalize='true',你将有每行的相对频率。

给TA打赏
共{{data.count}}人
人已打赏
未分类

亚马逊AppFlow与亚马逊EventBridge在事件驱动的交互中的比较

2022-9-13 15:24:36

未分类

加零,使所有子集的大小相同,然后将它们相加,并在excel中显示出来

2022-9-13 15:24:38

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索