『』如何在联邦训练中跟踪模型性能指标( 三 )



『』如何在联邦训练中跟踪模型性能指标
本文插图

其中I? , I?指整个机器学习数据集中正类/负类的点数 , 而I?_m , I?_m分别指第m个设备中的相应数 。它遵循:
『』如何在联邦训练中跟踪模型性能指标
本文插图

情况2.1:仅设备之间的f?分布相同
这具有以下含义:
『』如何在联邦训练中跟踪模型性能指标
本文插图

其中FPR' (T) = d FPR (T)/ dT 。 所有设备的加权平均ROC-AUC得分如下:
『』如何在联邦训练中跟踪模型性能指标
本文插图

即等于整个数据集的ROC-AUC分数 。如果每个设备I?_m中来自正类的元素数相同 , 则最后一个等式简化为(9) 。
为了说明这一点 , 我们可以对上一节中使用的4个设备再次使用相同的样本 。 我们使用相同的数据 , 在本例中 , 这些数据在设备之间的分布方式是:只有属于负类的数据点在所有设备之间是相同的分布 。
『』如何在联邦训练中跟踪模型性能指标
本文插图

在这种特定情况下 , 四种设备的ROC-AUC分数是不同的:
『』如何在联邦训练中跟踪模型性能指标
本文插图

但是整个数据集的ROC-AUC分数和ROC-AUC分数的平均值为:
『』如何在联邦训练中跟踪模型性能指标
本文插图

这种微小的差异可以通过设备中的数据集具有有限数量的点这一事实来解释 。
情况2.2:仅设备之间的f?分布相同

『』如何在联邦训练中跟踪模型性能指标
本文插图

我们可以像使用(12b)来证明(13)一样使用公式(14):
『』如何在联邦训练中跟踪模型性能指标
本文插图

在每个设备中具有相同数量的正类I?_m的样本的情况下 , 此等式简化为(9) , 即平均ROC-AUC分数再次等于整个数据集的ROC-AUC分数。
为了说明这一点 , 我们可以再次使用与上一节中使用的4个设备相同的例子 。 我们使用相同的数据 , 在本例中 , 这些数据在设备之间的分布方式是:只有属于正类的数据点在所有设备之间是相同的分布 。
『』如何在联邦训练中跟踪模型性能指标
本文插图

在这种特定情况下 , 四种设备的ROC-AUC分数是不同的:
『』如何在联邦训练中跟踪模型性能指标
本文插图

但是整个数据集的平均ROC-AUC得分和ROC-AUC得分为:
『』如何在联邦训练中跟踪模型性能指标
本文插图

情况2.3:设备之间的f?和f?分布都不相同
在这种情况下 , 我们不能期望(9)式得到满足 。 如果设备之间的f?和f?不同 , 则(9)的两侧也不相等 。
最后
在本文中 , 我们研究了与在计算机上计算完整数据集的ROC-AUC分数的情况相比 , 多个设备(每个设备均拥有本地数据集)之间的ROC-AUC分数的加权平均值如何变化 。 单个设备 。 两个指标相等的充分条件是 , 所有设备之间的正分数或负分数的分布是相同的 。


推荐阅读