电子商务网站模板,如何外贸网站推广,北京网站备案流程,网页设计制作公司价格便宜夏普利值的介绍
沙普利值是合作博弈理论中的一个概念#xff0c;由劳埃德-沙普利在1951年提出了这个概念#xff0c;并因此在2012年获得了诺贝尔经济学奖。对于每个合作博弈#xff0c;如联邦学习#xff0c;可以将机构产生的模型的总提升在各个机构上形成一个有效的贡献分…夏普利值的介绍
沙普利值是合作博弈理论中的一个概念由劳埃德-沙普利在1951年提出了这个概念并因此在2012年获得了诺贝尔经济学奖。对于每个合作博弈如联邦学习可以将机构产生的模型的总提升在各个机构上形成一个有效的贡献分配。沙普利值的特点是有一系列的理想属性。 存在以下特点 1.对称性合作获利的分配不随每个人在合作中的记号或次序变化 2.有效性合作各方获利总和等于合作获利 3.冗员性如果一个成员对于任何他参与的合作联盟都没有贡献则他不应当从全体合作中获利 4.有多种合作时每种合作的利益分配方式与其他合作结果无关
定义
从形式上看一个联盟博弈的定义是有一个集合N(n个)和一个函数v该玩家的子集映射到实数 v : 2 n → R , v ( ∅ ) 0 v:2^n \rightarrow R,v(\empty)0 v:2n→R,v(∅)0。其中 ∅ \empty ∅表示空集。函数v被称为特征函数。
函数v的含义如下如果S是一个玩家联盟那么v(S)称为联盟S的价值表示S的成员通过合作可以获得的总的预期报酬总和。
Shapley值是将总收益分配给参与者的一种方式假设他们都进行合作。它是一种 公平 的分配因为它是唯一具有以下某些理想特性的分配。根据沙普利值在给定的联盟博弈(v,N)中玩家i得到的金额是 ϕ i ( v ) ∑ S ⊆ N ∖ { i } ∣ S ∣ ! ( n − ∣ S ∣ − 1 ) ! n ! [ v ( S ∪ { i } ) − v ( S ) ] \phi_i(v) \sum_{S \subseteq N \setminus \{i\}} \frac{|S|!(n - |S| - 1)!}{n!} \left[v(S \cup \{i\}) - v(S)\right] ϕi(v)S⊆N∖{i}∑n!∣S∣!(n−∣S∣−1)![v(S∪{i})−v(S)]
S是从N中除i以外的所有玩家组成的任意子集|S|是子集S中的元素个数也就是除了玩家i之外其他玩家的数量n是集合N中总的玩家数量 v ( S ∪ { i } ) v(S \cup \{i\} ) v(S∪{i})表示在集合S加上玩家i后形成的联盟所带来的收益 v ( S ) v(S) v(S)表示仅由集合S中的玩家构成的联盟所带来的收益
该公式可以解释如下设想联盟是由多个玩家组成的每个玩家要求他们的贡献v(S\cup {i})-v(S)作为公平补偿。对每个玩家来说在可能形成联盟的不同排列组合中取这个贡献的平均值。
其等价公式如下 ϕ i ( v ) 1 n ! ∑ R [ v ( P i R ∪ i ) − v ( P i R ) ] \phi_i(v)\frac{1}{n!}\sum_R[v(P^R_i \cup {i})-v(P^R_i)] ϕi(v)n!1R∑[v(PiR∪i)−v(PiR)]
所有玩家的排列R的总数为 n ! n! n!, P i R P^R_i PiR是R中第i个玩家之前的排序。
举例
假设有三个机构{ABC}进行联邦学习: 三个机构分别单独训练可以得到 v A 0.80 , v B 0.70 , v C 0.75 v_A0.80,v_B0.70,v_C0.75 vA0.80,vB0.70,vC0.75, 两两联合训练的正确率为 v A B 0.85 , v B C 0.80 , v A C 0.90 v_{AB}0.85,v_{BC}0.80,v_{AC}0.90 vAB0.85,vBC0.80,vAC0.90, 集合起来一起训练得 v A B C 0.95 v_{ABC}0.95 vABC0.95 问应该如何分配模型的贡献率
对于机构A而言
order R P i R P^R_i PiR价值ABC ∅ \empty ∅V({A})-V({ ∅ \empty ∅})0.8ACB ∅ \empty ∅V({A})-V({ ∅ \empty ∅})0.8BACBV({A,B})-V({B})0.15BCAB,CV({A,B,C})-V({B,C})0.15CABCV({A,C})-V({C})0.15CBAB,CV({A,B,C})-V({B,C})0.15
对于A而言贡献为 ( 0.8 ∗ 2 0.15 ∗ 4 ) / 3 ! 0.366666..... (0.8*20.15*4)/3!0.366666..... (0.8∗20.15∗4)/3!0.366666.....
对于机构B而言
order R P i R P^R_i PiR价值ABCAV({A,B})-V({A})0.05ACBA,CV({A,B,C})-V({A,C})0.05BAC ∅ \empty ∅V({B})-V({ ∅ \empty ∅})0.7BCA ∅ \empty ∅V({B})-V({ ∅ \empty ∅})0.7CABC,AV({A,B,C})-V({A,C})0.05CBACV({B,C})-V({C})0.05
对于B而言贡献为 ( 0.7 ∗ 2 0.05 ∗ 4 ) / 3 ! 0.266666..... (0.7*20.05*4)/3!0.266666..... (0.7∗20.05∗4)/3!0.266666.....
对于机构C而言
order R P i R P^R_i PiR价值ABCA ,BV({A,B,C})-V({A,B})0.10ACBAV({A,C})-V({A})0.10BACA,BV({A,B,C})-V({A,B})0.10BCABV({B,C})-V({B})0.10CAB ∅ \empty ∅V({C})-V({ ∅ \empty ∅})0.75CBA ∅ \empty ∅V({C})-V({ ∅ \empty ∅})0.75
对于C而言贡献为 ( 0.75 ∗ 2 0.1 ∗ 4 ) / 3 ! 0.3166666..... (0.75*20.1*4)/3!0.3166666..... (0.75∗20.1∗4)/3!0.3166666.....
三个机构的总贡献率为0.36666…0.2666…0.31666…0.95
参考
https://www.jianshu.com/p/f02320e1f091 https://zhuanlan.zhihu.com/p/483891565