沧州三亚菏泽经济预测自然
投稿投诉
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产
菏泽德阳
山西湖州
宝鸡上海
茂名内江
三亚信阳
长春北海
西安安徽
黄石烟台
沧州湛江
肇庆鹤壁
六安韶关
成都钦州

首次发现!数据异构影响联邦学习模型,关键在于表征维度坍缩

3月3日 终不悔投稿
  施宇钧NUS投稿
  量子位公众号QbitAI
  随着深度学习大获成功,保护用户数据隐私变得越来越重要。
  联邦学习(FederatedLearning)应运而生,这是一种基于隐私保护的分布式机器学习框架。
  它可以让原始数据保留在本地,让多方联合共享模型训练。
  但它有一个问题数据的异质化(dataheterogeneity),即不同的参与方的本地数据来自不同的分布,这将严重影响全局模型的最终性能,背后原因也十分复杂。
  字节跳动、新加坡国立大学及中科院自动化所的学者们首次发现了关键影响因素。
  即:数据异质化导致了表征的维度坍缩(dimensionalcollapse),由此大大限制了模型的表达能力,影响了最终全局模型的性能。
  为了缓解这一问题,研究人员提出了一个新联邦学习正则项:FedDecorr。
  结果表明,使用该方法后,数据异质化带来的维度坍缩问题被有效缓解,显著提升模型在该场景下的性能。
  同时这一方法实现简单,几乎不会带来额外计算负担,可以很容易地加入到多种联邦学习算法上。如何影响?观察一:更严重的数据异质化会为全局模型(globalmodel)带来更严重的维度坍缩
  首先,为了更好地理解数据异质化是如何影响全局模型输出表征的,研究人员探索了随着数据异质化越来越严重,全局模型输出表征是如何而变化的。
  基于模型输出的表征,估计其表征分布的协方差矩阵(covariancematrix),并且按照从大到小的顺序可视化了该协方差矩阵的特征值。结果如下图所示。越小,异质化程度越高,为正无穷时为同质化场景。k为特征值的index。
  对于该曲线,如果特征值大部分相对较大,即意味着表征能够更加均匀地分布在不同的特征方向上。而如果该曲线只有前面少数特征值较大,而后面大部分特征值都很小,就意味着表征分布被压缩在少数特征方向上,即维度坍缩现象。
  因此,从图中可以看到,随着数据异质化程度越来越高(越来越小),维度坍缩的现象就越来越严重。观察二:全局模型的维度坍缩来自联邦参与各方的局部模型的维度坍缩
  由于全局模型是联邦参与各方的局部模型融合的结果,因此作者推断:全局模型的维度坍缩来源于联邦参与各方的局部模型的维度坍缩。
  为了进一步验证该推断,作者使用与观察1类似的方法,针对不同程度数据异质化场景下得到的局部模型进行了可视化。结果如下图所示。
  从图中可以看到,对于局部模型,随着数据异质化程度的提升,维度坍缩的现象也越来越严重。因此得出结论,全局模型的维度坍缩来源于联邦参与各方的局部模型的维度坍缩。怎么解决?
  受到以上两个观察的启发,由于全局模型的维度坍缩来源于本地局部模型的维度坍缩,研究人员提出在本地训练阶段来解决联邦学习中的表征维度坍缩问题。
  首先,一个最直观的可用的正则项为以下形式:
  其中
  为第
  个特征值。该正则项将约束特征值之间的方差变小,从而使得较小的特征值不会偏向于0,由此缓解维度坍缩。
  然而,直接计算特征值往往会带来数值不稳定,计算时间较长等问题。因此借助以下proposition来改进方法。
  为了方便处理,需要对表征向量做zscore归一化。这将使得协方差矩阵变成相关系数矩阵(对角线元素都是1)。
  基于这个背景,可以得到以下proposition:
  这一proposition意味着,原本较为复杂的基于特征值的正则化项,可以被转化为以下易于实现且计算方便的目标:
  该正则项即是简单的约束表征的相关系数矩阵的Frobeniusnorm更小。研究人员将该方法命名为FedDecorr。
  因此,对于每个联邦学习参与方,本地的优化目标为:
  其中
  为分类的交叉熵损失函数,为一个超参数,即FedDecorr正则项的系数。实验结果
  首先,验证使用FedDecorr是否可以有效缓解维度坍缩。
  在0。010。05这两个强数据异质化的场景下,观察使用FedDecorr对模型输出表征的影响。
  结果如下图所示。
  可以看到,使用FedDecorr可以有效地缓解本地局部模型的维度坍缩,从而进一步缓解全局模型的维度坍缩。
  在CIFAR10100两个数据集上验证方法。研究团队发现FedDecorr可以很方便的加入到之前提出的多个联邦学习方法,并且带来显著提升:
  同时,为了展示方法的可扩展性,作者在较大规模数据集(TinyImageNet)上进行了实验,并且也观察到了显著提升:
  此外还基于TinyImageNet,验证了FedDecorr在更大规模联邦参与方的场景下的有效性。
  结果如下表。通过实验结果展示了FedDecorr可以被用于较大规模联邦参与方的场景。
  FedDecorr对正则项系数(超参数)的鲁棒性结果如下图所示。
  通过实验,发现FedDecorr对于其超参数有较强的鲁棒性。
  同时发现将设为0。1是一个不错的默认值。
  最后,研究人员验证了在联邦学习时,使用不同的localepoch下FedDecorr也可以带来普遍的提升:
  论文地址:
  https:arxiv。orgabs2210。00226
  代码链接:
  https:github。combytedanceFedDecorr
  完
  量子位QbitAI头条号签约
  关注我们,第一时间获知前沿科技动态
投诉 评论

国产化及智能时代下的软件质量与安全高端技术论坛举办日前,中国航天科工集团有限公司(以下简称航天科工)所属的航天中认软件测评科技(北京)有限责任公司(以下简称航天中认)举办了国产化及智能时代下的软件质量与安全高端技术论坛。中国工……JDG2比0战胜V5,队员表现引发热议,赛后米勒的一番话很真不知不觉本次的英雄联盟LPL春季赛也已进行到白热化阶段,在刚刚结束的JDG对阵V5的比赛中,JDG以2比0的比分战胜V5赢下比赛,此战过后JDG本次春季赛的战绩也来到了121,……25分14篮板!北京首钢23岁中锋新赛季爆发,球队内线核心出在2122CBA联赛的首轮比赛中,不少国内球员都有非常出色的发挥。北京首钢有两名球员的表现非常亮眼,分别是伤愈复出的翟晓川和内线主力范子铭。在首场比赛中,翟晓川得到了21分13……ampampquot梅开二度ampampquot大S容忍前夫官宣离婚4个月后大S火速嫁给20年前曾纹在脚踝上的男人2022年3月大S官宣与年过半百的具俊晔结婚此事瞬间掀起互联网的腥风血雨不过熟悉内幕的人都知道……爱了爱了,这3款神级Windows软件,直接让电脑好用到飞起话不多说,直接进入分享正文PotPlayer,这是一款拥有强悍解码能力的视频播放器,几乎支持市面上所有的音频视频格式。接下来小编介绍一下它的另一个强大的功能,就是它支持m……中国青少年滑雪公开赛分站赛重庆收官新华社重庆2月12日电(记者谷训)12日,明日之星20222023中国银行中国青少年滑雪公开赛重庆站落下帷幕。这是本赛季最后一站分站赛,也是唯一一场在室内滑雪场举办的赛事。……沈梦辰婚后首次走机场,拎13万爱马仕开心成眯眯眼,王菲同款抢经历了随大流的潮流风格后,如今辨识度成了检验造型风格的重要因素,而搭配理念也被极大地激发,除了着重于造型设计感外,利用混搭手法强调个人特色的造型,更强烈的表达着个人的审美色彩。……莫拉蒂国米对巴萨时表现出色,希望张康阳继续执掌俱乐部直播吧10月14日讯前国米主席莫拉蒂称赞国米对巴萨时表现出色,并希望张康阳继续留在国米。在本周中的欧冠小组赛,国米客场33战平巴萨,获得小组出线主动权。而这场比赛也让人想……杜锋拒绝放人,乔帅男篮遭遇人员危机,如此做法可真是太不地道!北京时间2月1日,新一期中国男篮国家队就将正式集结,这将是男篮新任主教练乔尔杰维奇,上任以来组织的第一次集训,从此前公布的人员名单来看,相比杜锋执教时期的用人,作为国际名帅的乔……文化和旅游部办公厅关于进一步规范旅游市场秩序的通知来源:文旅之声目前,旅游市场整体运行平稳有序,逐步呈现复苏发展的良好势头。但不合理低价游、导游辱骂游客、强迫购物等现象有所抬头,严重干扰正常市场秩序,严重影响旅游业整体形象。在……首次发现!数据异构影响联邦学习模型,关键在于表征维度坍缩施宇钧NUS投稿量子位公众号QbitAI随着深度学习大获成功,保护用户数据隐私变得越来越重要。联邦学习(FederatedLearning)应运而生,这是一种……WBG寄!被TT,2比0!英雄联盟这款游戏相信不少玩家都是关注的,随着IG和TES的IG正统之战结束以后,今日的比赛也是TT和WBG的对决。在比赛开始之前,很多玩家都是看好今日的WBG,毕竟WBG在面对……
心链全国首座装配式高层产业空间,建成后将实现年产值36亿元坪山汽鼠年月宝宝起名政府公债基金的价格是多少秦始皇芈华的关系芈华人物介绍八戒夫妇果酒怎么做好喝三种常见的果酒的制作方法2023年购置税还减半吗?新能源补贴政策是怎样的?加里纳利我想要在本赛季参加比赛我想打季后赛大话西游手游普通女仙一个技能,打出七千万伤害,怎么做到的?我的妈妈好像没朋友除了去三亚,冬天去哪里温暖又好玩,云南这四座城市千万别错过

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找