论坛网站建设规划书,珠海市网站建设分站怎么样,东莞好的网站建设公司,做推广哪个平台好文章目录1.本文问题2.方法3.用于4. 结论1.本文问题
解决问题#xff1a;
去噪 shifted label distribution 普遍存在此问题#xff0c;但大家都不解决#xff0c;只着重于抛弃噪声实例远程监督标记的噪声数据#xff08;KB)和人类标注的测试集分布不同 pipeline pipelin…
文章目录1.本文问题2.方法3.用于4. 结论1.本文问题
解决问题
去噪 shifted label distribution 普遍存在此问题但大家都不解决只着重于抛弃噪声实例远程监督标记的噪声数据KB)和人类标注的测试集分布不同 pipeline pipeline会增加噪声的传递–传递错误
2.方法
本文方法多智能体合作重新标注噪声实例的联合模型
细粒度地处理 原来舍弃或留下二选一仅对FP本文分配置信度重新标记 选择目标噪声实例 输入 KG embedding: transE–type embedding extractor: PCNN仅有关系抽取实体部分使用CoTypeCoType(比PCNN好因为PCNN是pipeline的 多智能体MRL 每个智能体从自己的角度单独计算一个连续的置信度 相互独立–分散的 利用实体和关系之间的关联性curriculum PPO reward大于threshold或者队列满了–使用PPO学习agent策略curriculum learnin 队列和采样的目的加强任务之间的交互信息和加强agent的探索 confident consensus module:聚合多智能体的智慧置信度 连续使用置信度重新分布noisy training data 用于调整loss使用RL去探索合适的标签分布通过使用置信标签重分布训练集 这个方法实用并且是robust的并不使用真实世界应用的测试集的信息不引入真实世界的额外的知识
3.用于
本文方法可作为post-processing pluginDS,WS
4. 结论
jointpipelineMRLjoint:MRL可以重新标记实例