百度网站类型,电商网站建设哪个好,十堰网站建设有哪些公司,群团组织网站建设来源#xff1a;知乎作者#xff1a;知乎—机器学习小谈地址#xff1a;https://zhuanlan.zhihu.com/p/368755357本文以 A Survey on Neural Network Interpretability 读后感为主#xff0c;加上自身的补充#xff0c;浅谈神经网络的可解释性。论文#xff1a;https://a… 来源知乎作者知乎—机器学习小谈地址https://zhuanlan.zhihu.com/p/368755357本文以 A Survey on Neural Network Interpretability 读后感为主加上自身的补充浅谈神经网络的可解释性。论文https://arxiv.org/abs/2012.14261本文按照以下的章节进行组织人工智能可解释性的背景意义神经网络可解释性的分类总结01人工智能可解释性的背景意义1.1 什么是可解释性Interpretability (of a DNN) is the ability to provide explanations in understandable terms to a human. F Doshi-Velez B Kim, 2017解释Explanations是指需要用某种语言来描述和注解理想情况下严谨的数学符号-逻辑规则是最好的解释D Pedreschi et al., 2019。实际上人们往往不强求“完整的解释”只需要关键信息和一些先验知识可解释的边界Explainable Boundary是指可解释性能够提供解释的程度来自XAI的对于不同的听众解释的深度也有所不同应该是需求而定。例如为什么你这么聪明因为我喜欢吃鱼。为什么吃鱼会聪明因为鱼类富含DHA。为什么DHA聪明...... 因为根据不同的人群我们的可解释的工作也不一样。例如给大众解释吃鱼能够聪明就行了因为吃鱼能够聪明我们很多人已经从小到大耳熟能详了。如果我们给专业人士解释DHA为什么会是大脑聪明我们身边很多人也答不出来这已经远超出我们计算机这个领域了。当然可解释的这种边界越深这个模型的能力也越强。可理解的术语Understandable Terms是指构成解释的基本单元不同领域的模型解释需要建立在不同的领域术语之上不可能或者目前难以用数学逻辑符号来解释。例如计算机视觉中的image patchesNLP中的单词等。而可理解的术语可以理解为计算机跟我们人类能够沟通的语言。以前我们很多研究关于人类跟计算机表达的语言例如计算机指令现在是反过来计算机根据现有的模型给我们解释1.2 为什么需要可解释性高可靠性的要求a神经网络在实践中经常有难以预测的错误进一步的研究是对抗样本攻击与防御这对于要求可靠性较高的系统很危险b可解释性有助于发现潜在的错误也可以通过debug而改进模型伦理/法规的要求AI医疗目前一般只作为辅助性的工具是因为一个合格的医疗系统必须是透明的、可理解的、可解释的可以获得医生和病人的信任。司法决策面对纷繁复杂的事实类型除了法律条文还需要融入社会常识、人文因素等。因此AI在司法决策的事后必须要给出法律依据和推理过程。作为其他科学研究的工具科学研究可以发现新知识可解释性正是用以揭示背后原理。02神经网络可解释性的分类2.1 按照逻辑规则解释Rule as Explanation图左是一颗关于判断西瓜好坏的决策树经过DFS后我们可以抽取出右图的规则。而对于神经网络我们是否也可以类似决策树这样做呢答案是肯定的。第一种方法是分解法遍历所有特征的排列组合分解法最简单但是缺点也是显而易见的就是时间复杂度太高虽然KT算法有所优化但是指数形式的复杂度还是难以投入实际使用。于是我们引入第二种方法教育法[1]DecText-决策树抽取器主要采用经过黑箱子的数据来抽取黑箱子的规则并且与其他决策树不同的是该方法除了使用标记数据还可以使用未标记数据以及随机数据只要经过神经网络黑箱子都可以获得标签。对比仅用训练集由于传统决策树进行生成叶子比生成其根的可信度还要低因为能用于划分界限的数据越来越少。所以DecText有一个优势就是可以利用更多的无标记数据甚至随机数据进行补充。但是一般论文也不会提及到自身设计的大多数缺点。例如这里我认为有两大缺点。一、无标记数据或者随机数据其实有很多是超过解释的意义例如人脸识别如果我们倒入一些不及格的人脸甚至随机的图像决策树也会对这些图像进行开枝散叶降低了真正解释人脸的枝叶的占比。二、决策树不能表达太深的网络决策树越深性能会急剧下降可解释性也越差。Tree Regulartion[2]提出了树正则的方法来抑制了树的深度。树正则通过引入深度损失正则项在优化时候会抑制树的深度。而树的深度则是通过一个简单的预估网络进行预估需要的参数就是主网络的参数。2.2 按照语义进行解释类比人类开始对细胞解释的时候无法一下子直接从细胞本身理解这个细胞的类别或者功能但是可以从细胞群或者组织例如表皮细胞组织来从宏观角度了解细胞的作用。神经网络亦是如此。例如卷积神经网络浅层的卷积网络往往关注更基础的图像信息例如纹理、颜色等而越往上层则越能抽象出更丰富的语义例如人脸识别的眼睛、鼻子等。其中经典代表就是计算机视觉中的经典方法-可视化[3]可视化的方法非常多比如说有一个华人的博士就可视化了CNN把每一层都展示得非常清楚只需要在网页上点击对于的神经元就可以看到工作流程。右边是一位维也纳的小哥本来搞unity3D特效开发的他把整个CNN网络用3d的形式可视化了出来。cnn_visualfeaturemap_layout另外一种主动的按照语义进行解释的代表作可解释卷积神经网络[4]Interpretable convolutional neural networks.与传统的卷积神经网络不同的是ICNN的每一个卷积核尽量只代表一种概念例如传统的卷积核对猫的头或者脚都有较大的激活值而ICNN只能选择最大的一种。2.3 通过示例解释这种方法容易理解是一种直观方法寻找和待解释的样本最“相似”的一个训练样本典型的代表作 Understanding black-box predictions via inflfluence functions,[5]2.4 按照属性解释按照属性解释目前内容上最。如前面提及到决策树等透明模型难以模仿复杂的神经网络那怎么解决呢针对此问题研究的代表作有Why should i trust you?: Explaining the predictions of any classififier[6]由于LIME不介入模型的内部需要不断的扰动样本特征这里所谓的样本特征就是指图片中一个一个的像素了。但如果LIME采样的特征空间太大的话效率会非常低而一张普通图片的像素少说也有上万个。若直接把每个像素视为一个特征采样的空间过于庞大严重影响效率如果少采样一些最终效果又会比较差。所以针对图像任务使用LIME时还需要一些特别的技巧也就是考虑图像的空间相关和连续的特性。不考虑一些极小特例的情况下图片中的物体一般都是由一个或几个连续的像素块构成所谓像素块是指具有相似纹理、颜色、亮度等特征的相邻像素构成的有一定视觉意义的不规则像素块我们称之为超像素。下面提供一些主动干预型的方法如Dual-net[7]其他的还有用意想空间的对话系统[8]这种解释的类型是最有深度而且也是用户最容易理解的。但是对AI模型和训练难度也更高了。目前这方面的研究屈指可数。03可解释性总结参考1.“Extracting Decision Trees From TrainedNeural Networks”. SIGKDD. July 23-26,2002 https://dl.acm.org/doi/10.1145/775047.7751132.M. Wu, S. Parbhoo, M. C. Hughes, R.Kindle, L. A. Celi, M. Zazzi, V. Roth, and F. Doshi-Velez, “Regional treeregularization for interpretability in deep neural networks.” in AAAI, 2020,pp. 6413–6421. https://arxiv.org/abs/1908.044943.K. Simonyan, A. Vedaldi, and A.Zisserman, “Deep inside convolutional networks: Visualising imageclassification models and saliency maps,” arXiv preprint arXiv:1312.6034, 2013.4.Q. Zhang, Y. Nian Wu, and S.-C. Zhu, “Interpretable convolutional neural networks,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018.5.P. W. Koh and P. Liang, “Understanding black-box predictions via influence functions,” in Proceedings of the 34th International Conference on Machine Learning-Volume 70, 2017.6.M. T. Ribeiro, S. Singh, and C. Guestrin, “Why should i trust you?: Explaining the predictions of any classifier,” in Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining, 2016.7.M. Wojtas and K. Chen, “Feature importance ranking for deep learning,” Advances in Neural Information Processing Systems, vol. 33, 2020.8.Open Domain Dialogue Generation with Latent Images Z Yang, W Wu, H Hu, C Xu, Z Li - arXiv preprint arXiv:2004.01981, 2020 - arxiv.org https://arxiv.org/abs/2004.01981未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市云脑研究计划构建互联网城市云脑技术和企业图谱为提升企业行业与城市的智能水平服务。 如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”