域名申请好了 怎么做网站,微信php网站开发流程图,上海网站设计建设公,百度广告投放电话来源#xff1a;集智俱乐部作者#xff1a;郭瑞东 审校#xff1a;梁金 编辑#xff1a;邓一雪摘要蛋白质结构预测是计算生物学中一个长达半个世纪的重大挑战#xff0c;最近#xff0c;深度学习在这方面取得了前所未有的进展。4月1日#xff0c;一项发表在 Nature Comm… 来源集智俱乐部作者郭瑞东 审校梁金 编辑邓一雪摘要蛋白质结构预测是计算生物学中一个长达半个世纪的重大挑战最近深度学习在这方面取得了前所未有的进展。4月1日一项发表在 Nature Communications 上的最新论文从蛋白质结构预测、蛋白质功能预测、基因工程、系统生物学和数据集成以及系统发育推断五个方面探讨了深度学习的最新进展、局限性和对未来的展望。文章讨论了每个应用领域并讨论了深度学习方法的主要瓶颈如训练数据、问题范围以及在新环境中利用现有深度学习架构的能力最后总结了深度学习在生物科学领域面临的学科相关和一般性挑战。研究领域深度学习结构生物学蛋白质结构论文题目Current progress and open challenges for applying deep learning across the biosciences论文链接https://www.nature.com/articles/s41467-022-29268-7AlphaFold2 成功地预测蛋白质3D结构问题已成为深度学习在计算生物学领域的典型范例。Nature Communication 的综述“在生物学中应用深度学习的当前进展和开放挑战”系统性介绍了在生物学中应用深度学习当前取得的成果以及有待解决的开放性问题。综述先介绍了在生物领域广泛应用的模型架构指出所使用的模型包含有监督、无监督和强化学习三个范式。图神经网络、图像识别CNN以及自然预言处理RNNtransformer中的常见模型都已在生物领域被成功应用。图1. 深度学习所需的数据集的数量级及常用模型文中将取得的成就分为四种范式革命、显著、中等和较小范围内的成功。按照应用场景指出五类问题当前的进展、公开数据集的大小、常用的模型架构。 图2. 深度学习在各个领域取得的进展程度综述指出尽管深度学习在例如蛋白质结构预测取得了范式转移级的成功改变了该领域的默认选项。在更多的领域如蛋白质功能预测、基因工程例如基因编辑和多组学数据集成中也取得了长足的进步。然而相对于传统的方法对于其他领域例如系统发育推断、经典的计算方法在这些领域仍然占据上风。并不是所有深度学习的应用在计算生物学都同样成功。成功的领域高度依赖于具有多样性、无偏采样且贴近实际应用场景的大量有标注及无标准的标准数据集。除了概述各领域的进展该综述的亮点在于指出了在生物领域应用深度学习面对的一般性挑战和可能的解决方案1. 有偏的结论即模型给出的结论和真实情况不符。面对这一问题需要的是改进实验设计避免训练数据和实际数据的分布有差异还需要识别出模型有偏的原因在针对性的使用更公平的模型。2. 较高的计算成本可解决方案是并行运算及优化代码或选用部分核心数据进行训练同时改进AI架构使用更高能耗的计算设施。3. 模型缺少解释性对此一方面可以采用例如SHAP[1]的统计分析对特征的重要性进行评估或使用像GNNExplainer[2]这样的工具对基于GNN的模型训练完成后给出解释。4. 有限的训练数据集可行的解决方案包括标注更多的数据以及使用模型进行数据增强基于现有数据集生成新的类似的训练数据。5. 过拟合应对方式包括正则化、丢弃神经元dropout、提早停止训练、使用容量更小的模型以及采用更多的训练数据。6. 模型在新数据上的表现较差此时应该扩展数据集或使用容量更大的模型并结合生物学知识对模型的泛化能力进行分析例如在基于人的数据训练的 Deep Variant 在包含多对而不是一对染色体的动植物上检出突变的表现很差因为其生物学机制不同需使用相应的训练数据。综述着重强调了模型的可解释性以及训练过程中的效率其中既包括了训练成本高也包括了训练好的模型只适用于特定领域。并针对性地给出了更详细的可行建议。参考文献1. Lundberg, S. M. Lee, S.-I. A unified approach to interpreting model predictions. In Proceedings of the 31st International Conference on Neural Information Processing Systems, 4768–4777 (2017).2. Ying, R., Bourgeois, D., You, J., Zitnik, M. Leskovec, J. GNNExplainer: Generating explanations for graph neural networks. Adv. Neural Inf. Process. Syst. 32, 9240 (2019)论文 AbstractDeep Learning (DL) has recently enabled unprecedented advances in one of the grand challenges in computational biology: the half-century-old problem of protein structure prediction. In this paper we discuss recent advances, limitations, and future perspectives of DL on five broad areas: protein structure prediction, protein function prediction, genome engineering, systems biology and data integration, and phylogenetic inference. We discuss each application area and cover the main bottlenecks of DL approaches, such as training data, problem scope, and the ability to leverage existing DL architectures in new contexts. To conclude, we provide a summary of the subject-specific and general challenges for DL across the biosciences.未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市大脑研究计划构建互联网城市大脑技术和企业图谱为提升企业行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。 如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”