当前位置: 首页 > news >正文

做教育培训的网站wordpress paypal支付

做教育培训的网站,wordpress paypal支付,网页升级访问未满18岁请离开,wordpress最新手册机器学习在药物设计里面的应用可以说还是比较常见的#xff0c;尤其是搞计算的都会或多或少的涉及到这块。比如国内做这块比较多的#xff0c;浙江大学的侯廷军教授#xff0c;北京化工大学的闫爱霞教授#xff0c;华东理工大学的几个做模拟计算的老师#xff0c;上海药物… 机器学习在药物设计里面的应用可以说还是比较常见的尤其是搞计算的都会或多或少的涉及到这块。比如国内做这块比较多的浙江大学的侯廷军教授北京化工大学的闫爱霞教授华东理工大学的几个做模拟计算的老师上海药物所上海交大的张健教授等。根据我读过他们的文章很少有人会走到实验验证这个阶段。都是拿个体系做个模型再做几个理论的验证就把文章发表出去了。这其中的原因是啥子为什么不做实验来验证我之前也不是很明白。最近我自己结合自己的课题需要也做了这方面的工作。在这里我给大家分享我的经验希望帮助大家更好的理解机器学习与虚拟筛选。 机器学习最常用来分类在各个领域都会用到。举个例子在药物设计领域有些化合物活性好有些化合物活性不好有些化合物活性适中。这里面就牵涉到分类了Active VS Inactive。如果能建立一个理论的模型来区分Active 和 Inactive的话那这个模型就可以用来预测未知的化合物。当前机器学习的方法主要包括naïve Bayesian, support vector machine, recursive partitioning, andk-nearest neighbors等等。这些方法都需要一定的自变量和因变量为输入输出当然是模型本身。自变量用的最多的是化合物的各种性质比如分子量、极性、分子体积、分子表面积、氢键给体受体等也可以是能够描述分子的指纹信息Fingerprints因变量就是分的类别Active VS Inactive。当然也可以分很多类比如高活性、中活性、低活性、无活性。自变量的选择往往就决定你建立模型是不是达到一定可靠度最关键的因素现在文章基本要求模型的准确度80%以上吧training set、test set、validation set。关于自变量的选择最常用的就是分子描述符2D or 3D能够计算描述的软件很多MOEDS还有免费的一大堆想知道的可以看我之前发的帖子。这里我给大家分享一下我做描述符选择的经验。 描述符优化Molecular descriptor selection 描述符优化方法很多最常用的是GA方法遗传算法来优化描述符相关文献也很多想了解这方法可以直接去查文献。这里我给大家说说另外一种方法。运用基本统计的方法来做用到的软件SPSS。主要步骤把该计算的描述符全部计算好然后导成CSV文件自变量是描述符因变量是分类比如1代表活性-1代表非活性这样我总结了四部可以到达优化描述符的目的如下 1Common values analysis 2Pearson correlation analysis 3A stepwise variable analysis 4Linear regression analysis 第一步主要是去除一些含有太多常值的描述符比如0或者1等这些描述对每个分子都一样这样就对体系没区别性贡献可以直接删除。 第二步主要是做描述符相关性分析比如有些描述符就是代表类似的意思分子量MW和分子质量MM这样就出现描述符冗杂这个可以再SPSS里面做一般相关0.9以上的都可以抹掉。 第三步主要做剔除一个描述符对整体的影响逐步剔除。 第四步主要做描述符和活性之前的关系回归分析这个很关键有些描述符和活性之前的相关性R就很明显有的就不行。 经过这个过程你可以把描述符优化到20-30个左右我自己做的经验。这样再去用各种机器学习的方法来做分类模型基本上会得到不错的结果。这里我选择SVM和k-nearest neighborsKNN来具体说明。 SVM具体步骤LIBSVM 3.17 package 1、把数据集转换为LibSVM能够识别的格式这个可以用WEKA来实现转化也可以用EXCEL里面的宏功能 2、将数据集进行简单的缩放这个非常重要建议必需做 3、使用一个比较合适的各函数 一般情况下我用都使用RBF函数K(x,y)exp(-r||x-y||^2) 4、优化超参数 一般情况下用交叉验证cross-validation)和梯度搜索grid-search来实现此功能 5、用最好的超参数来训练训练集 6、测试测试集 这六步基本上就可以实现SVM的所有计算文章里面经常出现的参数FP,FN,TP,TN,AUC等都可以拿到根据模型的准确度基本上可以判断模型的好坏好的话基本就可以去写文章了(很多人都这样做的)。 k-nearest neighbors方法Orange 2.0 (Orange Data Mining)免费的软件很好用。 步骤 1、把数据集转换为Orange能够识别的格式这个可以用WEKA来实现转化也可以用EXCEL里面的CSV文件 2、选择K参数 A total of k number of vectors nearest tothe vector x are used to determine the class of that unclassified vector. Theclass of the majority of the k-nearest neighbors is decided as the predictedclass of the unclassified vector x. 4、调试参数(K) 一般情况下用交叉验证cross-validation) 5、构建模型 6、测试测试集 Orange结果输出很人性化基本把所有参数都给你计算好了FP,FN,TP,TN,AUCGA自己来判断模型的好坏。 还有很多人基于分子指纹作为描述符的其实这个更合理。相对描述符而言分子指纹代表的信息量更大但分子指纹计算一般都牵涉到商业软件很难去破解指纹具体的数字信息这样就很难和免费的SVM或者KNN方法实现无缝衔接我最近发现有个软件算出来的指纹就是用位数代表指纹的实数集PaDEL-Descriptor想用的可以去下载很好用。计算好指纹采用对应的方法构建模型就行步骤就和前面一样了。这里面有几个经验给大家说说 1指纹的维度基本是越大模型越好。但是达到一定程度模型的准确度也就不变了 2基于指纹的模型一般会比基于描述的模型要好一点这里我指的是各种考核参数尤其准确度 3实际应用效果描述符会比指纹更能选到新的骨架化合物novel scaffold 4指纹的最大好处可以分析出来优势片段和劣势片段这对合成化学家来说非常重要 也是文章比较亮的一个点 如果有可能也可以联合2者来做模型优势互补 我们最近实验室也开发了一个基于原子中心片段的方法Atom Center Fragments原理很简单。片段产生是我老板的一个程序后来被一个师弟整合到贝叶斯里面可以实现分类用到2个体系其中一个就是我用的mTOR抑制剂分类也做了一个在线的服务器http://rcdd.sysu.edu.cn/mtor/效果也还不错但这个方法处理大分子比如抗菌分子效果不是很好。 至于用这些分类模型来做虚拟筛选我个人感觉还是非常吃力的。主要原因是富集的化合物数目太大比如你预测SPECS化合物库返回给你2W这样后期遴选化合物就非常吃力。我做了另外一个就是单独用机器学习的方法来做的虽然实验也验证了。但是遴选化合物的过程非常复杂。 如果把机器学习和其他主流的方法经行串联效果会很不错我也是做了这方面的工作实验的结果还是可以的比如先机器学习在分子对接。这样就大大减少了分子对接耗时的问题毕竟机器学习可以大大的缩小原始虚拟库的大小一般20W就可以缩到2W这样对接很快就可以做完。大家感兴趣的可以试试。 通过这些不难发现为什么做计算的人尤其是用机器学习的方法来分类都不会涉及后面的实验验证。因为单凭这一种方法来做筛选富集化合物太多很难实现化合物的遴选。对需要文章毕业的人可以搞搞文章。但对于想做药物的人还是多思考一下怎么才能更好的用在药物筛选过程中。 如果有想做这一块的可以和我交流。 科学无界大爱无疆 参考 机器学习与药物筛选的心得体会 - Powered by Discuz!
http://www.zqtcl.cn/news/877792/

相关文章:

  • 老网站权重低的原因网站建设公司使用图片侵权使用者有无责任
  • 邹城网站建设网站建设要注意什么
  • 图片在线制作表情合肥网站推广优化
  • 哈尔滨网站建设网站分成几种类型
  • 网站怎么添加二级域名全栈网站开发
  • 网站公司建设网站收费模块专业的网站建设联系
  • 网站建设广告方案linchong.wordpress
  • 北京快速建站模板制作网页教程的软件
  • 深圳市住房建设局网站首页wordpress主页加关键词
  • 专业做网站较好的公司wordpress 大内存
  • 网站关站html5编辑器手机版下载
  • 网站域名多少钱住房和城乡建设部网站注册
  • seo整站优化 wordpress广州门户网站建设公司
  • 深圳市官网网站建设平台上海在建工程查询
  • 网页制作模板的网站免费合肥网站建设5k5
  • 公司信息化网站建设实施方案永久免费国外vps无需信用卡
  • 域名备案企业网站内容好网站建设公司开发
  • 合肥公司做网站网站代码需要注意什么
  • 梧州网站制作公司高端网站开发公司有哪些
  • seo网站设计北京做app的公司有哪些
  • 佛山淘宝设计网站设计价格软件商城免费下载 app
  • 物联网型网站开发cms系统源码
  • 淘宝价格网站建设wordpress 点餐
  • 晋中网站建设公司汉滨区城乡建设规划局 网站
  • 2018年的网站制作湖北省随州市建设厅网站
  • 做网络销售保温材料用什么网站好企业网站的建设企业
  • 2008发布asp网站海外如何 淘宝网站建设
  • 小米云网站开发食品包装
  • 销售网站怎么做的帝国cms网站搬家教程
  • 甘肃省城市建设档案馆网站wordpress推广自己淘宝店