当前位置: 首页 > news >正文

深圳罗湖商城网站建设网站可以做弹窗广告么

深圳罗湖商城网站建设,网站可以做弹窗广告么,fullpage网站怎么做,怎样做自己的加密网站决策树的介绍 决策树是一种常见的分类模型#xff0c;在金融风控、医疗辅助诊断等诸多行业具有较为广泛的应用。决策树的核心思想是基于树结构对数据进行划分#xff0c;这种思想是人类处理问题时的本能方法。例如在婚恋市场中#xff0c;女方通常会先询问男方是否有房产在金融风控、医疗辅助诊断等诸多行业具有较为广泛的应用。决策树的核心思想是基于树结构对数据进行划分这种思想是人类处理问题时的本能方法。例如在婚恋市场中女方通常会先询问男方是否有房产如果有房产再了解是否有车产如果有车产再看是否有稳定工作……最后得出是否要深入了解的判断。 决策树的主要优点 具有很好的解释性模型可以生成可以理解的规则。可以发现特征的重要程度。模型的计算复杂度较低。 决策树的主要缺点 模型容易过拟合需要采用减枝技术处理。不能很好利用连续型特征。预测能力有限无法达到其他强监督模型效果。方差较高数据分布的轻微改变很容易造成树结构完全不同。 由于决策树模型中自变量与因变量的非线性关系以及决策树简单的计算方法使得它成为集成学习中最为广泛使用的基模型。梯度提升树XGBoost以及LightGBM等先进的集成模型都采用了决策树作为基模型在广告计算、CTR预估、金融风控等领域大放异彩 同时决策树在一些明确需要可解释性或者提取分类规则的场景中被广泛应用而其他机器学习模型在这一点很难做到。例如在医疗辅助系统中为了方便专业人员发现错误常常将决策树算法用于辅助病症检测。 决策树的应用 通过sklearn实现决策树分类 import numpy as np import matplotlib.pyplot as pltfrom sklearn import datasetsiris datasets.load_iris() X iris.data[:,2:] y iris.targetplt.scatter(X[y0,0],X[y0,1]) plt.scatter(X[y1,0],X[y1,1]) plt.scatter(X[y2,0],X[y2,1])plt.show() from sklearn.tree import DecisionTreeClassifiertree DecisionTreeClassifier(max_depth2,criterionentropy) tree.fit(X,y) 依据模型绘制决策树的决策边界 def plot_decision_boundary(model,axis):x0,x1 np.meshgrid(np.linspace(axis[0],axis[1],int((axis[1]-axis[0])*100)).reshape(-1,1),np.linspace(axis[2],axis[3],int((axis[3]-axis[2])*100)).reshape(-1,1))X_new np.c_[x0.ravel(),x1.ravel()]y_predict model.predict(X_new)zz y_predict.reshape(x0.shape)from matplotlib.colors import ListedColormapcustom_map ListedColormap([#EF9A9A,#FFF59D,#90CAF9])plt.contourf(x0,x1,zz,linewidth5,cmapcustom_map)plot_decision_boundary(tree,axis[0.5,7.5,0,3]) plt.scatter(X[y0,0],X[y0,1]) plt.scatter(X[y1,0],X[y1,1]) plt.scatter(X[y2,0],X[y2,1]) plt.show() 实战 Step: 库函数导入 import numpy as np ## 导入画图库 import matplotlib.pyplot as plt import seaborn as sns## 导入决策树模型函数 from sklearn.tree import DecisionTreeClassifier from sklearn import tree Step: 训练模型 ## 构造数据集 x_fearures np.array([[-1, -2], [-2, -1], [-3, -2], [1, 3], [2, 1], [3, 2]]) y_label np.array([0, 1, 0, 1, 0, 1])## 调用决策树回归模型 tree_clf DecisionTreeClassifier()## 调用决策树模型拟合构造的数据集 tree_clf tree_clf.fit(x_fearures, y_label) Step: 数据和模型可视化 plt.figure() plt.scatter(x_fearures[:,0],x_fearures[:,1], cy_label, s50, cmapviridis) plt.title(Dataset) plt.show()import graphviz dot_data tree.export_graphviz(tree_clf, out_fileNone) graph graphviz.Source(dot_data) graph.render(pengunis) Step:模型预测 x_fearures_new1 np.array([[0, -1]]) x_fearures_new2 np.array([[2, 1]])## 在训练集和测试集上分布利用训练好的模型进行预测 y_label_new1_predict tree_clf.predict(x_fearures_new1) y_label_new2_predict tree_clf.predict(x_fearures_new2)print(The New point 1 predict class:\n,y_label_new1_predict) print(The New point 2 predict class:\n,y_label_new2_predict) ID3 决策树 ID3 树是基于信息增益构建的决策树 熵在信息论中代表随机变量不确定度的度量。熵越大数据的不确定性度越高 import numpy as np import matplotlib.pyplot as pltdef entropy(p):return -p*np.log(p)-(1-p)*np.log(1-p)x np.linspace(0.01,0.99,200) plt.plot(x,entropy(x)) plt.show() 信息增益 信息熵是一种衡量数据混乱程度的指标信息熵越小则数据的“纯度”越高 ID3算法步骤 计算每个特征的信息增益使用信息增益最大的特征将数据集 S 拆分为子集使用该特征信息增益最大的特征作为决策树的一个节点使用剩余特征对子集重复上述123过程 C4.5 决策树  信息增益率计算公式 如果某个特征的特征值种类较多则其内在信息值就越大。特征值种类越多除以的系数就越大。 如果某个特征的特征值种类较小则其内在信息值就越小  C4.5算法优缺点 优点分类规则利于理解准确率高缺点 在构造过程中需要对数据集进行多次的顺序扫描和排序导致算法的低效C4.5只适合于能够驻留内存的数据集当数据集非常大时程序无法运行无论是ID3还是C4.5最好在小数据集上使用当特征取值很多时最好使用C4.5算法。 CART 分类决策树  Cart模型是一种决策树模型它即可以用于分类也可以用于回归 1决策树生成用训练数据生成决策树生成树尽可能大 2决策树剪枝基于损失函数最小化的剪枝用验证数据对生成的数据进行剪枝。 分类和回归树模型采用不同的最优化策略。Cart回归树使用平方误差最小化策略Cart分类生成树采用的基尼指数最小化策略。 Criterion这个参数正是用来决定模型特征选择的计算方法的。sklearn提供了两种选择 输入”entropy“使用信息熵Entropy 输入”gini“使用基尼系数Gini Impurity 基尼指数 信息增益ID3、信息增益率值越大C4.5则说明优先选择该特征。 基尼指数值越小cart则说明优先选择该特征。 剪枝 剪枝是决策树学习算法对付过拟合的主要手段。 在决策树学习中为了尽可能正确分类训练样本结点划分过程将不断重复有时会造成决策树分支过多这时就可能因训练样本学得太好了以致于把训练集自身的一些特点当作所有数据都具有的一般性质而导致过拟合 决策树的构建过程是一个递归的过层所以必须确定停止条件否则过程将不会停止树会不停生长。 先剪枝和后剪枝 先剪枝就是提前结束决策树的增长。 后剪枝是在决策树生长完成之后再进行剪枝的过程。 预剪枝使决策树的很多分支没有展开不单降低了过拟合风险还显著减少了决策树的训练、测试时间开销。后剪枝比预剪枝保留了更多的分支。一般情况下后剪枝决策树的欠拟合风险很小泛化性能往往优于预剪枝。
http://www.zqtcl.cn/news/477568/

相关文章:

  • 在线网站建设活动初创企业的建站流程
  • 汨罗哪里有网站开发的公司电话百度首页关键词推广
  • 天津百度整站优化服务政务网站模版
  • 推荐家居企业网站建设用什么工具修改wordpress
  • wix做的网站能扒下来哈尔滨做网站的oeminc
  • 做网站的网络公司门户网站介绍
  • 软件公司网站系统集成建设下拉关键词排名
  • 景翔物流网站建设公司企业网站优化排名
  • 余姚做网站62752762素材网站建设需要多少费用
  • dede网站后台导入文档许昌网站开发哪家好
  • 网站建设宣传psdwordpress 链接关系
  • 宁波网站建设免费咨询深圳做棋牌网站建设找哪家公司好
  • 安阳门户网站html5网页代码
  • 企业建站系统下载广州有几个区几个县级市
  • 时装网站建设的背景广州建设专业网站
  • 来年做那些网站能致富网站建设优化文档
  • 好看的商城网站企业所得税分录
  • 网站建设你懂的网站提高内容的丰富度创意
  • 菏泽做网站设计做一个简单的网站需要多少钱
  • html企业网站怎么做免费crm平台
  • 婚庆公司网站制作如何自己制作首页网站
  • ic外贸网站建设龙岩app制作
  • 长沙企业建网站绵阳市三台县城乡建设局网站
  • 常宁市城市建设规划管理局网站织梦网做网站步骤
  • 对网站开发实训的建议怎么把产品推广到各大平台
  • wap网站是什么意思啊网站建设网站模板
  • 湛江市建设局网站天津网站建设渠道
  • 做图专业软件下载网站深圳营销型网站哪家好
  • 手机网站模板用什么做高端展馆展厅设计方案
  • 长春企业网站seo国土网站建设自查报告