当前位置: 首页 > news >正文

阿里巴巴 网站 建设tornado 做网站

阿里巴巴 网站 建设,tornado 做网站,app开发的基本步骤,商丘做网站的哪家好决策树#xff08;Decision Tree#xff09; 决策树算法是一种常用的机器学习算法#xff0c;属于监督学习范畴。它可以用于分类和回归任务#xff0c;具有易于理解和解释的特点。决策树通过递归将数据分割成更小的子集#xff0c;构建一个树形结构#xff0c;其中每个节…决策树Decision Tree 决策树算法是一种常用的机器学习算法属于监督学习范畴。它可以用于分类和回归任务具有易于理解和解释的特点。决策树通过递归将数据分割成更小的子集构建一个树形结构其中每个节点代表一个特征的测试分支代表测试结果叶子节点代表最终的分类或回归结果。 1. 基本概念 根节点Root Node树的最顶端节点包含所有数据样本。 内部节点Internal Nodes每个内部节点表示一个特征的测试根据测试结果将数据分成两个或多个子集。 叶子节点Leaf Nodes树的末端节点表示最终的分类或回归结果。 分支Branches从一个节点到下一个节点的路径代表特征测试的结果。 2. 构建过程 构建决策树的过程涉及以下几个步骤 选择最优特征在每个节点选择一个特征来分割数据。选择的标准通常是信息增益、信息增益率或基尼指数等。 数据分割根据选择的特征和阈值将数据分割成子集。 递归分割对每个子集重复上述步骤直到满足停止条件如所有数据属于同一类或达到最大树深度。 构建树形结构将上述分割过程形成树形结构根节点和内部节点代表特征测试叶子节点代表最终预测。 3. 特征选择标准 信息增益Information Gain衡量特征在分割数据后信息熵的减少量。选择信息增益最大的特征进行分割。 基尼指数Gini Index用于衡量数据集的不纯度。选择基尼指数最小的特征进行分割。 信息增益率Gain Ratio信息增益的一种改进考虑了特征取值的不同数量选择信息增益率最大的特征进行分割。 4. 优点和缺点 优点 易于理解和解释适合展示和解释复杂决策 可以处理数值型和类别型数据 不需要太多的数据预处理如标准化、归一化 缺点 容易过拟合特别是当树很深时 对于有噪声的数据敏感可能导致不稳定的树结构 决策树可能偏向于那些具有较多类别的特征 5. 应用 决策树在很多领域都有广泛的应用例如 医疗诊断根据病人的症状和检查结果预测疾病 金融信用评分、欺诈检测 市场营销客户分类、行为预测 制造业质量控制、故障诊断 6. 示例 一个简单的决策树分类问题示例是预测某个学生是否会通过考试特征可以包括学习时间、上课出勤率、是否完成作业等。决策树会根据这些特征逐步分割数据最终在叶子节点给出“通过”或“不通过”的预测。 是否完成作业?/ \是 否/ \学习时间 2小时? 不通过/ \是 否/ \ 通过 不通过通过这个例子可以看到决策树通过逐层分割特征将数据分成不同的子集最终在叶子节点给出预测结果。以下是一个简单的代码示例 import matplotlib.pyplot as plt  # 用于绘图 from sklearn.datasets import load_iris  # 用于加载Iris数据集 from sklearn.tree import DecisionTreeClassifier, plot_tree  # 前者用于创建决策树分类器后者用于可视化决策树 from sklearn.model_selection import train_test_split  # 用于将数据集分为训练集和测试集 from sklearn.metrics import accuracy_score  # 用于计算预测的准确率# 加载Iris数据集 iris  load_iris()  # 调用load_iris函数加载Iris数据集并将其存储在变量iris中 X  iris.data  # 将Iris数据集中的特征数据存储在变量X中 y  iris.target  # 将Iris数据集中的目标标签存储在变量y中# 将数据集分为训练集和测试集 X_train, X_test, y_train, y_test  train_test_split(X, y, test_size0.3, random_state42)  # 将数据集X和y分为训练集和测试集,test_size0.3表示30%的数据用作测试集random_state42设置随机种子以保证结果可重复# 创建决策树分类器 clf  DecisionTreeClassifier(random_state42)  # 创建一个DecisionTreeClassifier对象random_state42设置随机种子以保证结果可重复 clf.fit(X_train, y_train)  # 使用训练集数据X_train和y_train训练决策树分类器# 预测测试集 y_pred  clf.predict(X_test)  # 使用训练好的决策树分类器对测试集X_test进行预测并将预测结果存储在变量y_pred中# 计算准确率 accuracy  accuracy_score(y_test, y_pred)  #调用accuracy_score函数计算预测结果y_pred与真实标签y_test的准确率并将结果存储在变量accuracy中 print(fAccuracy: {accuracy:.2f})# 可视化决策树 plt.figure(figsize(20,10))  # 创建一个新的图形并设置图形的尺寸为20x10英寸 plot_tree(clf, filledTrue, feature_namesiris.feature_names, class_namesiris.target_names.tolist(), roundedTrue)  # 调用plot_tree函数绘制决策树,节点用颜色填充颜色深浅表示样本数量,roundedTrue使用圆角矩形表示节点 plt.show()可视化结果 在决策树的可视化结果中每个节点包含了多个信息。这些信息帮助我们理解每个节点的决策过程。 以下是对每个节点中数据的解释 1.Feature and Threshold特征和阈值 每个内部节点非叶子节点显示用于分割数据的特征和阈值。 例如如果节点显示 petal length (cm) 2.45表示根据 petal length (cm) 特征值小于等于 2.45 的样本被分到左子树值大于 2.45 的样本被分到右子树。 2.Gini基尼系数 基尼系数用于衡量数据集的不纯度。基尼系数越小数据集越纯即单一类别的样本比例越高。计算公式为其中 ( pi ) 是第 ( i ) 类的样本比例。 3.Samples样本数量 每个节点中样本的总数量。例如如果节点显示 samples 50表示该节点包含50个样本。 4.Value类别分布 每个节点中不同类别样本的数量。 例如如果节点显示 value [10, 40]表示该节点包含10个属于第一类的样本和40个属于第二类的样本。 5.Class类别 每个节点中占多数的类别仅叶子节点。例如如果节点显示 class versicolor表示该节点的多数类别是 versicolor。 假设我们有如下的决策树节点可视化结果 petal length (cm) 2.45 gini 0.5 samples 100 value [50, 50] class setosa这个节点的信息解释如下 petal length (cm) 2.45使用花瓣长度作为特征阈值是2.45。花瓣长度小于等于2.45的样本会被分到左子树大于2.45的样本会被分到右子树。 gini 0.5基尼系数为0.5表示数据集的不纯度较高这通常是根节点或接近根节点的情况。 samples 100该节点包含100个样本。 value [50, 50]这100个样本中有50个属于第一类例如setosa50个属于第二类。 class setosa在这个节点中占多数的类别是 setosa但在这种情况下实际上类别是平分的。 这些信息帮助我们理解模型如何基于特征一步步做出决策。以上内容总结自网络如有帮助欢迎转发我们下次再见
http://www.zqtcl.cn/news/991713/

相关文章:

  • 不能打开建设银行网站怎么办自己做网站要会什么软件下载
  • 微软网站怎么做的diy个性定制
  • 洛阳做网站的公司宣传品牌网站建设
  • 公司网站开发招标书电子商务网站系统
  • 哪个旅游网站做的最好营销策划方案范文免费下载
  • 德州哪家网站优化公司专业单页网站seo如何优化
  • 南昌汉邦网站建设城建局
  • 网站建设:中企动力招聘网58同城招聘发布
  • 惠州住房和建设局网站物流网站建设方案范文
  • 做网站架构需要什么步骤wordpress插件连不上
  • 网上购物网站建设规划论文国家企业网官网查询
  • 响应式网站建设推荐乐云seo2022年热点新闻事件
  • 用.net做视频网站的案例做网站需要视频衔接怎么做
  • 网站搭建规划模板wordpress博客点赞
  • 怎么在wordpress免费注册博客网站百度广告代理
  • 网站建设与管理考试怎么让网站分享有图片
  • 做渠道的网站有哪些方面广州网站建设咨询电话
  • 如何查看网站做没做竞价湘潭做网站 搜搜磐石网络
  • 郑州免费建站搭建网页平台
  • 长沙网站优化对策企业官网wordpress主题下载
  • 昆山网站设计网站建设亻金手指下拉
  • 行业数据网站建设培训网站
  • 商业设计网站推荐制作网站报价
  • 建设网站的企业邮箱红酒哪个网站做的好
  • 图片链接生成网站国外做珠宝的网站有哪些
  • 企业网站建设管理及推广手机微信网页版登录
  • 六盘水市住房和城乡建设局网站标签云wordpress
  • dedecms可以做什么网站织梦做的网站在手机上显示
  • 温州建设小学的网站吐鲁番seo快速排名
  • 翼城网站建设重庆平台网站建设多少钱