当前位置: 首页 > news >正文

家居网站建设公司排名沈阳工程信息造价网

家居网站建设公司排名,沈阳工程信息造价网,net网站开发微信支付,中国500强企业排行榜# 编码声明#xff0c;并不是注释#xff0c;而是一种特殊的源文件指令#xff0c;用于指定文件的字符编码格式 # -*- coding: utf-8 -*-import pandas as pd # 提供了DataFrame等数据结构 from sklearn.tree import DecisionTreeClassifier, export_graphviz # 决策树分类…# 编码声明并不是注释而是一种特殊的源文件指令用于指定文件的字符编码格式 # -*- coding: utf-8 -*-import pandas as pd # 提供了DataFrame等数据结构 from sklearn.tree import DecisionTreeClassifier, export_graphviz # 决策树分类器和可视化决策树的模块 from sklearn.model_selection import train_test_split # 划分训练集和测试集 from sklearn.feature_extraction import DictVectorizer # 将字典形式的特征转换成向量形式# 读入并选择 data pd.read_csv(lenses.txt, encodinggbk, sep\t) features data[[age, prescript, astigmatic, tearRate]] # 使用两层括号是为了创建一个包含多个列名的列表 targets data[eye_types] # 获取所有属性的同步属性值的名字 feature_name [] # 遍历 features 数据框的每一列对每一列的 unique 值进行提取并将这些 unique 值添加到 feature_name 列表中 features.apply(lambda x: feature_name.extend(x.unique()), axis0)# 特征提抽取one-hot编码 vect DictVectorizer() # 将字典数据转换为特征矩阵如果某个样本缺少某个特征会用默认值通常为0进行填充形成稀疏矩阵。 # 生成一个列表其中每个元素是一个字典字典的键是列名值是对应行的值。 features vect.fit_transform((features.to_dict(orientrecords)))# 划分数据集 # 训练集特征数据赋值给 X_train测试集特征数据赋值给 X_test训练集目标数据赋值给 y_train测试集目标数据赋值给 y_test X_train, X_test, y_train, y_test train_test_split(features, targets, test_size0.25)# #构建模型 clf DecisionTreeClassifier() clf.fit(X_train, y_train) score clf.score(X_test, y_test) print(f决策树模型的分类准确率为{score:.3f})# 将模型保存至dot文件 with open(tree_model.dot, w) as f:f export_graphviz(clf, out_filef, feature_namesfeature_name, class_namestargets.unique())# #将模型输出至目标文件 # import os # os.system(fdot -Tpng {tree_model.dot} -o {tree_model}.jpg)from sklearn.datasets import load_iris from sklearn import tree import graphviz# ----------------数据准备---------------------------- iris load_iris() # 加载数据# ---------------模型训练---------------------------------- clf tree.DecisionTreeClassifier() # sk-learn的决策树模型 clf clf.fit(iris.data, iris.target) # 用数据训练树模型构建() r tree.export_text(clf, feature_namesiris[feature_names]) dot_data tree.export_graphviz(clf, out_fileNone,feature_namesiris.feature_names,class_namesiris.target_names,filledTrue, roundedTrue,special_charactersTrue) graph graphviz.Source(dot_data) # 将存储在 dot_data 中的图形数据加载到对象中 graph # 显示图形。如果没显示则需要独立运行这一句 # graph.render(iris) #将图形保存为iris.pdf文件。 # graph.view() # 直接打开pdf文件展示# 关于使用的文件编码 # GBK编码主要用于简化汉字编码通常在中国大陆被使用。如果你确定你的文本数据是中文并且使用了GBK编码那么使用GBK编码是合适的。 # 但是如果你不确定数据的编码方式或者数据中包含多种语言的字符那么使用UTF-8编码会更加安全因为它是一种通用的、兼容性很好的编码方式能够支持几乎所有的字符和符号并且在全球范围内被广泛应用。# 每次运行准确度差距较大主要是因为数据量太小# 熵entropy是用来衡量一个随机变量的不确定性的度量如果计算出的熵值较高表示该数据集的不确定性也较高而熵值较低则表示数据集的不确定性较低即包含的信息量较少。# tearRate特征是指眼泪流失率tear rate用于描述眼睛的泪液排出速度或眼泪的分泌量。 # soft通常指代软性隐形眼镜或软性眼镜镜片而hard可能指代硬性隐形眼镜或硬性眼镜镜片。如果不能生成决策树图片可以参考这篇文章
http://www.zqtcl.cn/news/510743/

相关文章:

  • 中小企业网站建设与管理课件百度云济南高端网站建设公司
  • 台州企业建站程序网页设计素材网站知乎
  • wordpress视频付费谷歌seo专员是指什么意思
  • 域名续费做网站wordpress模板淘宝客模板
  • 加强政协机关网站建设深圳教育软件app开发
  • 绍兴企业网站推广Django 个人博客网站开发
  • html5 开发网站图门市建设局网站
  • wordpress 建立网站江苏电信网站备案
  • 企业网站能个人备案吗成都蜀美网站建设
  • 网站开发 占位符直播网站开发接入视频
  • 网站 易用性原则义乌进货网平台
  • 做网站的你选题的缘由是什么洛阳网站建设找汉狮
  • 常德住房和城乡建设局网站陕西省建设厅的网站
  • 国外做meta分析的网站开发公司替业主承担物业费承诺书
  • 百度收录网站定位地址wordpress 检测浏览器
  • 学习网站建设优化wordpress 轮播广告
  • 迈诺网站建设wordpress 前台注册登录
  • 网站开发市场成本免费建站网站大全
  • 四川省建设人才网站通过ip访问网站需要怎么做
  • 网站建设需要知道什么财税公司怎么找客源
  • 赣州那里有做网站的公司物流网站建设平台
  • 青色系网站北京的建筑设计公司
  • 纺织品做外贸一般在哪个网站上手机网站qq登录插件
  • 长沙做公司网站有没有免费的云服务器可以用
  • 济南专业网站优化如何制作小程序二维码
  • 建站平台软件猪八戒做网站要多少钱
  • 建设集团网站专业开发网站多少钱
  • 网站制作流程有哪些wordpress众筹
  • 网站打开是建设中手机咋建网站
  • 外贸专业网站的公司建百度网站