温州网站建设服务,建设商务网站公司,哪里有免费的网站推广服务,网页代码查看目录
1、认识决策树
2、决策树分类原理详解
3、信息论基础
3.1 信息
3.2 信息的衡量 - 信息量 - 信息熵
3.3 决策树划分的依据 - 信息增益
3.4 案例
4、决策树API
5、案例#xff1a;用决策树对鸢尾花进行分类
6、决策树可视化
7、总结
8、案例#xff1a;泰坦尼…目录
1、认识决策树
2、决策树分类原理详解
3、信息论基础
3.1 信息
3.2 信息的衡量 - 信息量 - 信息熵
3.3 决策树划分的依据 - 信息增益
3.4 案例
4、决策树API
5、案例用决策树对鸢尾花进行分类
6、决策树可视化
7、总结
8、案例泰坦尼克号乘客生存预测
8.1 流程分析 sklearn转换器和估算器KNN算法模型选择和调优朴素贝叶斯算法决策树随机森林
1、认识决策树
如何高效的进行决策 特征的先后顺序
2、决策树分类原理详解 已知 四个特征值 预测 是否贷款给某个人
先看房子再工作 - 是否贷款 只看了两个特征年龄信贷情况工作 看了三个特征
3、信息论基础
3.1 信息
香农消除随机不定性的东西
小明 年龄“我今年18岁”- 信息小华”小明明年19岁”-不是信息
3.2 信息的衡量 - 信息量 - 信息熵 3.3 决策树划分的依据 - 信息增益 3.4 案例 4、决策树API 5、案例用决策树对鸢尾花进行分类 def decision_iris():# 用决策树对鸢尾花进行分类# 1、获取数据集iris load_iris()# 2、划分数据集x_train,x_test,y_train,y_test train_test_split(iris.data,iris.target,random_state22)# 3、决策树预估器estimator DecisionTreeClassifier(criterionentropy)estimator.fit(x_train,y_train)# 4、模型评估# 方法1 直接比对真实值和预测值y_predict estimator.predict(x_test)print(y_predict\n, y_predict)print(直接比对真实值和预测值\n, y_test y_predict)# 方法2计算准确率score estimator.score(x_test, y_test)print(准确率为\n, score)return Noneif __name__ __main__: # 代码4用决策树对鸢尾花进行分类decision_iris()
6、决策树可视化
导入 from sklearn.tree import DecisionTreeClassifier,export_graphviz可视化决策树 export_graphviz(estimator,out_fileiris_tree.dot)生存.dot文件打开复制到网址http://webgraphviz.com/
from sklearn.datasets import load_iris, fetch_20newsgroups
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.naive_bayes import MultinomialNB
from sklearn.neighbors import KNeighborsClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.tree import DecisionTreeClassifier,export_graphvizdef decision_iris():# 用决策树对鸢尾花进行分类# 1、获取数据集iris load_iris()# 2、划分数据集x_train,x_test,y_train,y_test train_test_split(iris.data,iris.target,random_state22)# 3、决策树预估器estimator DecisionTreeClassifier(criterionentropy)estimator.fit(x_train,y_train)# 4、模型评估# 方法1 直接比对真实值和预测值y_predict estimator.predict(x_test)print(y_predict\n, y_predict)print(直接比对真实值和预测值\n, y_test y_predict)# 方法2计算准确率score estimator.score(x_test, y_test)print(准确率为\n, score)# 可视化决策树export_graphviz(estimator,out_fileiris_tree.dot,feature_namesiris.feature_names)return Noneif __name__ __main__: # 代码4用决策树对鸢尾花进行分类decision_iris()
7、总结 8、案例泰坦尼克号乘客生存预测
8.1 流程分析
获取数据数据处理
缺失值处理特征值 - 字典类型
准备好特征值、目标值划分数据集特征工程字典特征抽取决策树预估器流程模型评估