当前位置: 首页 > news >正文

泰安网站建设dxkjwwordpress网址跳转

泰安网站建设dxkjw,wordpress网址跳转,罗湖区seo排名,注册公司流程及手续文章目录 #x1f340;引言#x1f340;训练集和测试集#x1f340;sklearn中封装好的train_test_split#x1f340;超参数 #x1f340;引言 本节以KNN算法为主#xff0c;简单介绍一下训练集和测试集、超参数 #x1f340;训练集和测试集 训练集和测试集是机器学习和深… 文章目录 引言训练集和测试集sklearn中封装好的train_test_split超参数 引言 本节以KNN算法为主简单介绍一下训练集和测试集、超参数 训练集和测试集 训练集和测试集是机器学习和深度学习中常用的概念。在模型训练过程中通常将数据集划分为训练集和测试集用于训练和评估模型的性能。 训练集是用于模型训练的数据集合。模型通过对训练集中的样本进行学习和参数调整来提高自身的预测能力。训练集应该尽可能包含各种不同的样本以使模型能够学习到数据集中的模式和规律并能够适应新的数据。 测试集是用于评估模型性能的数据集合。模型训练完成后使用测试集中的样本进行预测并与真实标签进行对比以评估模型的精度、准确度和其他性能指标。测试集应该与训练集相互独立以确保对模型的泛化能力进行准确评估。 一般来说训练集和测试集的划分比例是80:20或者70:30。有时候还会引入验证集用于在训练过程中调整模型的超参数。训练集、验证集和测试集是机器学习中常用的数据集拆分方式以确保模型的准确性和泛化能力。 接下来我们回顾一下KNN算法的简单原理选取离待预测最近的k个点再使用投票进行预测结果 from sklearn.neighbors import KNeighborsClassifier knn_clf KNeighborsClassifier() from sklearn.datasets import load_iris # 因为我们并没有数据集所以从库里面调出来一个 iris load_iris() X iris.data y iris.target knn_clf.fit(X,y) knn_clf.predict()那么我们如何评价KNN模型的好坏呢 这里我们将数据集分为两部分一部分为训练集一部分为测试集因为这里的训练集和测试集都是有y的所以我们只需要将训练集进行训练然后产生的模型应用到测试集再将预测的y和原本的y进行对比这样就可以了 接下来进行简易代码演示讲解 from sklearn.datasets import load_iris iris load_iris() X iris.data y iris.target我们可以把y打印出来看看 这里我们不妨思考一下如果训练集和测试集是8:2的话测试集的y岂不是都是2了那么还有啥子意义所以我们需要将其打乱一下下当然我们这里打乱的是index也就是下标可不要自以为是的将y打乱了 import numpy as np indexs np.random.permutation(len(X))导入必要的库后我们将数据集下标进行打乱并保存于indexs中接下来迎来重头戏分割数据集 test_ratio 0.2 test_size int(len(X) * test_ratio) test_indexs shuffle_indexs[:test_size] # 测试集 train_indexs shuffle_indexs[test_size:] # 训练集不信的小伙伴可以使用如下代码进行检验 test_indexs.shape train_indexs.shape接下来将打乱的下标进行分别赋值 X_train X[train_indexs] y_train y[train_indexs] X_test X[test_indexs] y_test y[test_indexs]分割好数据集后我们就可以使用KNN算法进行预测了 from sklearn.neighbors import KNeighborsClassifier knn_clf KNeighborsClassifier() knn_clf.fit(X_train,y_train) y_predict knn_clf.predict(X_test)我们这里可以打印一下y_predict和y_test进行肉眼对比一下 最后一步就是将精度求出来 np.sum(np.array(y_predict y_test,dtypeint))/len(X_test)sklearn中封装好的train_test_split 上面我们只是简单演示了一下接下来我们使用官方的train_test_split from sklearn.model_selection import train_test_split X_train,X_test,y_train,y_test train_test_split(X,y) # 注意这里返回四个结果这里你可以试着看一眼分割的比例与之前手动分割的比例大不相同 最后按部就班来就行 knn_clf KNeighborsClassifier() knn_clf.fit(X_train,y_train) knn_clf.predict(X_test) knn_clf.score(X_test,y_test)超参数 什么是超参数可以点击链接查看 在pycharm中我们可以查看一些参数 接下来通过简单的演示来介绍一下 from sklearn.neighbors import KNeighborsClassifier from sklearn.datasets import load_iris knn_clf KNeighborsClassifier(weightsdistance) from sklearn.model_selection import train_test_split iris load_iris() X iris.data y iris.target X_train,X_test,y_train,y_test train_test_split(X,y)上面是老熟人了就不一一赘述了但是注意这里面有个超参数weights这个参数有两种一个是distance一个是uniform前者和距离有关联后者无关 首先测试一下n_neighbors这个参数代表的就行之前的那个k邻近点的个数 %%time best_k 0 best_score 0.0 best_clf None for k in range(1,21):knn_clf KNeighborsClassifier(n_neighborsk)knn_clf.fit(X_train,y_train)score knn_clf.score(X_test,y_test)if scorebest_score:best_score scorebest_k kbest_clf knn_clf print(best_k) print(best_score) print(best_clf)测试完参数n_neighbors我们再来试试weights %%time best_k 0 best_score 0.0 best_clf None best_method None for weight in [uniform,distance]:for k in range(1,21):knn_clf KNeighborsClassifier(n_neighborsk,weightsweight)knn_clf.fit(X_train,y_train)score knn_clf.score(X_test,y_test)if scorebest_score:best_score scorebest_k kbest_clf knn_clfbest_method weight print(best_k) print(best_score) print(best_clf) print(best_method)最后我们测试一下参数p %%time best_k 0 best_score 0.0 best_clf None best_p None for p in range(1,6):for k in range(1,21):knn_clf KNeighborsClassifier(n_neighborsk,weightsdistance,pp)knn_clf.fit(X_train,y_train)score knn_clf.score(X_test,y_test)if scorebest_score:best_score scorebest_k kbest_clf knn_clfbest_p pprint(best_k) print(best_score) print(best_clf) print(best_p)或许大家不知道这个参数p的含义下面我根据几个公式带大家简单了解一下 三张图分别代表欧拉距离、曼哈顿距离、明科夫斯基距离细心的小伙伴就可以发现了p1位曼哈顿距离p2位欧拉距离这里不做详细的说明感兴趣的小伙伴可以翻阅相关数学书籍 挑战与创造都是很痛苦的但是很充实。
http://www.zqtcl.cn/news/935598/

相关文章:

  • 旅游网站建设目的关于建设网站的需求分析
  • 手机可以建立网站吗自己造网站
  • 厦门建网站哪家好手机编程网站
  • 网站搭建后台奥门网站建设
  • 电子商务网站免费模板展示型网站与营销型网站
  • 除了红动中国还有哪些设计网站宁波建网站哪家
  • 网站的建设费用预算策划书wdcp网站备份
  • 济南制作公司网站网站设计的实例
  • 网站建设需要的文案一个网站的后台怎么做
  • 电影网站建设模板营销方式都有哪些
  • 书店商城网站建设方案未央免费做网站
  • 北京房产网北京二手房企业网站seo方案案例
  • 大连品牌官网建站二级建造师最好的网站
  • python开发工具搜索引擎优化的英语简称
  • 做产品代理上哪个网站好东莞公司网上推广
  • 专业制作网站公司上海广告公司联系方式
  • 古交市网站建设公司四川省建设厅电子政务网站
  • 清河网站建设费用50万做网站
  • 怎么找网站的根目录平台类网站营销方案
  • 网站关键词 价格生成山西建设工程备案网站
  • 网站开发入哪个会计科目设计师自己的网站
  • php做网站界面代码定制网页设计报价
  • 重庆智能模板建站wordpress+widget+开发
  • vps网站空间时尚网站首页设计
  • 美容行业网站建设方案网站建设需求背景
  • 贵阳做网站找哪家好长沙部分风险区域调整
  • 设计网站 常用微信网站建设口碑好
  • 网站建设加盟列举网络推广的方式
  • 大连博硕网站建设dw做网站背景音乐
  • 江苏省建设执业网站北京做胃镜哪好德胜门网站I