当前位置：首页 > news >正文

中信建设有限责任公司客户廊坊视频优化展现

news 2025/11/14 22:16:37

中信建设有限责任公司客户,廊坊视频优化展现,seo关键词推广优化,搜索引擎关键词竞价排名健康医疗算法建模 knn 算法建模构建微观数据和疾病之间的关系knn 调整超参数#xff0c;准确率提升数据归一化、标准化#xff0c;提升更加明显算法实战导入包 import numpy as np import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklea…健康医疗算法建模 knn 算法建模构建微观数据和疾病之间的关系knn 调整超参数准确率提升数据归一化、标准化提升更加明显算法实战导入包 import numpy as np import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import train_test_split from sklearn.model_selection import GridSearchCV加载数据 data pd.read_csv(./cancer.csv, sep\t) data.head()获取有用的数据 # 返回值 y data[Diagnosis] X data.iloc[:, 2:] display(X.head(), y.head())拆分数据 X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2,random_state100) display(X_train.shape, X_test.shape)网格搜索超参数 estimator KNeighborsClassifier() params dict(n_neighborsnp.arange(1, 30),weights[uniform, distance],p[1, 2]) Gcv GridSearchCV(estimator, params, cv6, scoringaccuracy) Gcv.fit(X_train, y_train)获取超参数 Gcv.best_params_ 获取最好模型的参数 Gcv.score(X_test,y_test) gCV.best_score_ gCV.best_params_模型预测 # 获取最佳的模型 model gCV.best_estimator_ y_pred model.predict(x_test) print(算法预测值,y_pred[:20]) print(真实值,y_test[:20].values)计算模型的分数 from sklearn.metrics import accuracy_score accuracy_score(y_test,y_pred) (y_testy_pred).mean() gCV.score(x_test,y_test)以上的方法获取的模型分数是一样归一化处理归一化是一种数据处理方法用于将数据缩放到一个统一的范围通常是[0,1]或[-1,1]以下是最常用的两种归一化处理的方式方式一,min-max归一化线性缩放min_max归一化将数据线性缩放到[0-1]的范围对于给定的一组数据x,min-max归一化的计算公式为 from sklearn.preprocessing import MinMaxScaler mss MinMaxScaler() x_normal mss.fit_transform(x) x_normal数据拆分建模并且进行训练 x_train,x_test,y_train,y_test train_test_split(x,y,test_size0.2,random_state100) estimator KNeighborsClassifier() params dict(n_neighborsnp.arange(1,30),weights[uniform,distance],p [1,2]) gCV GridSearchCV(estimator,params,cv6,scoringaccuracy) gCV.fit(x_train,y_train)获取当前模型的分数方式二Z-Score归一化标准化Z-Score 归一化将原始数据转换为均值为0标准方差为1的标准正态分布。对于给定的一组数据XZ-Score归一化的计算公式为其中x表示数据集的均值表示数据集中的标准差 from sklearn.preprocessing import StandardScaler sd StandardScaler() x_norm sd.fit_transform(x) x_train,x_test,y_train,y_test train_test_split(x,y,test_size0.2,random_state100) estimator KNeighborsClassifier() params dict(n_neighborsnp.arange(1,30),weights[uniform,distance],p [1,2]) gCV GridSearchCV(estimator,params,cv6,scoringaccuracy) gCV.fit(x_train,y_train)坚持学习整理复盘

查看全文

http://www.zqtcl.cn/news/44520/