当前位置: 首页 > news >正文

毕节网站建设公司网站职业技术培训学校

毕节网站建设公司,网站职业技术培训学校,深圳品牌网站制作多少钱,asp.net做网站怎么样介绍 scikit-learn 中的 preprocessing 模块提供了多种数据预处理工具#xff0c;用于准备和转换数据以供机器学习模型使用。这些工具可以帮助您处理数据中的缺失值、标准化特征、编码分类变量、降维等。以下是一些常见的 preprocessing 模块中的功能和用法示例#xff1a; …介绍 scikit-learn 中的 preprocessing 模块提供了多种数据预处理工具用于准备和转换数据以供机器学习模型使用。这些工具可以帮助您处理数据中的缺失值、标准化特征、编码分类变量、降维等。以下是一些常见的 preprocessing 模块中的功能和用法示例 标准化特征Feature Scaling 使用 StandardScaler 类可以对特征进行标准化使其具有零均值和单位方差。这对于许多机器学习算法来说是必要的。示例使用方法 from sklearn.preprocessing import StandardScalerscaler StandardScaler() X_train_scaled scaler.fit_transform(X_train) X_test_scaled scaler.transform(X_test)最小-最大缩放Min-Max Scaling 使用 MinMaxScaler 类可以将特征缩放到指定的最小值和最大值之间通常在0到1之间。示例使用方法 from sklearn.preprocessing import MinMaxScalerscaler MinMaxScaler() X_train_scaled scaler.fit_transform(X_train) X_test_scaled scaler.transform(X_test)编码分类变量 使用 LabelEncoder 类可以将分类变量编码为整数标签。示例使用方法 from sklearn.preprocessing import LabelEncoderencoder LabelEncoder() y_encoded encoder.fit_transform(y)独热编码One-Hot Encoding 使用 OneHotEncoder 类可以将分类变量转换为独热编码形式创建虚拟变量。示例使用方法 from sklearn.preprocessing import OneHotEncoderencoder OneHotEncoder() X_encoded encoder.fit_transform(X_categorical).toarray()处理缺失值 使用 SimpleImputer 类可以填充数据中的缺失值可以选择使用均值、中位数、众数等填充策略。示例使用方法 from sklearn.impute import SimpleImputerimputer SimpleImputer(strategymean) X_imputed imputer.fit_transform(X_missing)降维 使用 PCA 类可以进行主成分分析PCA降维将高维数据投影到低维空间。示例使用方法 from sklearn.decomposition import PCApca PCA(n_components2) X_pca pca.fit_transform(X)以上是一些 preprocessing 模块中常见功能的示例用法。数据预处理是机器学习中非常重要的一步它有助于提高模型的性能和稳定性。您可以根据您的数据和任务选择适当的预处理方法并将其应用于您的数据以确保数据准备得当。 实例 例1 from sklearn import preprocessing import numpy as npa np.array([[10, 2.7, 3.6],[-100, 5, -2],[120, 20, 40]]) print(a) print(preprocessing.scale(a)) 输出 [[ 10. 2.7 3.6][-100. 5. -2. ][ 120. 20. 40. ]] [[ 0. -0.85170713 -0.55138018][-1.22474487 -0.55187146 -0.852133 ][ 1.22474487 1.40357859 1.40351318]] 例2 from sklearn import preprocessing #预处理的模块 import numpy as np from sklearn.model_selection import train_test_split #将数据打乱随机分为训练集和测试集的类train_test_split from sklearn.datasets import make_classification #datasets中make开头的创建数据集的类make_classification from sklearn.svm import SVC #训练模型的类SVC import matplotlib.pyplot as pltX, y make_classification(n_samples300, n_features2,n_redundant0, n_informative2,random_state22,n_clusters_per_class1,scale100) plt.scatter(X[:, 0], X[:, 1], cy) plt.show()X preprocessing.scale(X) X_train, X_test, y_train, y_test train_test_split(X, y, test_size.3) clf SVC() clf.fit(X_train, y_train) print(clf.score(X_test, y_test)) #输出为0.9555555555555556 #当删去对X的预处理语句X preprocessing.scale(X)这里的输出理论上减小 输出
http://www.zqtcl.cn/news/593357/

相关文章:

  • 果洛wap网站建设比较好17岁在线观看免费高清完整版
  • 一级a做爰片在线看免播放器网站一个网站突然打不开
  • 聊城网站开发培训wordpress实时预览载入中
  • 网站设计文章国际转运网站建设
  • 南充市建设厅官方网站购物网站设计说明
  • 防疫网站网页设计wordpress不同侧边栏
  • 网站的建设多少钱长春市招标建设信息网
  • 网站加速代码百度浏览器app
  • 关于配色的网站企业宣传册文案范文
  • 免费推广网站教程湖南中核建设工程公司官方网站
  • 莱阳网站建设公司彩票类网站是如何做代理的
  • 食品公司网站建设广州做网站制作公司
  • 网站上传服务器教程搜索网站存在的关键字
  • 天河建设网站多少钱网络公司网站样本
  • 做的精美的门户网站推荐附近编程培训机构
  • 台州黄岩做网站太原网站建设王道下拉惠
  • 深圳设计网站公司互联网服务平台投诉中心
  • 做seo网站优化哪家强济南网站建设公司排名
  • tp5网站文档归档怎么做手机虚拟机哪个好用
  • 网站建设公司的业务范围万网做网站多少钱
  • 做网站要用写接口6wordpress 汽车租赁
  • 网站开发方向paypal账号注册
  • 如何选择做pc端网站重庆平台网站建设企业
  • 一个人做网站好累电子商城采购流程
  • 网站制作维护价格信息网站建设方案
  • 如何选择建网站公司能看人与动物做的网站
  • 温州网站建设方案外包不能访问子目录的网站
  • 建设拼多多一样网站需要多少钱wordpress企业站主题免费
  • 无锡网站制作哪家公司好做微信文章的网站
  • 网站 制作信产部网站备案