当前位置: 首页 > news >正文

哈尔滨建设网站哪家好沪深300指数

哈尔滨建设网站哪家好,沪深300指数,开发一个app难吗,东莞做网站(信科网络)特征缩放 #x1f340;特征缩放的重要性#x1f331;归一化#x1f331;标准化#x1f331;更高级的缩放方法#x1f338;导入数据集将数据集划分为训练集和测试集#x1f338;Sklearn-Learn算法实现归一化#x1f338;Sklearn-Learn算法实现标准化 #x1f340;特… 特征缩放 特征缩放的重要性归一化标准化更高级的缩放方法导入数据集将数据集划分为训练集和测试集Sklearn-Learn算法实现归一化Sklearn-Learn算法实现标准化 特征缩放的重要性 特征缩放是数据预处理中一个容易被遗忘的步骤。 决策树和随机森林是两种维数不多的不需要特征缩放的机器学习算法这些算法不受特征缩放的影响。梯度下降优化算法的实现如果将特征缩放到同一尺度大多数机器学习和优化算法将会表现得更好。 可以通过一个简单的例子来说明特征缩放的重要性。 假设有两个特征一个特征的值为在1到10之间另一个特征的值在1到100000之间。 例如使用Adaline的平方差损失函数可以说算法主要根据第二个特征优化权重因为第二个特征主导平方差损失函数值。 另一个例子是k近邻算法k近邻算法使用欧式距离度量样本间的距离这样样本间的距离将由第二个特征轴控制。 标准化和归一化是两种常见的可以将特征值调整到同一尺度的方法。 归一化 通常归一化指的是将特征缩放到**[0,1]范围内是最小最大缩放(min-max scaling)的一种特殊情况。 为了是数据归一化可以简单地对每一个特征进行最大最小缩放**。 在下面式子中使用最大最小缩放方法归一化一个样本的第i个特征 x n o r m ( i ) x i − x m i n x m a x − x m i n x_{norm}^{(i)}\frac{x^i-x_{min}}{x_{max}-x_{min}} xnorm(i)​xmax​−xmin​xi−xmin​​ 其中 x i x^{i} xi是一个特定样本的第i个特征 x m i n x_min xm​in是所有数据第i个特征中的最小值 x m a x x_max xm​ax是所有数据第i个特征中的最大值 x n o r m i x_{norm}^{i} xnormi​是特定样本缩放后的第i个特征。 使用最大最小缩放进行数据归一化是一种常用的方法在需要特征值位于有界区间时非常有用。 要注意的是只能训练数据拟合MinMaxScaler类再用拟合后的参数转换测试数据集或任何新的数据样本这一点非常重要。 标准化 但对许多机器学习算法尤其是梯度下降类型的算法标准化更加实用因为许多线性模型如逻辑回归和支持向量机将权重初始化为0或者接近0的随机数。 标准化将特征列的中心值设置为0标准差设置为1这样特征列的参数与标准正态分布(零均值和单位方差)的参数相同从而使模型更容易学习权重。 然而应该强调标准化不会改变特征列的分布形状也不会将非正态分布的特征列转换为正态分布。 除了将数据进行平移缩放使其具有零均值和单位方差之外标准差保留了特征列的其他信息包括异常值等。 这样学习算法对异常值的敏感度会降低而最小最大缩放则将数据放到有限的范围从而丢失了异常值的信息。 标准化可以用以下表达式表示 x s t d ( i ) x i − μ x σ x x_{std}^{(i)}\frac{x^{i}- \mu_x}{\sigma_x} xstd(i)​σx​xi−μx​​ 这里 μ x \mu_x μx​是第i个特征列的样本均值 σ x \sigma_x σx​是第i个特征列的标准差。 对于由数字0到5组成的简单样本数据集下面展示标准化和归一化两种特征缩放方法之间的差异 输入标准化最大最小归一化0.0-1.463850.01.0-0.878310.22.0-0.292770.43.00.292770.64.00.878310.85.01.463851.0 同样要注意的是只能训练数据拟合StandardScaler类再用拟合后的参数转换测试数据集或任何新的数据样本这一点非常重要。 更高级的缩放方法 Scikit-Learn还提供了其他更高级的特征缩放方化例如RobustScaler。如果数据集是包含许多异常值的小数据集那么RobustScaler尤其有用并推荐使用。 类似地如果机器学习算法很容易过拟合该数据集那么RobustScaler也是一个不错的选择。RobustScaler独立处理数据的每个特征列。具体来讲RobustScaler调整中位数为0并根据数据集的第1和第3四分位数对数据进行缩放以减小极值和异常值的影响。 导入数据集将数据集划分为训练集和测试集 import pandas as pd dfpd.read_excel(D:\A_data\Data_wine数据\wine.xlsx)from sklearn.model_selection import train_test_split X,ydf.iloc[:,1:].values,df.iloc[:,0].values X_train,X_test,y_train,y_testtrain_test_split(X,y,train_size0.3,random_state0,stratifyy)Sklearn-Learn算法实现归一化 from sklearn.preprocessing import MinMaxScaler mmsMinMaxScaler() X_train_normmms.fit_transform(X_train) X_test_normmms.transform(X_test)Sklearn-Learn算法实现标准化 from sklearn.preprocessing import StandardScaler stdscStandardScaler() X_train_stdstdsc.fit_transform(X_train) X_test_stdstdsc.transform(X_test)
http://www.zqtcl.cn/news/747179/

相关文章:

  • 凡科建站怎么建网站网络搭建是什么工作
  • wordpress支持国内视频的编辑器网站优化排名软件网站
  • 建设摩托官方网站南京做网站群的公司
  • 晋城城乡建设局网站设计网站公司选泽y湖南岚鸿询 问
  • 思坎普网站建设湘潭网站推广
  • 北京网站建设公司哪个最好做投标网站条件
  • 网站建设的成本有哪些内容怎么样制作网页
  • 怎么做网站的seo排名知乎茂名网站制作公司
  • 建安证查询网站官方网站建设对比
  • 关于医院要求建设网站的请示市场推广12种推广渠道
  • php做不了大型网站深圳公司注册网址官方
  • 网站副标题怎么写杭州抖音代运营
  • 网站建设基本资料网站数据库连接出错
  • 娄底网站开发温州seo排名公司
  • 成都有哪些网站开发公司最新网推项目
  • 分享公众号的网站小型企业类网站开发公司
  • 青岛网站建设方案案例wordpress主题模板 国人
  • 哪家高端网站建设好贷款织梦网站模板
  • 北京网站建设公司价格最近中文字幕2018免费版2019
  • 帮人做设计的网站自己怎么做新闻开头视频网站
  • 网站开发搜索功能中国建设银行ie下载网站
  • 中山网站建设 骏域网站的形式有哪些
  • 深圳企业网站重庆建站塔山双喜
  • 征婚网站 女 做茶叶生意企业网站推广服务协议
  • 安徽省住房城乡建设厅网站官网英语机构网站建设方案
  • 电商建站价格深圳龙岗建站公司
  • 可以下载源程序的网站.htaccess wordpress
  • 国内优秀设计网站小程序推广方案
  • 网站构建是什么意思怎么做网站盗号
  • 学校网站建设行业现状wordpress怎么保存图片