当前位置: 首页 > news >正文

电子商务网站建设价格小程序设计与开发

电子商务网站建设价格,小程序设计与开发,网上商城网站设计和实现,wordpress 作者文章数量目录 归一化 数据归一化的背景介绍 MinMaxScaler#xff1a;归一到 [ 0#xff0c;1 ] MaxAbsScaler#xff1a;归一到 [ -1#xff0c;1 ] 标准化 去均值#xff0c;方差规模化 归一化 数据归一化的背景介绍 在之前做聚类分析的时候我们发现#xff0c;聚类的…目录 归一化 数据归一化的背景介绍 MinMaxScaler归一到 [ 01 ]  MaxAbsScaler归一到 [ -11 ]  标准化 去均值方差规模化 归一化 数据归一化的背景介绍 在之前做聚类分析的时候我们发现聚类的效果往往特别受其中一列数据的影响使得原本应该散布在二维平面图上的点变成聚集在一条线上的点可想而知其聚类效果肯定不理想。 左图为所有数据都归一化之后的聚类分析散点图 右图为其中一列是合同金额并且没有归一化数据的散点图 归一化方法有两种形式一种是把数变为01之间的小数一种是把有量纲表达式变为无量纲表达式成为纯量。后者常见于微波之中也就是电路分析、信号系统、电磁波传输等研究物理的人会比较熟悉。而像我们这些普通的数据分析师的日常工作中不太会遇见需要归一化为无量纲表达式的情况因此只讨论归一化到 [01] 的情况。 归一化一般是把数据映射到 [ 01 ] 但也有归一到  [ -11 ] 的情况两种情况在Python中分别可以通过MinMaxScaler 或者 MaxAbsScaler方法来实现。 MinMaxScaler归一到 [ 01 ]  原理 从原理中我们注意到有一个axis0这表示MinMaxScaler方法默认是对每一列做这样的归一化操作这也比较符合实际应用。 eg将数据归一到 [ 01 ]  from sklearn import preprocessing import numpy as npx np.array([[3., -1., 2., 613.],[2., 0., 0., 232],[0., 1., -1., 113],[1., 2., -3., 489]])min_max_scaler preprocessing.MinMaxScaler() x_minmax min_max_scaler.fit_transform(x) print(x_minmax) 运行结果 [[1. 0. 1. 1. ][0.66666667 0.33333333 0.6 0.238 ][0. 0.66666667 0.4 0. ][0.33333333 1. 0. 0.752 ]] 如果有新的测试数据进来也想做同样的转换那么将新的测试数据添加到原数据末尾即可 from sklearn import preprocessing import pandas as pdmin_max_scaler preprocessing.MinMaxScaler()x ([[3., -1., 2., 613.],[2., 0., 0., 232],[0., 1., -1., 113],[1., 2., -3., 489]])#原数据y [7., 1., -4., 987]#新的测试数据 x.append(y)#将y添加到x的末尾 print(x \n, x) x_minmax min_max_scaler.fit_transform(x) print(x_minmax :\n, x_minmax) 运行结果 x [[3.0, -1.0, 2.0, 613.0], [2.0, 0.0, 0.0, 232], [0.0, 1.0, -1.0, 113], [1.0, 2.0, -3.0, 489], [7.0, 1.0, -4.0, 987]] x_minmax :[[0.42857143 0. 1. 0.57208238][0.28571429 0.33333333 0.66666667 0.13615561][0. 0.66666667 0.5 0. ][0.14285714 1. 0.16666667 0.43020595][1. 0.66666667 0. 1. ]] 每一列特征中的最小值变成了0最大值变成了1. MaxAbsScaler归一到 [ -11 ]  原理与MinMaxScaler相似 from sklearn import preprocessing import numpy as npx np.array([[3., -1., 2., 613.],[2., 0., 0., 232],[0., 1., -1., 113],[1., 2., -3., 489]]) max_abs_scaler preprocessing.MaxAbsScaler() x_train_maxsbs max_abs_scaler.fit_transform(x) x_train_maxsbs 运行结果 array([[ 1. , -0.5 , 0.66666667, 1. ],[ 0.66666667, 0. , 0. , 0.37846656],[ 0. , 0.5 , -0.33333333, 0.18433931],[ 0.33333333, 1. , -1. , 0.79771615]]) 如果有新的测试数据进来和原来的表一起进行归一化 from sklearn import preprocessing import pandas as pdmax_abs_scaler preprocessing.MaxAbsScaler()x ([[3., -1., 2., 613.],[2., 0., 0., 232],[0., 1., -1., 113],[1., 2., -3., 489]])#原数据y [5., 1., -4., 888]#新的测试数据 x.append(y) print(x \n, x) x_train_maxsbs max_abs_scaler.fit_transform(x) print(x_train_maxsbs :\n, x_train_maxsbs) 运行结果 x [[3.0, -1.0, 2.0, 613.0], [2.0, 0.0, 0.0, 232], [0.0, 1.0, -1.0, 113], [1.0, 2.0, -3.0, 489], [5.0, 1.0, -4.0, 888]] x_train_maxsbs :[[ 0.6 -0.5 0.5 0.69031532][ 0.4 0. 0. 0.26126126][ 0. 0.5 -0.25 0.12725225][ 0.2 1. -0.75 0.55067568][ 1. 0.5 -1. 1. ]] 其他数据预处理方法 数据标准化 - scale() - Python代码 拉格朗日插值法补充缺失值 连续数据离散化等宽、等频、聚类离散 清洗你见过的各种类型的重复
http://www.zqtcl.cn/news/949934/

相关文章:

  • 申请微官网的网站国外域名注册商网站
  • 集团公司网站建设建设中学校园网站的来源
  • 产品展示网站含后台网站模板下载网站开发什么语言好
  • 做知乎网站的图片如何设计好网站
  • 广州企业网站推广织梦学校网站模板
  • 国内响应式网站案例深圳住房和城乡建设局网站
  • 网页制作网站首页中国建筑论坛网
  • 众创空间网站建设少年宫网站建设模块
  • 企业营销型网站的内容科技公司取名大全
  • 哈尔滨云建站模板投资公司的钱从哪里来
  • 海南做网站公司哪家好中国人做外贸生意的网站
  • 没有网站怎么做cpa成都百度推广公司地址
  • 龙湖地产 网站建设高端上海网站设计公司
  • 触屏手机网站模板装修设计软件排名
  • 怎么做盗文网站郑州建设教育培训中心
  • 网站安全解决方案嵌入式软件工程师培训
  • 怎么做一种网站为别人宣传网站界面切片做程序
  • 麻涌网站建设河北网站建设联系方式
  • 建设银行官方网站打不开啊寮步仿做网站
  • 一个人可做几次网站备案峰峰网站建设
  • 怎么盗号网站怎么做北京高端网站设计外包公司
  • 著名的淘宝客网站wordpress博客内容预览
  • 成都网站seo公司甘肃网站建设推广
  • 做网站加班网站项目意义
  • 在虚拟机中如何做二级域名网站个人网站做哪种能赚钱
  • 贵州建设水利厅考试网站wordpress主查询翻页
  • 网站优化网络推广seo天津建设工程信息网几点更新
  • 兰州网站seo技术厂家比较实用的h5网页建设网站
  • 怎样让自己做的网站被百度收录动漫制作软件
  • 西安网站制作哪家公司好怎么向企业推销网站建设