当前位置: 首页 > news >正文

品牌营销战略网站布局优化怎么做

品牌营销战略,网站布局优化怎么做,上海招聘网官方网站,网站开发运行详细步骤1.缺失值概要 数据的缺失主要包括记录的缺失和记录中某个字段信息的缺失#xff0c;两者都会造成分析结果的不准确#xff0c;以下从缺失值产生的原因及影响扥方面展开分析。 #xff08;1#xff09;缺失值产生的原因 1#xff09;有些信息暂时无法获取#xff0c;或…1.缺失值概要 数据的缺失主要包括记录的缺失和记录中某个字段信息的缺失两者都会造成分析结果的不准确以下从缺失值产生的原因及影响扥方面展开分析。 1缺失值产生的原因 1有些信息暂时无法获取或者获取信息的代价太大 2有些信息是被遗漏的。可能是因为输入时认为不重要、忘记填写或对数据理解错误等一些人为因素而遗漏也可能是由于数据采集设置的故障、存储介质的故障、传输媒体的故障灯非人为原因而丢失 3属性值不存在。在某些情况下缺失值并不意味着数据有错误。对一些对象来说某些属性是不存在的如一个未婚者的配偶姓名、一个儿童的固定收入等。 2缺失值的影响 1数据挖掘建模将丢失大量的有用信息 2数据挖掘模型所表现出的不确定性更加显著模型中蕴涵的规律更难把握。 3包含空值的数据会使建模过程陷入混乱导致不可靠的输出。 3缺失值的分析 使用简单的统计分析可以得到含有缺失值的属性的个数以及每个属性的未缺失数、缺失数与缺失率等。 从总体上来说缺失值的处理分为删除存在缺失值的记录、对可能值进行插补和不处理3种情况。 2.缺失值处理 import pandas as pd import numpy as np df pd.read_csv(data/table_missing.csv) #默认输出DataFrame的前5行 df.head() 1了解缺失数据 函数isna和notna方法 df[Physics].isna().head() df[Physics].notna().head() 统计每列每行的缺失情况 #统计每列的缺失 df.isna().sum()#或者df.isnull().sum() #统计每行的缺失 df.isna(axis0).sum()#或者df.isnull(axis0).sum() 挑出该列缺失值的行 df[df[Physics].isna()] 挑选出所有非缺失值的列 这里介绍了all和any的用法all是全部值any是至少有一个值 #all是全部非缺失值 df[df.notna().all(1)] #any至少有一个不是缺失值 df[df.notna().any(1)] 2三种缺失符号 anp.nan 它不等与任何东西甚至不等于自己¶ 在用equals函数比较时自动略过两侧全是np.nan的单元格 在numpy中的类型为浮点由此导致数据集读入时即使原来是整数的列只要有缺失值就会变为浮点型 对于布尔类型的列表如果是np.nan填充那么它的值会自动变为True而不是False但当修改一个布尔列表时会改变列表类型而不是赋值为True 在所有的表格读取后无论列是存放什么类型的数据默认的缺失值全为np.nan类型因此整型列转为浮点而字符由于无法转化为浮点因此只能归并为object类型O原来是浮点型的则类型不变。 bNone None比前者稍微好些至少它会等于自身 它的布尔值为False 修改布尔列表不会改变数据类型 在传入数值类型后会自动变为np.nan 只有当传入object类型是保持不动几乎可以认为除非人工命名None它基本不会自动出现在Pandas中 在使用equals函数时不会被略过因此下面的情况下返回False¶ cNaT NaT是针对时间序列的缺失值是Pandas的内置类型可以完全看做时序版本的np.nan与自己不等且使用equals是也会被跳过。 3Nullable类型与NA符号 aNullable整形 对于该种类型而言它与原来标记int上的符号区别在于首字母大写‘Int’好处在于缺失值的类型都被替换成统一的NA符号且不改变数据类型。 bNullable布尔  与Nullable整型一致且数据类型不会变成浮点型 cstring类型 为了区分开原本含糊不清的object类型它本质上也属于Nullable类型因为不会含有缺失而改变类型 与object类型的一点重要区别就在于在调用字符方法后string类型返回的是Nullable类型object则会根据缺失类型和数据类型而改变。 4NA的特性 a逻辑运算 只需看该逻辑运算的结果是否依赖pd.NA的取值如果依赖则结果还是NA如果不依赖则直接计算结果取值不明直接报错 b算术运算和比较运算 当出现pd.NA**0和1**pd.NA时结果为1其他情况为NA 5convert_dtypes方法 在读取数据时就把数据列转为Nullable是pandas1.0的新函数。 pd.read_csv(data/table_missing.csv).convert_dtypes().dtypes 3.缺失数据的运算与分组 a加号和乘号规则 使用加法时缺失值为0 使用乘法时缺失值为1 使用累计函数时缺失值自动略过 bgroupby方法中的缺失值 自动忽略为缺失值的组 df_g pd.DataFrame({one:[A,B,C,D,np.nan],two:np.random.randn(5)}) print(df_g) df_g.groupby(one).groups4.填充与剔除 afillna方法值填充与前后向填充methodsffill or bfill #值填充 df[Physics].fillna(missing).head() #前向填充 df[Physics].fillna(methodffill).head() #后向填充 df[Physics].fillna(methodbackfill).head() 指定列填充 df_f pd.DataFrame({A:[1,3,np.nan],B:[2,4,np.nan],C:[3,5,np.nan]}) #填充全部列 df_f.fillna(df_f.mean()) #填充A,B两列 df_f.fillna(df_f.mean()[[A,B]]) bdropna方法 axis参数是行或列的参数如果axis0则对应是每一行如果axis1,则对应没一列 how参数是可以选择all或者是any表示全为缺失去除或存在缺失去除 subset参数是在某一列范围中搜索缺失值 5.插值interpolation 常见的数据插补方法有 1线性插值 a与索引无关的线性插值 默认状态下interpolate会对缺失的值进行线性插值 s pd.Series([1,10,15,-5,-2,np.nan,np.nan,28]) s.interpolate() b与索引有关的线性插值 method中的index和time选项可以是插值线性地依赖索引即插值为索引的线性函数 s.interpolate(methodindex) 如果索引是时间那么可以按照时间长短插值。 s_t pd.Series([0,np.nan,10],index[pd.Timestamp(2012-05-01),pd.Timestamp(2012-05-07),pd.Timestamp(2012-06-03)]) #未按照time插值图1 s_t.interpolate() #按照time插值图2 s_t.interpolate(methodtime) 2高级插值方法 与线性插值相比较例如样条插值、多项式插值、阿基玛插值等可进一步学习。 ser pd.Series(np.arange(1, 10.1, .25) ** 2 np.random.randn(37)) missing np.array([4, 13, 14, 15, 16, 17, 18, 20, 29]) ser[missing] np.nan methods [linear, quadratic, cubic] df pd.DataFrame({m: ser.interpolate(methodm) for m in methods}) df.plot() 3interpolate的限制参数 alimit最多插入多少个s.interpolate(limit2) blimit_direction表示插值方向可选forwordbackwardboth默认前向s.interpolate(limit_directionbackward) climit_area表示插值区域可选insideoutside默认Nones.interpolate(limit_areainside) 练习题 1如何删除缺失值在25%以上的列 s.drop(s.columns[s.isna().sum()/s.shape[0]0.25],axis1)
http://www.zqtcl.cn/news/51172/

相关文章:

  • 商务网站的特点wordpress 添加主题编辑
  • 网站注册页面html西安到北京
  • st3网站开发个人微信crm
  • 网站排名英文wordpress 建站教程
  • 官方网站建设 找磐石网络一流wordpress邮件重置密码错误
  • 建设会计协会网站微信网页版登录界面
  • 黄州网站建设织梦网站首页文字修改
  • 织梦中英网站怎么做网站的管理
  • 申请了域名 网站怎么建设呢深圳网站建设公司联
  • 网站建设推荐烟台门户网站开发
  • wordpress图站做网站的一些话术
  • 网站建设协议合同范本网站平台建设目标
  • 做化验的网站wordpress 升级后 插件
  • 亿唐网不做网站做品牌原因深圳住建局官方网电话
  • 医院网站建设安全协议平台建设包括哪些方面
  • 顺德网站制作案例如何seo百度百科
  • 南京网站设计哪家好外贸开发软件有哪些
  • 本机可以做网站的服务器合肥网站设计机构
  • 亚马逊欧洲站入口网址营销网站建设优化
  • 网站开发进度时间表网站开发部门的规章制度
  • wordpress模版主题seo公司上海
  • 百度里面的站长工具怎么取消wordpress导入文件
  • 房地产集团网站欣赏网站建设参考的文献
  • 莆田做网站建设高端建设网站公司哪家好
  • 邢台建手机网站流程建网站如何备案
  • 深圳培训网站建设灯塔网站seo
  • 网站建设名头整合营销的成功案例
  • 农村建设开发有限公司网站福州网站建设金森
  • html5博客网站源码泰州网站制作推广
  • 全国网站建设大赛廊坊营销网站服务