北京企业网站搭建,免费网页模板下载大全,怎么注册电力建设公司网站,机械加工网哪个平台好value_counts() 函数得作用
用来统计数据表中#xff0c;指定列里有多少个不同的数据值#xff0c;并计算每个不同值有在该列中的个数#xff0c;同时还能根据指定得参数返回排序后结果。 返回得是Series对象
value_counts(values,sortTrue, ascendingFalse, normalizeFal…value_counts() 函数得作用
用来统计数据表中指定列里有多少个不同的数据值并计算每个不同值有在该列中的个数同时还能根据指定得参数返回排序后结果。 返回得是Series对象
value_counts(values,sortTrue, ascendingFalse, normalizeFalse,binsNone,dropnaTrue)
sortTrue 是否要进行排序默认进行排序 ascendingFalse 默认降序排列 normalizeFalse 是否要对计算结果进行标准化并显示标准化后的结果默认是False。 binsNone 可以自定义分组区间默认是否 dropnaTrue是否删除缺失值nan默认删除
数据集 要求统计不同lable出现得次数
任何参数都不带
train_df[label].value_counts() ascendingTrue normalizeTrue 数据标准化在多指标评价体系中由于各评价指标的性质不同通常具有不同的量纲和数量级。当各指标间的水平相差很大时如果直接用原始指标值进行分析就会突出数值较高的指标在综合分析中的作用相对削弱数值水平较低指标的作用。因此为了保证结果的可靠性需要对原始指标数据进行标准化处理。 数据的标准化normalization是将数据按比例缩放使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到去除数据的单位限制将其转化为无量纲的纯数值便于不同单位或量级的指标能够进行比较和加权。
train_df[label].value_counts(ascendingFalse,normalizeTrue)
数据标准化以后所有得项得和为1可能因为计算机存储数据而有误差 常用来计算各数据占的比例 bins分组统计 对于数值型的可以进行分组分组以后返回结果 几种使用方式
先取出列Series对象然后调用函数这时候相当于train_df[label].value_counts() DataFrame对每一列都进行统计train_df.apply(pd.value_counts) 直接使用Pandas调用pd.value_counts(train_df[label],ascendingTrue)
同样的统计还可以使用 groupby,这个的过程是先按‘label’分组然后再统计每组的值这样的效率较低不建议使用
train_df.groupby(label).count()