上海自助建站官网,网站开发视频代码,建设银行插u盾网站上不去,天津正规制作网站公司假设有Excel文件data.xlsx#xff0c;其中内容为
现在需要将这个Excel文件中的数据读入pandas#xff0c;并且在后续的处理中不关心ID列#xff0c;还需要把sex列的female替换为1#xff0c;把sex列的male替换为0。本文演示有关的几个操作。
#xff08;1#xff09;导入…假设有Excel文件data.xlsx其中内容为
现在需要将这个Excel文件中的数据读入pandas并且在后续的处理中不关心ID列还需要把sex列的female替换为1把sex列的male替换为0。本文演示有关的几个操作。
1导入pandas模块import pandas as pd
2把Excel文件中的数据读入pandasdf pd.read_excel(data.xlsx)df
ID age height sex weight
张三 1 39 181 female 85
李四 2 40 180 male 80
王五 3 38 178 female 78
赵六 4 59 170 male 66
3删除ID列
可以得到新的DataFramedf.drop(ID, axis1)
age height sex weight
张三 39 181 female 85
李四 40 180 male 80
王五 38 178 female 78
赵六 59 170 male 66
也可以直接在原DataFrame上原地删除df.drop(ID, axis1, inplaceTrue)df
age height sex weight
张三 39 181 female 85
李四 40 180 male 80
王五 38 178 female 78
赵六 59 170 male 66
4替换sex列
方法一使用replace()方法替换sex列得到新的DataFrame如果指定参数inplaceTrue则可以原地替换。df.replace({female:1, male:0})
age height sex weight
张三 39 181 1 85
李四 40 180 0 80
王五 38 178 1 78
赵六 59 170 0 66
方法二使用map()方法lambda表达式原地替换。df1 df[:]df1[sex] df1[sex].map(lambda x:1 if xfemale else 0)df1
age height sex weight
张三 39 181 1 85
李四 40 180 0 80
王五 38 178 1 78
赵六 59 170 0 66
方法三使用map()方法字典原地替换。df1 df[:]df1[sex] df1[sex].map({female:1, male:0})df1
age height sex weight
张三 39 181 1 85
李四 40 180 0 80
王五 38 178 1 78
赵六 59 170 0 66
方法四使用loc类原地替换。df1 df[:]df1.loc[df[sex]female, sex] 1df1.loc[df[sex]male, sex] 0df1
age height sex weight
张三 39 181 1 85
李四 40 180 0 80
王五 38 178 1 78
赵六 59 170 0 66