网站申请专利,徐州网站建设大前端,盐城代运营,建站哪家好要认定兴田德润前言1、Python的Pandas是一个基于Python构建的开源数据分析库#xff0c;它提供了强大的数据结构和运算功能。2、Series#xff1a;一维数组#xff0c;类似于Numpy中的一维array#xff0c;但具有索引标签#xff0c;可以保存不同类型的数据#xff0c;如字符串、布尔值…前言1、Python的Pandas是一个基于Python构建的开源数据分析库它提供了强大的数据结构和运算功能。2、Series一维数组类似于Numpy中的一维array但具有索引标签可以保存不同类型的数据如字符串、布尔值、数字等。DataFrame二维表格型数据结构与SQL表或Excel工作表类似每列可以是不同的数据类型如数值、字符串或日期并且具有列名和行索引。DataFrame是Pandas的核心数据结构提供了丰富的数据操作方法。接下来我们将逐步介绍他的用法一、导入Pandas库 简写为pd
import pandas as pd二、使用Series创建一维数组从0开始存储三、index查看下标values查看下标的值注意不知道标签和下标的区别请看目录五的解释1、index的输出类似于range start代表起始标签stop代表结束标签不会到这个值到n-1值step代表步长。2、valuses: 直接查看下标的值记得是重0开始的值四、使用index指定标签注意可以看到数组中1的标签不是默认值0了而是标签5如果利用想输出下标0这时候会报错我们要使用到 “iloc“ and ” loc“请看五五、iloc and loc的使用解释1、iloc是原下标也就是默认值计算机的记忆2、loc是修改过的下标我们把他叫作标签标签是由我们自主给的计算机并不会自己产生可以看到计算机的下标1的值是2可以看到我们给的标签1的值是5六、创建对象1、这里的我们所理解的键其实就是数据的标签大部分的人可能会理解为这里是一个字典或者一个数组其实都不是是一个一维数据2、什么是键如果不知道就需要回头学习python基础了。 键是字典的一个解释前键后值称为键值对如下的“键”值3、修改数据使用loc找标签“小张”让他的值等于95可以看到被修改了4、筛选数据这里的就是pythonand的意思七、两个数据相加、相减、相乘、相除1、相加——add可以看到需要链接s1如果没有s1那会导致数据相加错误出现NaN这个时候我们应该使用add 在s1的基础上adds2fill_value “如果出现没有值的情况以0代替”2、相减——sub3、相乘——mul4、相除——div八、求最大值、最小值、求和值、平均值九、describe() —— 数据分析方法十、apply() —— 定义函数判断数据apply对数据批量处理十一、DataFrame —— 创建二维数组十二、修改标签标签名要统一否则会报错但是可以缺少但数据也要缺少一一对应特别标签会自动排序好十二、查看标签行属性十三、查看列属性十四、查看数据十五、数据颠倒——行列调换十六、提取数据列1、查看班级数据2、查看成绩数据3、查看学号和成绩这里我们需要再加一个【】如果不加会报错十七、提取数据行注意loc和iloc的区别十八、切片操作1、标签切片2、下标切片 注意3是终止并不会执行如果想小红到小丽需要 [1:4]3、行列切片——标签4、行列切片——下标十九、筛选——判断、提取数据1、单单判断数据输出布尔值2、判断完数据并提取数据输出数据二十、查看前几行数据——数据量庞大可使用 注意:如果head不输入任何的值那他的默认值为5输出前5行数据二十一、drop搭配axis用法我们先导入要使用的数据 添加考试4的数据drop就是删除的意思axis用来指定是行还是列可以看到删除了行的002和004可以看到删除了列的考试2和考试4二十二、两个数据相加1、student的数据请看目录二十一2、先定于一个数据bonus让他们两个相加3、注意运行一次相加一次标签要一一对应否则会导致数据错误。相加完之后不会改变原数据如果需要改变原数据全部都是要重新赋值实现重新赋值以考试4位例二十三、案例实操——求出平均值meanaxis1求平均值每一行。这里可能会导致理解冲突上面解释axis0代表行axis1代表列但是meanaxis1为什么代表的是行请看下面的解释可以理解为如果被包含则方向相反。 行对列操作 列对行操作二十四、案例实操——筛选出第二大的数据1、loc[:,考试1:考试3] 其实就是 loc[001:006,考试1:考试3]2、lambda x定义匿名函数x3、np.sort(x)使用numpy库的sort方法进行升序4、np.sort(x)[-2]升序完后提取倒数第二个值也就是第二大的值然后返回匿名函数x