优化网站怎么做,wordpress 广告格子,深圳物流公司排名前十,dw制作模板前言#xff1a;几种常用数据格式的介绍 csv文件 1. 逗号分隔值文件#xff0c;以纯文本形式#xff08;记事本#xff09;存储表格数据 2. 它是一种平面文件#xff1a;即只存储数据和文字#xff0c;不能存储公式、图表等 3. 更适合存储大数据#xff0c;一般用来批…前言几种常用数据格式的介绍 csv文件 1. 逗号分隔值文件以纯文本形式记事本存储表格数据 2. 它是一种平面文件即只存储数据和文字不能存储公式、图表等 3. 更适合存储大数据一般用来批量一维或二维存储数据 4. csv、tsv、txt都属于文本文件只是csv以逗号分隔tsv以制表符Tab隔开而txt没有具体要求逗号、制表符、空格等都可 CSV文件的存储方式 Excel文件 1. Excel是一个电子表格将文件保存为自己的专有格式即xls或xlsx 2. Excel是一个二进制文件它不仅可以存储数据还可以对数据进行操作 3. 不适合处理大数据 JSON数据 1. JSON是一种轻量级的数据交换格式用于存储和传输结构化数据 2. JSON一般存储与Web浏览器中是一种在各个编程语言中流通的数据格式类似英语 3. JSON 数据的书写格式是键名称值对 XML、HXML格式 1. XML是一种标记语言被设计用来传输和存储数据同JOSH其焦点是数据的内容 2. HTML 是超文本标记语言被设计用来显示数据其焦点是数据的外观 1.在python中新建文件
文件类型新建方法csv和txt纯文本文件pd.to_csv路径excelpd.to_excel路径sqlpd.to_sql路径 新建文件方法的几个参数 sep分隔符 na_rep : 缺失值标注默认为空字符串 index : 是否写入行的标签默认True header 是否写入列的标签默认True import pandas as pd
import numpy as nproad D:\python code\pycharm\表格.xlsx
data pd.DataFrame(np.arange(9).reshape(3, 3))
print(data)
data.to_excel(road,indexFalse,headerFalse) 2.读写csv和txt文本文件 读写文本文件方法的几个参数 sep 文件的分隔符如果文件中分隔符不止一个一般输入一个正则表达式 “\s” header 默认第一行为列名如果不是则输入None names : 指定列名列表和header搭配使用 index_col : 指定一个列用作行名可以输入索引名或索引编号 skiprows 从开头起需要跳过的行数或行号列表 nrows 从文件开头处需要读入的行数 na_values 需要用Na替换的值序列 3.读取Excel文件 操作基本和文本文件差不多最好先装好第三方包 xlrd和openpyxl
import pandas as pd
road E:\python 资料\孙兴华 数据分析教程\Pandas课件\课件\pandas教程\课件001-005\读取文件.xlsx
data pd.read_excel(road,header None,names[序号,姓名,年龄,手机,地址,日期],index_col 0) #读取文件
print(data)
data.to_excel(road) #保存文件