Python自动化-Excel:pandas新建、读取excel文件
命令行窗口:pip install pandas
import pandas as pd
新建一个空白excel:to_excel
# 新建一个空白excel
sh1 = pd.DataFrame()
sh1.to_excel("01.xlsx")
print("新建成功")
新建excel文件并写入数据
# 新建excel并写入数据
sh1 = pd.DataFrame({"序号":[1,2,3],"姓名":["张三","李四","王五"]}) # 使用字典
sh1.to_excel("02.xlsx")
print("新建成功")
# 多了一个索引列,取消:指定某列为索引列
# 设置索引列
sh1 = pd.DataFrame({"序号":[1,2,3],"姓名":["张三","李四","王五"]})
sh1 = sh1.set_index("序号")
sh1.to_excel("02.xlsx")
print("新建成功")
新建csv、txt文件并写入数据:to_csv
sh1 = pd.DataFrame({"序号":[1,2,3],"姓名":["张三","李四","王五"]})
sh1 = sh1.set_index("序号")
sh1.to_csv("02.csv")
sh1.to_csv("02.txt")
print("新建成功")
读取csv/txt文件:read_csv()
# 读取csv/txt文件,csv默认使用英文逗号分隔符
# 读取所有数据
data1 = pd.read_csv("读取文件.txt")
print(data1)
# 显示几行几列
print(data1.shape)
#(6,6)默认第一行为表头
# 查看列名列表
print(data1.columns)
# Index(['男', '杨过', '19', '13901234567', '终南山古墓', '2000/1/1'], dtype='object')
# 显示索引号
print(data1.index)
# RangeIndex(start=0, stop=6, step=1)
相关参数:read_csv(文件,sep,header,names,index_col,skiprows,encoding,nrows)
将txt文件转换为csv文件
# 将txt文件转换为csv文件(先读取,再创建)
data2 = pd.read_csv("读取文件.txt")
data2.to_csv("读取文件.csv")
读取excel文件:read_excel()
# 读取excel文件
data3 = pd.read_excel("读取文件.xlsx")
print(data3)
# 数据无表头,默认会把第一行作为表头
# 设置表头,并将序号那一列作为索引列
data4 = pd.read_excel("读取文件.xlsx",header=None,names=['序号','姓名','年龄','电话','地址','日期'],index_col="序号")
print(data4)
# 将修改后的数据写入excel
data4.to_excel("读取文件-新.xlsx")
参考资料:
B站:孙兴华《中文讲Python从入门到办公自动化》