Python自动化:xlrd读取excel
# pip install xlrd
工作簿、工作表相关操作:
import xlrd
# 打开工作簿
people = xlrd.open_workbook('people1.xls')
#xlrd只能打开.xls格式,不能打开.xlsx格式
# 打开.xlsx格式
# pip install xlrd3
# import xlrd3 as xlrd
# people1 = xlrd.open_workbook('people2.xlsx')
# 选择工作表
sheet = people.sheet_by_index(0) #选择第一个工作表,并将其赋值给sheet
sheet2 = people.sheet_by_name('Sheet1') #选择名为Sheet1 的工作表,并将其赋值给sheet2
sheet3 = people.sheets()[0] #选择第一个工作表,并将其赋值给sheet3
#获取工作簿中工作表的数目
sheets_num = people.nsheets
print(sheets_num)
#获取工作簿中工作表名称列表
sheets_names = people.sheet_names()
print(sheets_names)
#获取工作表中有值单元格的行数
nrows = sheet.nrows
print(nrows) #12
#获取工作表中有值单元格的列数
ncols = sheet.ncols
print(ncols) # 5
行相关操作:
# sheet.row(rowx) #获取由该行中所有的单元格对象组成的列表
print(sheet.row(2)) #打印出第3行所有单元格对象组成的列表
# [number:3.0, text:'c', text:'三', text:'他', xldate:45660.0],日期类型的数据打印出来不对
# sheet.row_values(rowx, start_colx=0, end_colx=None) #返回由该行中所有单元格的数据组成的列表
print(sheet.row_values(10)) #打印出第11行数据组成的列表,后面会有空值,直至最大行值
# [11.0, '', '', '', '']
print(sheet.row_values(2,1,5)) # 打印出第3行从第2列-第5列数据组成的列表
# ['c', '三', '他', 45660.0]
# sheet.row_len(rowx) #返回第 行的有值单元格长度
print(sheet.row_len(6)) #打印出第7行的有值单元格长度, 5
列相关操作:
# sheet.col(colx, start_rowx=0, end_rowx=None ) #获取由该列中所有的单元格对象组成的列表
print(sheet.col(3)) #打印出第4列对象组成的列表,后面会有空值,直至最大列值
# [text:'你', text:'我', text:'他', text:'她', text:'它', empty:'', empty:'', empty:'', empty:'', empty:'', empty:'', empty:'']
print(sheet.col(1,1,5)) #打印出第2列从第2行-第5行对象组成的列表
# [text:'b', text:'c', text:'d', text:'e']
# sheet.col_values(colx, start_rowx=0, end_rowx=None) #获取由该列中所有单元格的数据组成的列表
print(sheet.col_values(2)) #打印出第3列数据组成的列表,后面会有空值,直至最长列值
# ['一', '二', '三', '四', '五', '六', '七', '', '', '', '', '']
print(sheet.col_values(2,3,7)) #打印出第3列从第4行-第7行数据组成的列表
# ['四', '五', '六', '七']
单元格相关操作:
# sheet.cell(rowx,colx) #获取单元格对象
print(sheet.cell(3,2)) #打印出C4(第4行第3列), text:'四'
# sheet.cell_value(rowx,colx) #获取单元格的值
print(sheet.cell_value(1,0)) # 打印出A2值(第2行第1列), 2.0
print(sheet.cell_value(0,4)) #打印出E1值(第1行第4列),45658.0,
# 但并没有返回日期2025/1/1,python中没有与工作簿日期类型对应的数据类型
# xlrd.xldate_as_datetime()
print(xlrd.xldate_as_datetime(sheet.cell_value(0,4),0)) # 2025-01-01 00:00:00
遍历所有数据:
for r in range(sheet.nrows):
for c in range(sheet.ncols):
print(f'第{r+1}行,第{c+1}列的数据是:{sheet.cell_value(r,c)}')
参考资料:
《Python办公自动化》,廖茂文
https://www.cnblogs.com/insane-Mr-Li/p/9092619.html