(pd.read_excel) Pandas读取Excel文件的六种方法使用Pandas读取Excel文件的6种常见方法全网首发(图文详解1)

使用Pandas读取Excel文件是数据分析中的常见需求。Pandas提供了read_excel()函数来读取Excel文件，这里概述六种常见的使用方法及其实现步骤。

最基本的方法是直接读取Excel文件中的默认第一个工作表。

import pandas as pd

# 替换为你的Excel文件路径
file_path = 'your_file_path.xlsx'
df = pd.read_excel(file_path)
print(df)

如果Excel文件包含多个工作表，你可以通过sheet_name参数来指定具体的工作表。

# 通过工作表名称读取
df_sheet_name = pd.read_excel(file_path, sheet_name='Sheet1')
# 通过工作表索引读取，索引从0开始
df_sheet_index = pd.read_excel(file_path, sheet_name=0)

如果只想读取某些列，可以使用usecols参数。

# 通过列名读取
df_cols_name = pd.read_excel(file_path, usecols=['A', 'C'])
# 通过列索引读取
df_cols_index = pd.read_excel(file_path, usecols=[0, 2])

如果你的数据文件中有一些标题或空行，可以使用skiprows参数跳过。

# 跳过前3行
df_skip_rows = pd.read_excel(file_path, skiprows=3)

如果你只对文件中的前几行感兴趣，可以使用nrows参数。

# 只读取前5行
df_nrows = pd.read_excel(file_path, nrows=5)

处理Excel文件时，不可避免会遇到空值。Pandas允许通过na_values参数自定义空值的表示。

# 将'NA'和'-'识别为NaN
df_na_values = pd.read_excel(file_path, na_values=['NA', '-'])

要在Python中使用pd.read_excel()，需要安装pandas和openpyxl或xlrd库。此外，对于’.xlsx’格式的文件，推荐使用openpyxl；而对于老式的’.xls’格式，使用xlrd。

pip install pandas openpyxl xlrd