一、官网参数

        pandas官网参数网址:pandas.read_excel — pandas 1.5.2 documentation

如下所示:

 二、常用参数详解

1、io

        一般指读取文件的路径。【必须指定】

import pandas as pd

df = pd.read_excel(r"C:\Users\wwb\Desktop\data3.xlsx")

print(df)

 2、sheet_name

        因为一个excel文件有多个sheet,所以可以通过此参数,指定读取哪个sheet。【默认读取第一个sheet】

 读取sheet1:

import pandas as pd

df = pd.read_excel(r"C:\Users\wwb\Desktop\data3.xlsx",sheet_name='Sheet1')

print(df)

 

  读取sheet2:

import pandas as pd

df = pd.read_excel(r"C:\Users\wwb\Desktop\data3.xlsx",sheet_name='Sheet2')

print(df)

3、header(表头)

 表头即列名,默认第0行数据为表头。【从0开始计数】,以下为excel示意表头。

同read_csv函数参数,不再赘述,附read_csv函数参数的连接:详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客

4、names(列名)

 用于原始数据无表头,又想设置列名的情况。如下数据,直接读取,默认0、1、2为列名:

 同read_csv函数参数,不再赘述,附read_csv函数参数的连接:详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客

5、dtype(数据类型)

  指定字段数据类型。例如:

  同read_csv函数参数,不再赘述,附read_csv函数参数的连接:详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客

6、engine(引擎)

        指定解析数据时使用的引擎。支持的引擎包括:“xlrd”, “openpyxl”, “odf”, “pyxlsb”。各个引擎的区别在于:

  • xlrd支持旧式的Excel文件,如xls文件。pandas1.2.0发生变化,xlrd引擎现在只支持解析xls文件。
  • openpyxl支持较新的Excel文件格式。
  • odf支持OpenDocument文件格式如odf,ods,odt。
  • pyxlsb支持二进制Excel文件。

此参数默认为None,pandas会自动判断数据格式进行引擎的使用。

(1)如果数据格式为  xls  文件格式,可选引擎  xlrd、openpyxl;

(2)如果数据格式为  xlsx  文件格式,可选引擎  openpyxl;

【如果碰到特别老的xls文件,当openpyxl不可用时,需要选择xlrd引擎】

其他引擎同理,多数情况用不上。

7、skiprows(跳过指定行)

        对于前N行数据不想要读进内存,可以指定此参数跳过。

 同read_csv函数参数,不再赘述,附read_csv函数参数的连接:详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客

以上就是最常用的pandas读取数据文件参数信息。

公众号内有更多干货分享哦~~

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐