详解pandas的read_excel函数

Python伊甸园

6694人浏览 · 2023-01-18 16:30:23

Python伊甸园 · 2023-01-18 16:30:23 发布

一、官网参数

pandas官网参数网址：pandas.read_excel — pandas 1.5.2 documentation

如下所示：

二、常用参数详解

1、io

一般指读取文件的路径。【必须指定】

import pandas as pd

df = pd.read_excel(r"C:\Users\wwb\Desktop\data3.xlsx")

print(df)

2、sheet_name

因为一个excel文件有多个sheet，所以可以通过此参数，指定读取哪个sheet。【默认读取第一个sheet】

读取sheet1:

import pandas as pd

df = pd.read_excel(r"C:\Users\wwb\Desktop\data3.xlsx",sheet_name='Sheet1')

print(df)

读取sheet2:

import pandas as pd

df = pd.read_excel(r"C:\Users\wwb\Desktop\data3.xlsx",sheet_name='Sheet2')

print(df)

3、header(表头)

表头即列名，默认第0行数据为表头。【从0开始计数】，以下为excel示意表头。

同read_csv函数参数，不再赘述，附read_csv函数参数的连接：详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客

4、names(列名)

用于原始数据无表头，又想设置列名的情况。如下数据，直接读取，默认0、1、2为列名：

同read_csv函数参数，不再赘述，附read_csv函数参数的连接：详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客

5、dtype(数据类型)

指定字段数据类型。例如：

同read_csv函数参数，不再赘述，附read_csv函数参数的连接：详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客

6、engine(引擎)

指定解析数据时使用的引擎。支持的引擎包括：“xlrd”, “openpyxl”, “odf”, “pyxlsb”。各个引擎的区别在于：

xlrd支持旧式的Excel文件，如xls文件。pandas1.2.0发生变化，xlrd引擎现在只支持解析xls文件。
openpyxl支持较新的Excel文件格式。
odf支持OpenDocument文件格式如odf，ods，odt。
pyxlsb支持二进制Excel文件。

此参数默认为None，pandas会自动判断数据格式进行引擎的使用。

（1）如果数据格式为 xls 文件格式，可选引擎 xlrd、openpyxl；

（2）如果数据格式为 xlsx 文件格式，可选引擎 openpyxl；

【如果碰到特别老的xls文件，当openpyxl不可用时，需要选择xlrd引擎】

其他引擎同理，多数情况用不上。

7、skiprows(跳过指定行)

对于前N行数据不想要读进内存，可以指定此参数跳过。

同read_csv函数参数，不再赘述，附read_csv函数参数的连接：详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客

以上就是最常用的pandas读取数据文件参数信息。

公众号内有更多干货分享哦~~

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m