python之导入数据集
·
csv文件
- 导入numpy和pandas库
#导入numpy和pandas库
import numpy as np
import pandas as pd
- 从本地文件中载入数据
2.1.相对路径
#载入数据
#1.相对路径
df = pd.read_csv('train.csv')
【提示】相对路径载入报错时,尝试使用os.getcwd()查看当前工作目录。
2.2.绝对路径
#2.绝对路径
#在|前多加一个\;使用engine='python'打开路径中含有中文的文件
df = pd.read_csv('E:\\python_pycharm _file\\数据分析\\study in datawhale\\train.csv', engine='python')
#文件路径前加上 r,取消\的特殊性;使用open函数打开路径中含有中文的文件
df = pd.read_csv(open(r'E:\python_pycharm _file\数据分析\study in datawhale\train.csv'))
2.3 报错:OSError: Initializing from file failed
df = pd.read_csv('E:\\python_pycharm _file\\数据分析\\study in datawhale\\train.csv')
解决方案:如2.2
错误原因:python3中, 调用pandas的read_csv()方法时,默认使用C engine作为parser engine,而当文件名中含有中文的时候,用C engine在部分情况下就会出错。所以在调用read_csv()方法时指定engine为python就可以解决问题了。或者不使用中文名。
参考:https://blog.csdn.net/qq_35318838/article/details/80564938
小结:
1.在文件路径使用 \:在 \ 前多加一个\ ;或者 在文件路径前加上 r
2.使用open函数打开路径中含有中文的文件;或者 使用engine=‘python’。
更多推荐
已为社区贡献1条内容
所有评论(0)