当我们使用sklearn进行fit或者predict等操作的时候,经常会遇到Expected 2D array, got 1D array instead一类的报错,其根本原因是因为最新的sklearn必须要传入一个二维矩阵所导致的,解决办法有如下三种。

一、numpy将行转成列

一行数据是一维数据,我们转成一列数据自然就是二维数据了。

import numpy as np

x = [1, 2, 3]
x = np.array(x).reshape(1, -1)

二、Pandas取一列数据问题

通常我们使用Pandas取出DataFrame中的一列数据时,也会出现此类报错,其原因是因为一列数据正常取出之后类型为Series,这时我们需要换一种方式进行数据提取:

# 原提取方式示例,为Series
data_train_x = data_train['age']
# 多加一个[]的提取结果为DataFrame
data_train_x = data_train[['age']]

三、Pandas取一个数据问题

当我们进行单个数据提取并操作时,无论使用上述的那种办法都会出现错误,这时我们需要将单独的数据提取后再次转换为DataFrame进行操作即可。

import pandas as pd
# 使用pd.DataFrame进行操作
clf.predict(pd.DataFrame(data[['age']].iloc[2]))
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐