python选取特定列——pandas的iloc和loc以及icol使用（列切片及行切片）

Lenskit

243200人浏览 · 2017-03-14 19:14:19

Lenskit · 2017-03-14 19:14:19 发布

假设df是一个dataframe，列名为A B C D
具体如下：

A    B    C    D

0    ss   小红  8
1    aa   小明  d
4    f         f
6    ak   小紫  7

dataframe里的属性不是指定的，空值默认为NA。
一、选取标签为A和C的列，并且选完的对象类型还是dataframe

df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]

二、选取标签为C并且只取前两行，并且选完的对象类型还是dataframe

df = df.loc[0:2, ['A', 'C']]
df = df.iloc[0:2, [0, 2]]

聪明的朋友已经看出iloc和loc的不同了：loc是根据dataframe的具体标签选取列，而iloc是根据标签所在的位置，从0开始计数。"，
"前面的"："表示选取整列，第二个示例中的的0:2表示选取第0行到第二行，这里的0:2相当于[0,2）前闭后开，2是不在范围之内的。

需要注意的是，如果是

df = df.loc[0:2, ['A', 'C']]

或者

df = df.loc[0:2, ['A', 'C']]

，切片之后类型依旧是dataframe，不能直接进行加减乘除等操作的。
比如dataframe的一列是数学成绩(shuxue)，另一列为语文成绩(yuwen)，现在需要求两门课程的总和，可以使用

df['shuxue'] + df['yuwen'] # 选取完之后类型为series

来获得总分，而不能使用

df.iloc[:,[2]]+df.iloc[:,[1]]

或

df.iloc[:,['shuxue']]+df.iloc[:,['yuwen']]

，这会产生错误结果。

还有一种方式是使用df.icol(i)来选取列，选取完的也不是dataframe而是series，i为该列所在的位置，从0开始计数。

如果你想要选取某一行的数据，可以使用df.loc[[i]]或者df.iloc[[i]]。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

如何用【rust】做一个命令行版的电子辞典

在语言学习中，「高频复习 + 个性化积累」是掌握单词的核心方法，但市面上多数单词 APP 存在广告冗余、功能繁杂、依赖网络等问题。本项目基于 Rust 标准库开发一款零依赖本地单词本，无需网络、无广告干扰、数据完全自主掌控，支持单词的增删查改、分类标签、复习测试等核心功能，兼顾实用性与学习价值。

AtomGit开源社区

Rust 命令行密码管理器工具开发

AtomGit开源社区

AI 浪潮终章奏凯！GitCode & 文心大模型 & 智源研究院 AI 应用开发大赛圆满落幕

AtomGit开源社区

所有评论(0)

查看更多评论

Lenskit

@chenKFKevin

已为社区贡献4条内容