📅  最后修改于: 2023-12-03 14:49:16.295000             🧑  作者: Mango
在使用 pandas 进行数据分析时,经常需要从 DataFrame 中选择一些特定的列来分析或展示。本文将介绍如何在 pandas 中仅选择对象列。
在 pandas 中,有很多不同的数据类型,比如整型、浮点型、布尔型等。其中,对象列指的是存储字符串、日期等非数值数据类型的列。通常情况下,我们需要使用不同的方法来处理对象列和数值列。
要选择对象列,可以使用 select_dtypes() 方法。该方法可以根据数据类型来选择 DataFrame 中的列。代码片段如下:
# 导入 pandas 库
import pandas as pd
# 创建 DataFrame
data = {
'name': ['John', 'Mary', 'Peter', 'David'],
'age': [25, 28, 22, 30],
'gender': ['Male', 'Female', 'Male', 'Male'],
'city': ['New York', 'Paris', 'Tokyo', 'London']
}
df = pd.DataFrame(data)
# 选择对象列
object_columns = df.select_dtypes(include=['object']).columns
print(object_columns)
输出结果如下:
Index(['name', 'gender', 'city'], dtype='object')
代码解释:
首先,我们创建了一个包含 name、age、gender 和 city 四列的 DataFrame。然后,我们使用 select_dtypes() 方法,将 include 参数设置为['object'],即只选择对象类型的列。最后,使用 .columns 获取选择的列的名称,并将结果存储在 object_columns 变量中。
选择对象列是 pandas 数据分析中的一个常见操作。通过使用 select_dtypes() 方法,我们可以轻松地选择 DataFrame 中的对象列。