📅  最后修改于: 2023-12-03 15:36:19.875000             🧑  作者: Mango
Pandas 是基于 Numpy 构建的数据分析工具包,提供了一个名为 DataFrame 的数据结构,DataFrame 是一个二维表格型的数据结构,每列可以是不同的数据类型。
在进行数据处理操作时,经常需要通过列索引来获取/操作某一列的数据,本文将介绍如何从给定 Pandas DataFrame 的列名中获取列索引。
Pandas 的 DataFrame 提供了 get_loc 方法,它用于获取指定列名所在的列索引。
import pandas as pd
# 创建一个示例 DataFrame
df = pd.DataFrame({
"name": ["Alice", "Bob", "Charlie"],
"age": [25, 30, 35],
"gender": ["F", "M", "M"]
})
# 获取 "age" 列所在的列索引
age_index = df.columns.get_loc("age")
print(age_index)
输出结果为:1,表示 "age" 列所在的列索引为 1。
另一种获取列索引的方法是使用 index 方法,它返回指定列名所在的位置列表,可以使用列表的索引获取列索引。
import pandas as pd
# 创建一个示例 DataFrame
df = pd.DataFrame({
"name": ["Alice", "Bob", "Charlie"],
"age": [25, 30, 35],
"gender": ["F", "M", "M"]
})
# 获取 "age" 列所在的列索引
age_index = df.columns.get_loc("age")
print(age_index)
输出结果为:1,表示 "age" 列所在的列索引为 1。
本文介绍了两种从给定 Pandas DataFrame 的列名中获取列索引的方法,首先可以使用 DataFrame 的 get_loc 方法,其次可以使用 index 方法。在实际使用中,可以根据具体情况选择合适的方法。