📅  最后修改于: 2023-12-03 15:24:55.371000             🧑  作者: Mango
在 Pandas 中,数据通常以表格形式存储,每列都是一个 Series 对象。在这篇文章中,我们将探讨如何在 Pandas 中访问列。
我们可以使用以下代码创建一个 DataFrame:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eric'],
'age': [25, 32, 18, 47, 33],
'country': ['US', 'Canada', 'UK', 'US', 'Australia']}
df = pd.DataFrame(data)
这将创建以下 DataFrame:
name age country
0 Alice 25 US
1 Bob 32 Canada
2 Charlie 18 UK
3 David 47 US
4 Eric 33 Australia
我们可以通过列名访问列。例如,要访问“name”列,我们可以使用以下代码:
name_column = df['name']
print(name_column)
这将输出以下内容:
0 Alice
1 Bob
2 Charlie
3 David
4 Eric
Name: name, dtype: object
如果我们想访问多个列,可以传递一个列名称列表:
columns = ['name', 'age']
subset = df[columns]
print(subset)
这将输出以下内容:
name age
0 Alice 25
1 Bob 32
2 Charlie 18
3 David 47
4 Eric 33
与行索引类似,Pandas 还提供了访问列索引的方法。我们可以使用 iloc 调用按位置访问列,或者使用 loc 按标签访问列。以下是具体的示例代码:
按位置访问列:
age_column = df.iloc[:, 1]
print(age_column)
这将输出以下内容:
0 25
1 32
2 18
3 47
4 33
Name: age, dtype: int64
按标签访问列:
country_column = df.loc[:, 'country']
print(country_column)
这将输出以下内容:
0 US
1 Canada
2 UK
3 US
4 Australia
Name: country, dtype: object
访问 Pandas DataFrame 的列相当简单。我们只需要使用列名或索引即可访问单个或多个列。如果您正在学习 Pandas,请务必掌握这些技巧。