📅  最后修改于: 2023-12-03 15:25:03.473000             🧑  作者: Mango
在Python的Pandas库中,我们经常需要对数据进行索引。其中包括使用字符串索引数据帧,即使用字符标签作为数据帧的行标签或列标签。本文将介绍如何使用字符串索引数据帧的索引。
首先,我们需要创建一个数据帧来进行演示。下面的代码将创建一个5行4列的数据帧。
import pandas as pd
data = {'name': ['Tom', 'Jack', 'Steve', 'Ricky', 'Mary'],
'age': [28, 34, 29, 42, 46],
'country': ['US', 'UK', 'US', 'UK', 'US'],
'score': [80, 87, 81, 79, 92]}
df = pd.DataFrame(data)
print(df)
这将输出以下数据帧:
| | name | age | country | score | |---:|:-------|------:|:----------|--------:| | 0 | Tom | 28 | US | 80 | | 1 | Jack | 34 | UK | 87 | | 2 | Steve | 29 | US | 81 | | 3 | Ricky | 42 | UK | 79 | | 4 | Mary | 46 | US | 92 |
我们可以使用 loc
属性来通过行索引(即标签)来访问数据帧中的行。例如,要访问行标签为2的行,我们可以执行以下操作:
row = df.loc[2]
print(row)
这将输出以下数据:
name Steve
age 29
country US
score 81
Name: 2, dtype: object
要访问多行,我们可以使用切片。
rows = df.loc[1:3]
print(rows)
这将输出以下数据帧:
| | name | age | country | score | |---:|:-------|------:|:----------|--------:| | 1 | Jack | 34 | UK | 87 | | 2 | Steve | 29 | US | 81 | | 3 | Ricky | 42 | UK | 79 |
我们可以使用列索引(即标签)来访问数据帧中的列。例如,要访问“国家”列,我们可以执行以下操作:
column = df['country']
print(column)
这将输出以下数据:
0 US
1 UK
2 US
3 UK
4 US
Name: country, dtype: object
要访问多列,我们可以使用以下方式:
columns = df[['name', 'country']]
print(columns)
这将输出以下数据帧:
| | name | country | |---:|:-------|:----------| | 0 | Tom | US | | 1 | Jack | UK | | 2 | Steve | US | | 3 | Ricky | UK | | 4 | Mary | US |
我们可以使用 loc
属性同时访问行和列。例如,要访问第3行的“国家”列,我们可以执行以下操作:
value = df.loc[2, 'country']
print(value)
这将输出以下数据:
US
要访问多行和多列,我们可以使用以下方式:
values = df.loc[[1, 3], ['name', 'score']]
print(values)
这将输出以下数据帧:
| | name | score | |---:|:-------|--------:| | 1 | Jack | 87 | | 3 | Ricky | 79 |
以上就是使用字符串索引数据帧的索引的介绍。如您在使用过程中遇到问题,可以参考Pandas文档进行进一步学习。