📅  最后修改于: 2023-12-03 14:46:31.178000             🧑  作者: Mango
.loc 是 Pandas 用于选择行和列的功能之一,它是通过标签来选择的。
这个功能在数据分析中非常有用,可以帮助你快速地访问和操作 DataFrame 中的数据。
本文将教你如何使用 Pandas 中的 .loc 属性,以及如何在实际项目中应用它。
.loc 属性可以通过标签或布尔值选择 Pandas DataFrame 中的行和列。
使用 .loc 可以轻松访问 DataFrame 中的行数据。以下是一个简单的例子:
import pandas as pd
df = pd.read_csv('data.csv', index_col='id')
# 获取 id 为 1 的行
row = df.loc[1]
print(row)
输出:
name Mike
age 29
gender M
score 83
Name: 1, dtype: object
我们可以通过访问列名,使用 .loc 访问 Dataframe 中的特定列。以下是一个例子:
import pandas as pd
df = pd.read_csv('data.csv', index_col='id')
# 获取名为 name 的列
col = df.loc[:, 'name']
print(col)
输出:
id
1 Mike
2 Jane
3 Billy
4 Justin
5 Chris
Name: name, dtype: object
在 .loc 中同时使用行和列可以选择特定的数据。
import pandas as pd
df = pd.read_csv('data.csv', index_col='id')
# 获取 id 为 1 的行和 score 列
data = df.loc[1, 'score']
print(data)
输出:
83
使用切片操作可以选择 DataFrame 中的多行和列。以下是一个例子:
import pandas as pd
df = pd.read_csv('data.csv', index_col='id')
# 获取 id 为 1 至 3 的行和 name 列至 score 列
data = df.loc[1:3, 'name':'score']
print(data)
输出:
name age gender score
id
1 Mike 29 M 83
2 Jane 33 F 90
3 Billy 26 M 70
我们可以使用布尔运算符选择 DataFrame 中符合条件的行和列。
import pandas as pd
df = pd.read_csv('data.csv', index_col='id')
# 获取 age 大于 30 的行
data = df.loc[df['age'] > 30]
print(data)
输出:
name age gender score
id
2 Jane 33 F 90
5 Chris 31 M 88
.loc 功能在日常使用中非常常用,它可以帮助我们快速地访问和操作数据。
在以下场景中很有用:
在本文中,我们介绍了 Pandas 中的 .loc 属性,在数据分析中使用它非常有帮助。希望这篇文章对你有用,谢谢阅读!