📅  最后修改于: 2023-12-03 15:15:53.669000             🧑  作者: Mango
iterrows()是pandas中一种用于遍历DataFrame中每行的函数。其中,每行数据被表示为一个Series类型,可以通过对该Series进行操作来进行进一步的处理。
for index, row in df.iterrows():
# 操作
df为一个DataFrame,index为当前行的索引,row为当前行的数据。在循环中,可以通过row[column_name]来访问某一列的数据,column_name为需要访问的列名。
import pandas as pd
# 创建DataFrame
data = {'name': ['Bob', 'Jim', 'Tom'],
'age': [21, 25, 19],
'gender': ['M', 'M', 'M']}
df = pd.DataFrame(data)
# 遍历每一行数据
for index, row in df.iterrows():
print(row['name'], row['age'], row['gender'])
输出:
Bob 21 M
Jim 25 M
Tom 19 M
由于iterrows()是一个迭代器,因此它并不是快速的。如果要处理大型数据集,建议使用pandas中的向量化操作,而不是基于iterrows()的循环操作。