📜  Pandas DataFrame.iterrows()(1)

📅  最后修改于: 2023-12-03 15:18:13.654000             🧑  作者: Mango

Pandas DataFrame.iterrows()介绍

iterrows()是Pandas DataFrame对象中的一种迭代器方法,它返回一个包含每行索引和该行数据的元组。这个方法常用于对DataFrame进行遍历和数据处理。

语法
for index, row in dataframe.iterrows():
    # Code to process row data

其中,dataframe是要遍历的DataFrame对象,index是当前行索引,row是当前行数据。

示例
import pandas as pd

# 创建DataFrame对象
data = {'name': ['John', 'Mary', 'Peter', 'Bob'], 'age': [28, 25, 36, 42], 'gender': ['M', 'F', 'M', 'M']}
df = pd.DataFrame(data)

# 遍历DataFrame对象
for index, row in df.iterrows():
    print(index, row['name'], row['age'], row['gender'])

输出结果:

0 John 28 M
1 Mary 25 F
2 Peter 36 M
3 Bob 42 M
优点

使用iterrows()方法遍历DataFrame对象具有以下优点:

  • 可以按行遍历数据,方便处理每行数据;
  • 返回一个元组,包括该行的索引和数据,方便对每行数据进行分析;
  • 可以进行数据清洗、特征工程等预处理操作。
注意事项

使用iterrows()方法时需要注意以下事项:

  • 如果存在大量数据,使用这个方法会缓慢且消耗大量内存;
  • 由于是Python for循环,不能利用Pandas自带的矢量运算和聚合操作,通常会导致速度比较慢。
总结

iterrows()方法是Pandas DataFrame对象中用于遍历每行数据的迭代器方法。它非常适用于数据清洗、分析等操作,但在大量数据时需要小心处理。