pandas 迭代行 - Python (1)

📌 相关文章

📜 pandas 迭代行 - Python (1)

📅 最后修改于: 2023-12-03 14:45:04.991000 🧑 作者: Mango

Pandas 是一个功能强大的数据处理库，提供了许多方便的方法来处理和分析数据。在处理数据时，有时我们需要迭代数据框中的每一行以执行特定操作。本文将介绍如何使用 Pandas 迭代行。

我们首先需要创建一个示例的数据框，用于演示如何迭代行。下面是一个包含两列（"姓名"和"年龄"）的示例数据框：

import pandas as pd

data = {'姓名': ['小明', '小红', '小李'],
        '年龄': [20, 25, 30]}

df = pd.DataFrame(data)

要迭代数据框的每一行，我们可以使用 Pandas 中的 iterrows() 方法。该方法返回一个迭代器，该迭代器可用于访问数据框的每一行。

for index, row in df.iterrows():
    print(row['姓名'], row['年龄'])

在上面的代码中，我们使用 iterrows() 方法迭代数据框的每一行。iterrows() 方法返回的是一个包含索引和行数据的元组。我们使用 row['姓名'] 和 row['年龄'] 来访问行数据中的具体值。

在迭代数据框的每一行时，我们可以执行各种操作。例如，我们可以根据行数据进行计算、筛选或更新。

for index, row in df.iterrows():
    if row['年龄'] > 25:
        df.at[index, '年龄'] = row['年龄'] + 1

在上面的代码中，我们检查每一行的"年龄"值是否大于 25。如果是，我们使用 .at[] 方法更新相应的行的"年龄"值加一。

在使用迭代行时，需要注意一些性能问题。迭代数据框的每一行可能会比较慢，尤其是对于大型数据框。如果可能的话，应该尽量使用 Pandas 的内置方法来处理数据，以提高性能。

此外，记住迭代行返回的数据是副本，对副本所做的更改不会影响原始数据框。如果需要对原始数据框进行修改，请使用操作符.（即 df.at[]）来进行更新。

通过使用 Pandas 的 iterrows() 方法，我们可以轻松地迭代数据框的每一行。这使得我们可以方便地对行数据执行特定操作或查询，提高了数据处理的灵活性和效率。

请注意，在处理大型数据集时，应优先考虑使用 Pandas 的内置方法来处理数据，以提高性能。