📜  如何遍历 pandas 数据框 - Python (1)

📅  最后修改于: 2023-12-03 15:09:17.398000             🧑  作者: Mango

如何遍历 pandas 数据框 - Python

在使用 pandas 进行数据分析时,经常需要遍历 DataFrame 中的数据进行操作,本文将介绍如何使用 Python 遍历 pandas Dataframe。

遍历行

使用 for 循环遍历 DataFrame 中的行:

import pandas as pd

df = pd.read_csv('data.csv')

for index, row in df.iterrows():
    print(index, row['column_name'])

其中,index 表示行号,row 为每一行的数据,可以通过 row['column_name'] 获取该行指定列的值。

遍历列

使用 for 循环遍历 DataFrame 中的列:

import pandas as pd

df = pd.read_csv('data.csv')

for column in df.columns:
    print(column)

df.columns 返回一个包含所有列名的列表,使用 for 循环遍历即可。

遍历元素

使用 for 循环遍历 DataFrame 中的元素:

import pandas as pd

df = pd.read_csv('data.csv')

for index, row in df.iterrows():
    for column in df.columns:
        print(row[column])

其中,index 和 row 遍历每一行,column 遍历每一列,row[column] 获取该元素的值。

使用 apply 遍历

使用 apply 方法可以更加灵活地对 DataFrame 进行遍历和操作,apply 方法接受一个函数作为参数,对 DataFrame 的每一行或列进行操作。

import pandas as pd

df = pd.read_csv('data.csv')

def func(row):
    return row['column_name1'] + row['column_name2']

df['new_column'] = df.apply(func, axis=1)

其中,axis=1 表示对每一行进行操作,函数 func 表示将每一行的 column_name1 和 column_name2 相加并返回。

以上就是使用 Python 遍历 pandas DataFrame 的方法,希望可以帮助到大家。