📅  最后修改于: 2023-12-03 15:28:28.407000             🧑  作者: Mango
Pandas 是一个开源、易于使用的数据分析工具,它可以方便地处理不同类型和大小的数据。在 Pandas 中,可以使用不同的方式遍历 DataFrame 中的行和列,本文将介绍一些常用的方法。
使用 for 循环遍历列是比较基础和常见的方法,代码如下:
import pandas as pd
df = pd.read_csv('file.csv')
for col in df:
print(col)
其中,df
是读取的 DataFrame 对象,col
代表每一列的名字。
另外一种方式是使用 DataFrame.columns 属性获取每一列的名字,如下所示:
import pandas as pd
df = pd.read_csv('file.csv')
for col in df.columns:
print(col)
使用 for 循环遍历行比较简单,只需要循环 DataFrame 中的行索引即可,代码如下:
import pandas as pd
df = pd.read_csv('file.csv')
for index in df.index:
print(df.loc[index])
其中,index
代表 DataFrame 中每一行的索引,df.loc[index]
可以获取到每一行的数据。
另外一种方式是使用 iterrows() 方法,它可以将 DataFrame 中的每一行转化为元组并返回,方法如下:
import pandas as pd
df = pd.read_csv('file.csv')
for index, row in df.iterrows():
print(index, row)
其中,index
代表行索引,row
代表行数据,可以通过 row['column']
获取指定列的值。
如果需要同时遍历行和列,则可以使用 df.iterrows() 加上 for 循环嵌套的方式,示例如下:
import pandas as pd
df = pd.read_csv('file.csv')
for index, row in df.iterrows():
for col in df.columns:
print(index, col, row[col])
其中,index
代表行索引,col
代表列名,row[col]
可以获取每个元素的值。
以上就是遍历 Pandas DataFrame 中的行和列的介绍,根据实际需求选择合适的方式遍历即可。