📅  最后修改于: 2023-12-03 15:11:10.311000             🧑  作者: Mango
熊猫(Pandas)是一种流行的Python数据分析库,它提供了广泛且简便的方法来处理和操作数据。下面介绍几个熊猫系列函数:
DataFrame
是熊猫系列函数的核心。它是一个二维,大小可变,可以包含异类数据的标签表格。您可以把它看作是Excel或SQL表的-equivalent。一些常用的函数包括:
使用pd.read_xxx()
函数,可以读取多种不同格式的文件。例如:
df = pd.read_csv('file.csv')
使用head()
和tail()
函数,可以分别查看前几行和后几行的数据,有助于了解数据的构成。
df.head()
df.tail()
使用[]
或.loc[]
函数,可以选择行或列。
df['column']
df.loc[row_indexer, column_indexer]
使用[]
或.loc[]
函数,可以修改数据中的值。
df['column'] = new_value
df.loc[row_indexer, column_indexer] = new_value
使用describe()
函数,可以对数据进行基本的统计分析。
df.describe()
Series
是熊猫系列函数的另一主要类型,它是一维带标签的数组,可以看作是字典类型的-equivalent。一些常用的函数包括:
使用[]
或.loc[]
函数,可以选择数据。
s['label']
s.loc[label]
使用[]
或.loc[]
函数,可以修改数据中的值。
s['label'] = new_value
s.loc[label] = new_value
使用describe()
函数,可以对数据进行基本的统计分析。
s.describe()
以上是熊猫系列函数中一些常用的函数,它们使数据处理变得非常便捷。