📅  最后修改于: 2023-12-03 15:08:44.045000             🧑  作者: Mango
Pandas 是一个常用的数据处理库,它可以读取各种格式的数据,并且提供了强大的数据操作和分析工具。在本文中,我们将介绍如何在 Pandas 中读取和显示 csv 文件。
Pandas 提供了 read_csv
函数,可以读取 csv 文件并返回一个 DataFrame 对象。以下是一个基本的使用示例:
import pandas as pd
data = pd.read_csv('data.csv')
print(data.head())
read_csv
函数默认会将第一行作为列名,可以通过 header=None
参数关闭这个功能。如果 csv 文件中有缺失值,可以通过 na_values
参数指定它们的表示方式。
import pandas as pd
data = pd.read_csv('data.csv', header=None, na_values=['N/A'])
print(data.head())
Pandas 的 DataFrame 对象提供了多种方式来展示数据。以下是一些常用的方法:
head()
:显示 DataFrame 的前几行,默认是前 5 行。tail()
:显示 DataFrame 的后几行,默认是后 5 行。sample()
:从 DataFrame 中随机抽取几行作为样本。describe()
:对 DataFrame 中的每一个数值列进行基本的统计描述,如最大值、最小值、平均值等。info()
:显示 DataFrame 的列名、列的数据类型以及缺失值的数量等信息。以下是一个展示 csv 数据的示例:
import pandas as pd
data = pd.read_csv('data.csv')
print(data.head()) # 显示前 5 行数据
print(data.describe()) # 显示数值列的统计描述
Pandas 的 DataFrame 对象支持多种修改方式,包括:
at
、iat
或者 loc
、iloc
方法直接修改 DataFrame 中指定位置的数值。assign
方法添加新的列。drop
方法删除指定的列。以下是一个修改 csv 数据的示例:
import pandas as pd
data = pd.read_csv('data.csv')
data.at[0, 'Name'] = 'Alice' # 修改第 1 行 'Name' 列的值为 'Alice'
data = data.assign(Male=data['Sex'] == 'Male') # 添加一个新的 'Male' 列
data = data.drop('Sex', axis=1) # 删除原来的 'Sex' 列
print(data.head())
本文介绍了如何在 Pandas 中读取和显示 csv 文件,并对如何修改 csv 数据进行了简单的介绍。读者可以通过进一步学习 Pandas 来掌握更多高级的数据操作和分析技巧。