📅  最后修改于: 2023-12-03 15:41:15.024000             🧑  作者: Mango
在数据科学和分析中,常常需要对数据进行预处理,熟练掌握 Pandas 库中 DataFrame 的数据操作是必不可少的。在 Python 中使用 Pandas 库,可以通过 data.head()
方法预览数据集的前几行,从而快速了解数据的结构和特征。
data.head()
方法head()
方法是 DataFrame 类中的一个方法,通过该方法可以返回该 DataFrame 的前几行。默认情况下,它返回前五行,但是可以通过传递一个数字来指定要返回的行数。
import pandas as pd
# 读取csv文件
data = pd.read_csv('data.csv')
# 预览数据集的前5行
data.head()
输出结果类似于:
id name age gender height weight class
0 1 John 20 Male 180 70 1
1 2 Jane 19 Female 165 55 1
2 3 Eric 22 Male 175 65 1
3 4 Washington 21 Male 185 75 2
4 5 Olivia 21 Female 170 60 2
data.head()
方法还有几个可选的参数,详见下表:
| 参数 | 含义 | 默认值 |
| --- | --- | --- |
| n
| 返回的行数 | 5
|
| columns
| 选中的列 | None
|
| dtype
| 数据类型 | None
|
n
参数n
参数控制返回的行数。例如,要返回前十行,可以使用如下代码:
import pandas as pd
# 读取csv文件
data = pd.read_csv('data.csv')
# 预览数据集的前10行
data.head(10)
输出结果类似于:
id name age gender height weight class
0 1 John 20 Male 180 70 1
1 2 Jane 19 Female 165 55 1
2 3 Eric 22 Male 175 65 1
3 4 Washington 21 Male 185 75 2
4 5 Olivia 21 Female 170 60 2
5 6 Andrew 20 Male 172 62 2
6 7 Rachel 19 Female 168 57 2
7 8 Michael 22 Male 177 70 2
8 9 Christopher 21 Male 182 75 3
9 10 Paul 21 Male 183 73 3
columns
参数columns
参数用于选中特定的列。例如,只选择 name
和 age
两列,可以使用如下代码:
import pandas as pd
# 读取csv文件
data = pd.read_csv('data.csv')
# 仅展示name和age两列
data.head(columns=['name', 'age'])
输出结果类似于:
name age
0 John 20
1 Jane 19
2 Eric 22
3 Washington 21
4 Olivia 21
dtype
参数dtype
参数用于指定返回数据的类型。例如,如果想返回字符串类型的数据,可以使用如下代码:
import pandas as pd
# 读取csv文件
data = pd.read_csv('data.csv')
# 以字符串类型预览数据集的前5行
data.head(dtype=str)
输出结果类似于:
id name age gender height weight class
0 1 John 20 Male 180 70 1
1 2 Jane 19 Female 165 55 1
2 3 Eric 22 Male 175 65 1
3 4 Washington 21 Male 185 75 2
4 5 Olivia 21 Female 170 60 2
以上就是关于终端上的 data.head()
方法的介绍和使用方法,希望可以帮助到你在数据的预览方面获得更多的便利。