📜  终端上的 data.head - Python (1)

📅  最后修改于: 2023-12-03 15:41:15.024000             🧑  作者: Mango

终端上的 data.head - Python

在数据科学和分析中,常常需要对数据进行预处理,熟练掌握 Pandas 库中 DataFrame 的数据操作是必不可少的。在 Python 中使用 Pandas 库,可以通过 data.head() 方法预览数据集的前几行,从而快速了解数据的结构和特征。

data.head() 方法

head() 方法是 DataFrame 类中的一个方法,通过该方法可以返回该 DataFrame 的前几行。默认情况下,它返回前五行,但是可以通过传递一个数字来指定要返回的行数。

import pandas as pd

# 读取csv文件
data = pd.read_csv('data.csv')

# 预览数据集的前5行
data.head()

输出结果类似于:

   id        name  age  gender  height  weight  class
0   1        John   20    Male     180      70      1
1   2        Jane   19  Female     165      55      1
2   3        Eric   22    Male     175      65      1
3   4  Washington   21    Male     185      75      2
4   5      Olivia   21  Female     170      60      2
参数介绍

data.head() 方法还有几个可选的参数,详见下表:

| 参数 | 含义 | 默认值 | | --- | --- | --- | | n | 返回的行数 | 5 | | columns | 选中的列 | None | | dtype | 数据类型 | None |

n 参数

n 参数控制返回的行数。例如,要返回前十行,可以使用如下代码:

import pandas as pd

# 读取csv文件
data = pd.read_csv('data.csv')

# 预览数据集的前10行
data.head(10)

输出结果类似于:

   id         name  age  gender  height  weight  class
0   1         John   20    Male     180      70      1
1   2         Jane   19  Female     165      55      1
2   3         Eric   22    Male     175      65      1
3   4   Washington   21    Male     185      75      2
4   5       Olivia   21  Female     170      60      2
5   6       Andrew   20    Male     172      62      2
6   7       Rachel   19  Female     168      57      2
7   8      Michael   22    Male     177      70      2
8   9  Christopher   21    Male     182      75      3
9  10         Paul   21    Male     183      73      3
columns 参数

columns 参数用于选中特定的列。例如,只选择 nameage 两列,可以使用如下代码:

import pandas as pd

# 读取csv文件
data = pd.read_csv('data.csv')

# 仅展示name和age两列
data.head(columns=['name', 'age'])

输出结果类似于:

         name  age
0        John   20
1        Jane   19
2        Eric   22
3  Washington   21
4      Olivia   21
dtype 参数

dtype 参数用于指定返回数据的类型。例如,如果想返回字符串类型的数据,可以使用如下代码:

import pandas as pd

# 读取csv文件
data = pd.read_csv('data.csv')

# 以字符串类型预览数据集的前5行
data.head(dtype=str)

输出结果类似于:

  id        name age  gender height weight class
0  1        John  20    Male    180     70     1
1  2        Jane  19  Female    165     55     1
2  3        Eric  22    Male    175     65     1
3  4  Washington  21    Male    185     75     2
4  5      Olivia  21  Female    170     60     2

以上就是关于终端上的 data.head() 方法的介绍和使用方法,希望可以帮助到你在数据的预览方面获得更多的便利。