📜  如何在 jupyternotebook 中查看整个数据集 - Python (1)

📅  最后修改于: 2023-12-03 14:52:23.063000             🧑  作者: Mango

如何在 Jupyter Notebook 中查看整个数据集

在 Jupyter Notebook 中,我们通常会使用 Pandas 来处理数据集。但是当我们加载大型数据集时,Pandas 会默认显示前几行和最后几行的数据。如果想要查看整个数据集怎么办呢?下面将介绍几种方法。

方法一:使用 DataFrame.head() 和 DataFrame.tail()

首先,我们可以使用 Pandas 中的 DataFrame.head() 和 DataFrame.tail() 方法来查看前几行和最后几行的数据。这两个方法默认显示前 5 行和后 5 行数据。如果想要显示更多行,可以将方法的参数设置为所需的行数。

例如,要查看一个名为 df 的 DataFrame 的前 10 行和后 10 行数据,可以按如下方式操作:

import pandas as pd

df = pd.read_csv('data.csv')
print(df.head(10))  # 显示前 10 行数据
print(df.tail(10))  # 显示后 10 行数据
方法二:使用 DataFrame.to_html()

第二种方法是将 DataFrame 转换为 HTML 表格,然后在 Jupyter Notebook 中显示。这种方法可以显示整个数据集,但是需要注意,如果数据集非常大,转换为 HTML 表格的过程会很慢,甚至会导致浏览器卡死。

要将 DataFrame 转换为 HTML 表格,可以使用 DataFrame.to_html() 方法。例如:

import pandas as pd

df = pd.read_csv('data.csv')
html_table = df.to_html()  # 将 DataFrame 转换为 HTML 表格
print(html_table)  # 在 Jupyter Notebook 中显示 HTML 表格
方法三:使用 DataFrame.style

第三种方法使用 DataFrame.style。这种方法可以将 DataFrame 格式化为带样式的 HTML 表格,并在 Jupyter Notebook 中显示。相比方法二,这种方法更加灵活,可以设置样式和格式,更加美观。

例如,可以使用以下代码将 DataFrame 转换为带样式的 HTML 表格并在 Jupyter Notebook 中显示:

import pandas as pd

df = pd.read_csv('data.csv')
style = df.style.set_table_styles([{
    'selector': 'th',
    'props': [('background-color', '#409EFF'), ('color', '#fff')]  # 表头样式
}, {
    'selector': 'tr:hover',
    'props': [('background-color', '#f5f5f5')]  # 鼠标悬停样式
}])
html_table = style.render()
display_html(html_table, raw=True)  # 在 Jupyter Notebook 中显示 HTML 表格

以上就是在 Jupyter Notebook 中查看整个数据集的方法。根据实际情况选择适合自己的方法。