📅  最后修改于: 2023-12-03 14:52:23.063000             🧑  作者: Mango
在 Jupyter Notebook 中,我们通常会使用 Pandas 来处理数据集。但是当我们加载大型数据集时,Pandas 会默认显示前几行和最后几行的数据。如果想要查看整个数据集怎么办呢?下面将介绍几种方法。
首先,我们可以使用 Pandas 中的 DataFrame.head() 和 DataFrame.tail() 方法来查看前几行和最后几行的数据。这两个方法默认显示前 5 行和后 5 行数据。如果想要显示更多行,可以将方法的参数设置为所需的行数。
例如,要查看一个名为 df 的 DataFrame 的前 10 行和后 10 行数据,可以按如下方式操作:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.head(10)) # 显示前 10 行数据
print(df.tail(10)) # 显示后 10 行数据
第二种方法是将 DataFrame 转换为 HTML 表格,然后在 Jupyter Notebook 中显示。这种方法可以显示整个数据集,但是需要注意,如果数据集非常大,转换为 HTML 表格的过程会很慢,甚至会导致浏览器卡死。
要将 DataFrame 转换为 HTML 表格,可以使用 DataFrame.to_html() 方法。例如:
import pandas as pd
df = pd.read_csv('data.csv')
html_table = df.to_html() # 将 DataFrame 转换为 HTML 表格
print(html_table) # 在 Jupyter Notebook 中显示 HTML 表格
第三种方法使用 DataFrame.style。这种方法可以将 DataFrame 格式化为带样式的 HTML 表格,并在 Jupyter Notebook 中显示。相比方法二,这种方法更加灵活,可以设置样式和格式,更加美观。
例如,可以使用以下代码将 DataFrame 转换为带样式的 HTML 表格并在 Jupyter Notebook 中显示:
import pandas as pd
df = pd.read_csv('data.csv')
style = df.style.set_table_styles([{
'selector': 'th',
'props': [('background-color', '#409EFF'), ('color', '#fff')] # 表头样式
}, {
'selector': 'tr:hover',
'props': [('background-color', '#f5f5f5')] # 鼠标悬停样式
}])
html_table = style.render()
display_html(html_table, raw=True) # 在 Jupyter Notebook 中显示 HTML 表格
以上就是在 Jupyter Notebook 中查看整个数据集的方法。根据实际情况选择适合自己的方法。