📜  在 Jupyter Notebook 中显示 Pandas DataFrame 的所有列

📅  最后修改于: 2022-05-13 01:55:04.359000             🧑  作者: Mango

在 Jupyter Notebook 中显示 Pandas DataFrame 的所有列

在本文中,我们将讨论如何在 jupyter notebook 中显示 pandas 数据框的所有列。

Pandas 有一个非常方便的方法,叫做 get option(),通过这个方法,我们可以自定义输出屏幕并工作,没有任何不方便的输出形式。 set_option()用于设置值。这用于设置应显示的最大列数和行数,通过将 max_columns 设置为 None 或指定的列数

句法:

示例 1:

Python3
# importing pandas
import pandas as pd
 
# reading csv
df = pd.read_csv('data.csv')
 
# set the max columns to none
pd.set_option('display.max_columns', None)


Python3
#import pandas
import pandas as pd
 
# read csv
df = pd.read_csv('data.csv')
 
# set max_colwidth to 3000
pd.set_option('display.max_colwidth', 3000)


Python3
# importing pandas
import pandas as pd
df = pd.read_csv('data.csv')
 
# printing dataframe
print(df)


Python3
# importing pandas
import pandas as pd
 
# reading the csv
df = pd.read_csv('data.csv')
 
# get option to get maximum columns displayed
pd.get_option("display.max_columns")
 
# to get the number of columns
len(df.columns)


Python3
# importing pandas
import pandas as pd
 
# reading the csv
df = pd.read_csv('data.csv')
 
# set max columns to none
pd.set_option("display.max_columns", None)
 
# set colwidth hidher
pd.set_option('display.max_colwidth', 100)


输出:

如果我们想恢复正常,则使用 reset_option()。它用于将一个或多个选项重置为其默认值。

输出:

示例 2:

使用分类数据时出现的另一个常见问题是,我们看不到整个分类值。因为最大列宽更小,所以显示覆盖列宽的数据。不显示休息

在上面的示例中,您可以看到数据显示不够。为了解决这个问题,我们可以将 max_colwidth 设置得更高。

Python3

#import pandas
import pandas as pd
 
# read csv
df = pd.read_csv('data.csv')
 
# set max_colwidth to 3000
pd.set_option('display.max_colwidth', 3000)

输出:

通过应用函数,最大列宽设置为 3000。显示所有数据。

示例 3:

当我们使用具有更多列或行的数据集时,我们可能会发现很难查看 pandas 中的所有列和行。 pandas 默认打印一些第一行和一些最后一行。在中间,它将省略数据。当我们处理具有较少行和列的数据集时不会影响我们。但是如果不一次性查看所有行和列,就很难分析数据。

Python3

# importing pandas
import pandas as pd
df = pd.read_csv('data.csv')
 
# printing dataframe
print(df)

输出:

我们可以看到它并没有打印所有列,而是被替换为 (.....)。

它帮助我们显示诸如显示的最大列数、显示的最大行数和最大列宽等值。

让我们看看如何使用它们,

Python3

# importing pandas
import pandas as pd
 
# reading the csv
df = pd.read_csv('data.csv')
 
# get option to get maximum columns displayed
pd.get_option("display.max_columns")
 
# to get the number of columns
len(df.columns)

存在的总列数是 25,显示的最大列数是 20。所以它显示了前 10 列和后 10 列,我们看不到其余的列。我们可以通过最大化列和列的宽度来解决这个问题。

Python3

# importing pandas
import pandas as pd
 
# reading the csv
df = pd.read_csv('data.csv')
 
# set max columns to none
pd.set_option("display.max_columns", None)
 
# set colwidth hidher
pd.set_option('display.max_colwidth', 100)

输出:

现在,我们可以看到通过将列宽更改为 100 并将列数更改为 None 来显示所有列。