📅  最后修改于: 2023-12-03 15:40:26.028000             🧑  作者: Mango
在使用 pandas
处理数据时,经常需要查看数据集的所有列,以及相关的统计信息、数据类型等信息。本文将介绍如何使用 pandas
查看数据集的所有列的方法和技巧。
pandas
中的 head()
方法可以显示数据集的前若干行,默认为前 5 行。如果想要查看所有列,则需要将 pandas
设置为显示所有列的模式,如下所示:
import pandas as pd
pd.set_option('display.max_columns', None)
df = pd.read_csv('data.csv')
print(df.head())
其中,display.max_columns
参数设置为 None
表示显示所有列。输出的结果如下所示:
column1 column2 column3 column4 column5 column6 column7 column8 column9 column10
0 1 2 3 4 5 6 7 8 9 10
1 11 12 13 14 15 16 17 18 19 20
2 21 22 23 24 25 26 27 28 29 30
3 31 32 33 34 35 36 37 38 39 40
4 41 42 43 44 45 46 47 48 49 50
iloc()
是 pandas
中用于根据位置选择行和列的方法,通过设置 :
来选择所有行和列,如下所示:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.iloc[:, :])
其中,:
表示所有行和列。输出的结果与 head()
方法相同。
info()
方法可以展示数据集的概要信息,包括列名、数据类型、非空值数量等信息,如下所示:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.info())
输出的结果如下所示:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1000 entries, 0 to 999
Data columns (total 10 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 column1 1000 non-null int64
1 column2 1000 non-null int64
2 column3 1000 non-null int64
3 column4 1000 non-null int64
4 column5 1000 non-null int64
5 column6 1000 non-null int64
6 column7 1000 non-null int64
7 column8 1000 non-null int64
8 column9 1000 non-null int64
9 column10 1000 non-null int64
dtypes: int64(10)
memory usage: 78.2 KB
其中,Data columns
行展示了数据集的所有列名,Non-Null Count
行展示了各列的非空值数量,Dtype
行展示了各列的数据类型。
本文介绍了三种查看 pandas
数据集所有列的方法,包括使用 head()
方法、使用 iloc()
方法、使用 info()
方法。使用这些方法可以快速查看数据集的所有列和相关信息。