📜  查看所有列 pandas - Python (1)

📅  最后修改于: 2023-12-03 15:40:26.028000             🧑  作者: Mango

查看所有列 pandas - Python

概述

在使用 pandas 处理数据时,经常需要查看数据集的所有列,以及相关的统计信息、数据类型等信息。本文将介绍如何使用 pandas 查看数据集的所有列的方法和技巧。

查看所有列
1. 使用 head()

pandas 中的 head() 方法可以显示数据集的前若干行,默认为前 5 行。如果想要查看所有列,则需要将 pandas 设置为显示所有列的模式,如下所示:

import pandas as pd

pd.set_option('display.max_columns', None)

df = pd.read_csv('data.csv')
print(df.head())

其中,display.max_columns 参数设置为 None 表示显示所有列。输出的结果如下所示:

   column1  column2  column3  column4  column5  column6  column7  column8  column9  column10
0        1        2        3        4        5        6        7        8        9        10
1       11       12       13       14       15       16       17       18       19        20
2       21       22       23       24       25       26       27       28       29        30
3       31       32       33       34       35       36       37       38       39        40
4       41       42       43       44       45       46       47       48       49        50
2. 使用 iloc()

iloc()pandas 中用于根据位置选择行和列的方法,通过设置 : 来选择所有行和列,如下所示:

import pandas as pd

df = pd.read_csv('data.csv')
print(df.iloc[:, :])

其中,: 表示所有行和列。输出的结果与 head() 方法相同。

3. 使用 info()

info() 方法可以展示数据集的概要信息,包括列名、数据类型、非空值数量等信息,如下所示:

import pandas as pd

df = pd.read_csv('data.csv')
print(df.info())

输出的结果如下所示:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1000 entries, 0 to 999
Data columns (total 10 columns):
 #   Column    Non-Null Count  Dtype  
---  ------    --------------  -----  
 0   column1   1000 non-null   int64  
 1   column2   1000 non-null   int64  
 2   column3   1000 non-null   int64  
 3   column4   1000 non-null   int64  
 4   column5   1000 non-null   int64  
 5   column6   1000 non-null   int64  
 6   column7   1000 non-null   int64  
 7   column8   1000 non-null   int64  
 8   column9   1000 non-null   int64  
 9   column10  1000 non-null   int64  
dtypes: int64(10)
memory usage: 78.2 KB

其中,Data columns 行展示了数据集的所有列名,Non-Null Count 行展示了各列的非空值数量,Dtype 行展示了各列的数据类型。

总结

本文介绍了三种查看 pandas 数据集所有列的方法,包括使用 head() 方法、使用 iloc() 方法、使用 info() 方法。使用这些方法可以快速查看数据集的所有列和相关信息。