📌  相关文章
📜  在 Pandas 中创建空数据框(1)

📅  最后修改于: 2023-12-03 14:51:03.645000             🧑  作者: Mango

在 Pandas 中创建空数据框

在Pandas中,我们可以使用pandas.DataFrame函数来创建一个数据帧。数据帧是一个二维表结构,由行和列组成。有时,我们可能需要先创建一个空的数据帧,然后再从其他源(如文件、数据库或API)中填充数据。本文将介绍如何在Pandas中创建空的数据帧。

语法

以下是在Pandas中创建空数据帧的基本语法:

import pandas as pd

df = pd.DataFrame(columns=['列1', '列2', '列3'])

创建一个空数据帧,只需要在创建数据帧时不提供任何数据。上述代码中,我们只提供了表头(即列名),而没有提供任何行数据。如果你要在以后的代码中动态地向数据帧中添加数据,那么这是一个不错的做法。

参数说明

在创建空数据帧时,我们需要指定“列”名称。我们使用columns选项来指定列。

df = pd.DataFrame(columns=['列1', '列2', '列3'])

我们还可以在创建时指定行的名称(也称为索引)。在这种情况下,我们使用index选项来指定行索引。

df = pd.DataFrame(columns=['列1', '列2', '列3'], index=['行1', '行2', '行3'])

然而,在本文档中,只考虑创建空数据帧时,我们只需要指定列名即可。

数据类型

在创建空数据帧时,由于我们没有添加任何数据,因此 Pandas 无法确定每列的数据类型。它会选择使用默认的数据类型 object。这意味着,如果我们向该数据帧中添加数值数据,则 Pandas 将自动转换该列的数据类型。

示例

以下是创建一个空数据帧的示例代码:

import pandas as pd

df = pd.DataFrame(columns=['姓名', '年龄', '性别'])
print(df)

结果:

Empty DataFrame
Columns: [姓名, 年龄, 性别]
Index: []

我们可以通过df.info()来查看数据帧信息:

df.info()

结果:

<class 'pandas.core.frame.DataFrame'>
Index: 0 entries
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   姓名     0 non-null      object
 1   年龄     0 non-null      object
 2   性别     0 non-null      object
dtypes: object(3)
memory usage: 0.0+ bytes

我们可以看到,该数据帧有三列,每列的数据类型为object。此外,我们还可以看到,该数据帧没有任何行(索引为0)。

总结

在 Pandas 中创建一个空的数据帧是非常常见的操作,尤其是当我们想从其他数据源中加载数据时。要创建一个空的数据帧,我们只需要在创建数据帧时不提供任何数据。我们只需要指定列名称,并且 Pandas 将采用默认数据类型object