📅  最后修改于: 2023-12-03 14:51:03.645000             🧑  作者: Mango
在Pandas中,我们可以使用pandas.DataFrame
函数来创建一个数据帧。数据帧是一个二维表结构,由行和列组成。有时,我们可能需要先创建一个空的数据帧,然后再从其他源(如文件、数据库或API)中填充数据。本文将介绍如何在Pandas中创建空的数据帧。
以下是在Pandas中创建空数据帧的基本语法:
import pandas as pd
df = pd.DataFrame(columns=['列1', '列2', '列3'])
创建一个空数据帧,只需要在创建数据帧时不提供任何数据。上述代码中,我们只提供了表头(即列名),而没有提供任何行数据。如果你要在以后的代码中动态地向数据帧中添加数据,那么这是一个不错的做法。
在创建空数据帧时,我们需要指定“列”名称。我们使用columns
选项来指定列。
df = pd.DataFrame(columns=['列1', '列2', '列3'])
我们还可以在创建时指定行的名称(也称为索引)。在这种情况下,我们使用index
选项来指定行索引。
df = pd.DataFrame(columns=['列1', '列2', '列3'], index=['行1', '行2', '行3'])
然而,在本文档中,只考虑创建空数据帧时,我们只需要指定列名即可。
在创建空数据帧时,由于我们没有添加任何数据,因此 Pandas 无法确定每列的数据类型。它会选择使用默认的数据类型 object
。这意味着,如果我们向该数据帧中添加数值数据,则 Pandas 将自动转换该列的数据类型。
以下是创建一个空数据帧的示例代码:
import pandas as pd
df = pd.DataFrame(columns=['姓名', '年龄', '性别'])
print(df)
结果:
Empty DataFrame
Columns: [姓名, 年龄, 性别]
Index: []
我们可以通过df.info()
来查看数据帧信息:
df.info()
结果:
<class 'pandas.core.frame.DataFrame'>
Index: 0 entries
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 姓名 0 non-null object
1 年龄 0 non-null object
2 性别 0 non-null object
dtypes: object(3)
memory usage: 0.0+ bytes
我们可以看到,该数据帧有三列,每列的数据类型为object
。此外,我们还可以看到,该数据帧没有任何行(索引为0)。
在 Pandas 中创建一个空的数据帧是非常常见的操作,尤其是当我们想从其他数据源中加载数据时。要创建一个空的数据帧,我们只需要在创建数据帧时不提供任何数据。我们只需要指定列名称,并且 Pandas 将采用默认数据类型object
。