📜  创建一个Pandas DataFrame(1)

📅  最后修改于: 2023-12-03 14:50:14.717000             🧑  作者: Mango

创建一个 Pandas DataFrame

Pandas DataFrame 是 Pandas 库中的一个十分重要的数据结构。DataFrame 可以被看作是一种类似于关系型数据库表格的数据结构,它可以用来存储和操作各种类型的数据。

在本文中,我们将向您介绍如何创建 Pandas DataFrame。

1. 从列表中创建 DataFrame

您可以通过传递一个列表来创建一个 Pandas DataFrame。下面是一个简单的例子:

import pandas as pd

data = [['Alice', 25], ['Bob', 30], ['Charlie', 35], ['Dave', 40]]

df = pd.DataFrame(data, columns=['Name', 'Age'])

print(df)

输出如下:

       Name  Age
0     Alice   25
1       Bob   30
2   Charlie   35
3      Dave   40

在上面的代码中,我们首先导入了 Pandas 库,然后创建了一个包含姓名和年龄的列表 data。然后我们使用了 pd.DataFrame() 方法来将数据转换为 DataFrame。该方法传递了两个参数:data和columns。其中,data 用于定义 DataFrame 中的数据,columns 用于定义每一列的名称。最后,通过打印 DataFrame 来展示结果。

2. 从字典中创建 DataFrame

除了列表,您还可以使用字典来创建 DataFrame。下面是一个例子:

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'Dave'], 'Age': [25, 30, 35, 40]}

df = pd.DataFrame(data)

print(df)

输出如下:

      Name  Age
0    Alice   25
1      Bob   30
2  Charlie   35
3     Dave   40

在上面的例子中,我们首先定义了一个包含姓名和年龄的字典 data,然后使用 pd.DataFrame() 方法将其转换为 DataFrame。该方法只传递了一个参数:字典 data。Pandas 会将字典的键作为 DataFrame 中的列名,并将字典的值作为 DataFrame 中的数据。最后,我们通过打印 DataFrame 来展示结果。

3. 从 CSV 文件中创建 DataFrame

除了直接创建,您还可以从文件中读取数据并创建 DataFrame。下面是一个从 CSV 文件中读取数据并创建 DataFrame 的例子:

import pandas as pd

df = pd.read_csv('data.csv')

print(df)

在上述代码中,我们首先导入 Pandas 库,然后使用 pd.read_csv() 方法读取名为 data.csv 的 CSV 文件。该方法会返回一个包含 CSV 文件所有数据的 DataFrame。最后,我们通过打印 DataFrame 来展示结果。

4. 追加数据到 DataFrame 中

您可以使用 append() 方法来向 DataFrame 中追加新的数据。下面是一个例子:

import pandas as pd

data = [['Alice', 25], ['Bob', 30]]
df = pd.DataFrame(data, columns=['Name', 'Age'])

new_data = {'Name': 'Charlie', 'Age': 35}
df = df.append(new_data, ignore_index=True)

print(df)

输出如下:

      Name  Age
0    Alice   25
1      Bob   30
2  Charlie   35

在上面的例子中,我们使用 append() 方法向一个已有 DataFrame 中追加新数据。具体来说,我们首先创建了一个包含两行数据的 DataFrame。然后,我们定义了一个新数据 new_data,并使用 append() 方法将其追加到 DataFrame 中。注意,我们需要使用 ignore_index=True 来自动为新数据分配一个新的行索引。最后,我们通过打印 DataFrame 来展示结果。

总结

在本文中,我们向您介绍了向 Pandas DataFrame 中添加数据的四种方法:使用列表、使用字典、读取文件和追加数据。这些技巧对于处理和操作数据非常重要,特别是在数据分析和机器学习领域。