📅  最后修改于: 2023-12-03 14:46:13.070000             🧑  作者: Mango
在数据科学和机器学习中,我们经常需要从外部源读取数据和创建新的数据框。在 Pandas 中,我们可以使用 pandas.DataFrame()
函数来创建一个新的数据框。
以下是如何创建具有特定列的新熊猫数据框的步骤:
在 Python 中,我们首先需要导入所需的库。以下是导入 Pandas 库的语句,我们将它命名为 pd
。
import pandas as pd
接下来,我们需要创建一些数据,以便在我们的新熊猫数据框中使用。以下是一个简单的示例列表:
my_data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eric'],
'Age': [25, 32, 18, 47, 29],
'City': ['New York', 'Paris', 'London', 'Tokyo', 'Sydney']
}
我们现在有了我们的数据,我们可以使用 pandas.DataFrame()
函数来创建一个新的数据框。以下是一个示例代码,该代码将使用上述数据创建一个新的数据框:
df = pd.DataFrame(my_data)
上述代码将数据存储在一个名为 df
的新数据框中。该数据框包含具有“Name”、“Age”和“City”列的五行数据。
为了验证我们的数据框已经成功创建,我们可以使用 head()
函数来查看前几行数据。以下是该函数对我们的数据框运行的输出结果示例:
df.head()
| | Name | Age | City | |---:|:--------|-----:|:--------| | 0 | Alice | 25 | New York | | 1 | Bob | 32 | Paris | | 2 | Charlie | 18 | London | | 3 | David | 47 | Tokyo | | 4 | Eric | 29 | Sydney |
我们已经成功地创建了一个新的 Pandas 数据框,并通过列的名称和数据填充来定义了该数据框。这为我们提供了一个方便的方式,用于快速创建和操纵我们的数据。