📅  最后修改于: 2023-12-03 15:37:25.535000             🧑  作者: Mango
Pandas 是 Python 中流行的数据处理和分析库。它通过使用 DataFrame 对象来处理数据,在数据科学社区非常受欢迎。DataFrame 是一个表格型的数据结构,具有行和列的标签。
在本文中,我们将讨论如何在 Pandas 中创建一个 DataFrame。
Pandas 的 DataFrame 可以通过传入一个由 Python 字典对象组成的字典来创建。字典的键将是 DataFrame 的列名,字典的值将是列中的数据。
下面是一个简单的例子,我们使用 Python 字典创建一个 DataFrame:
import pandas as pd
data = {'名字': ['小明', '小红', '小刚', '小李'],
'年龄': [20, 18, 19, 21],
'性别': ['男', '女', '男', '女']}
df = pd.DataFrame(data)
print(df)
输出结果:
| | 名字 | 年龄 | 性别 | |----|-----|------|------| | 0 | 小明 | 20 | 男 | | 1 | 小红 | 18 | 女 | | 2 | 小刚 | 19 | 男 | | 3 | 小李 | 21 | 女 |
我们也可以通过列表列表来创建 DataFrame,每个列表表示一列数据。
下面是一个简单的例子,我们使用列表列表创建一个 DataFrame:
import pandas as pd
data = [['小明', 20, '男'], ['小红', 18, '女'], ['小刚', 19, '男'], ['小李', 21, '女']]
df = pd.DataFrame(data, columns=['名字', '年龄', '性别'])
print(df)
输出结果:
| | 名字 | 年龄 | 性别 | |----|-----|------|------| | 0 | 小明 | 20 | 男 | | 1 | 小红 | 18 | 女 | | 2 | 小刚 | 19 | 男 | | 3 | 小李 | 21 | 女 |
除了通过 Python 字典和列表来创建 DataFrame,我们还可以通过读取 CSV 文件来创建 DataFrame。Pandas 提供了 read_csv() 函数用来读取 CSV 文件。
下面是一个简单的例子,我们从 CSV 文件中创建一个 DataFrame:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
其中 data.csv 文件的内容如下:
名字,年龄,性别
小明,20,男
小红,18,女
小刚,19,男
小李,21,女
输出结果:
| | 名字 | 年龄 | 性别 | |----|-----|------|------| | 0 | 小明 | 20 | 男 | | 1 | 小红 | 18 | 女 | | 2 | 小刚 | 19 | 男 | | 3 | 小李 | 21 | 女 |
在 Pandas 中创建 DataFrame 很简单。我们可以使用 Python 字典、列表和读取 CSV 文件来创建 DataFrame。掌握创建 DataFrame 是数据科学的入门基础,也是我们进一步进行数据分析的重要前置技能。