📌  相关文章
📜  创建 Pandas 数据框的不同方法(1)

📅  最后修改于: 2023-12-03 15:22:40.112000             🧑  作者: Mango

创建 Pandas 数据框的不同方法

Pandas 是 Python 中数值计算库,尤其擅长处理表格数据。其中最常用的数据结构是数据框(DataFrame),它们类似于 Excel 表格,可以由行和列组成。在 Pandas 中,有多种方法可以创建 Pandas 数据框:

1. 从列表或 Numpy 数组创建

使用 pd.DataFrame() 函数可以从 Python 的列表或 Numpy 数组中创建 Pandas 数据框。下面是一个示例:

import pandas as pd
import numpy as np

data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
df = pd.DataFrame(data, columns=['a', 'b', 'c'])
print(df)

上述代码将创建一个 3 行 3 列的数据框,每个元素都是数字。这里设置了列名称,这样代码会输出如下结果:

    a  b  c
0   1  2  3
1   4  5  6
2   7  8  9
2. 从字典创建

使用一个字典也可以创建 Pandas 数据框。基本上,字典的每个键将成为列名称,每个值将成为列的数据。下面是一个示例:

data = {'a': [1, 4, 7], 'b': [2, 5, 8], 'c': [3, 6, 9]}
df = pd.DataFrame(data)
print(df)

这里创建的数据框与前一个示例相同:

    a  b  c
0   1  2  3
1   4  5  6
2   7  8  9
3. 从 CSV 文件创建

CSV 是一种常见的数据格式,例如 Excel 可以将表格数据另存为 CSV 文件。我们可以使用 Pandas 的 pd.read_csv() 函数从 CSV 文件创建数据框。下面是一个示例:

df = pd.read_csv('data.csv')
print(df)

这里假设 data.csv 文件位于当前目录中,输出结果将与 CSV 文件的内容相同。

4. 从 SQL 数据库创建

Pandas 也支持从 SQL 数据库中读取数据。我们可以使用 Pandas 的 pd.read_sql() 函数从 SQL 数据库中读取数据。下面是一个示例:

import sqlite3
conn = sqlite3.connect('example.db')
df = pd.read_sql('SELECT * FROM data', conn)
print(df)

这里假设我们有一个 SQLite 数据库文件 example.db,其中有一个名为 data 的表格。此代码将从该表格中读取数据并输出。

5. 从 Excel 文件创建

与 CSV 文件类似,我们可以使用 Pandas 的 pd.read_excel() 函数从 Excel 文件中读取数据。下面是一个示例:

df = pd.read_excel('data.xlsx')
print(df)

这里假设 data.xlsx 文件位于当前目录中,输出结果将与 Excel 文件的内容相同。

6. 从其它数据源创建

Pandas 支持从其它数据源创建数据框,例如 HDF5、JSON、HTML 等等。可以参考 Pandas 官方文档来了解更多相关信息。

以上就是 Pandas 中创建数据框的不同方法。无论你的数据来自哪里,Pandas 都提供了非常便捷的方法来处理数据。