📜  在 pandas 数据帧上运行 sql 查询 - Python (1)

📅  最后修改于: 2023-12-03 15:23:14.809000             🧑  作者: Mango

在 Pandas 数据帧上运行 SQL 查询 - Python

Pandas 是一个强大的 Python 数据分析库,它可以让我们在 Python 中轻松地处理数据。但是,有些时候我们需要在 Pandas 数据帧上运行 SQL 查询,以便更好地处理数据。

在 Python 中,我们可以使用 pandasql 模块来在 Pandas 数据帧上运行 SQL 查询。在本文中,我们将向您展示如何使用 pandasql 模块并在 Pandas 数据帧上运行 SQL 查询。

首先,我们需要使用 pip 安装 pandasql 模块:

pip install pandasql

接下来,我们将使用以下代码读取 CSV 文件,并将其存储为 Pandas 数据帧:

import pandas as pd

data = pd.read_csv('data.csv')
df = pd.DataFrame(data)

我们现在可以使用 pandasql 模块来在 Pandas 数据帧上运行 SQL 查询。例如,如果我们想选择 data 数据帧中 age 大于等于 30 的所有行:

from pandasql import sqldf

query = "SELECT * FROM df WHERE age >= 30"
result_df = sqldf(query)

我们可以使用 result_df 来访问 SQL 查询的结果。这个结果也将作为一个 Pandas 数据帧返回。

这是一个完整的例子,展示了如何在 Pandas 数据帧上运行 SQL 查询:

import pandas as pd
from pandasql import sqldf

# 读取 CSV 文件作为 Pandas 数据帧
data = pd.read_csv('data.csv')
df = pd.DataFrame(data)

# 在 Pandas 数据帧上运行 SQL 查询
query = "SELECT * FROM df WHERE age >= 30"
result_df = sqldf(query)

# 打印查询结果
print(result_df)