📅  最后修改于: 2023-12-03 15:23:14.809000             🧑  作者: Mango
Pandas 是一个强大的 Python 数据分析库,它可以让我们在 Python 中轻松地处理数据。但是,有些时候我们需要在 Pandas 数据帧上运行 SQL 查询,以便更好地处理数据。
在 Python 中,我们可以使用 pandasql
模块来在 Pandas 数据帧上运行 SQL 查询。在本文中,我们将向您展示如何使用 pandasql
模块并在 Pandas 数据帧上运行 SQL 查询。
首先,我们需要使用 pip
安装 pandasql
模块:
pip install pandasql
接下来,我们将使用以下代码读取 CSV 文件,并将其存储为 Pandas 数据帧:
import pandas as pd
data = pd.read_csv('data.csv')
df = pd.DataFrame(data)
我们现在可以使用 pandasql
模块来在 Pandas 数据帧上运行 SQL 查询。例如,如果我们想选择 data
数据帧中 age
大于等于 30 的所有行:
from pandasql import sqldf
query = "SELECT * FROM df WHERE age >= 30"
result_df = sqldf(query)
我们可以使用 result_df
来访问 SQL 查询的结果。这个结果也将作为一个 Pandas 数据帧返回。
这是一个完整的例子,展示了如何在 Pandas 数据帧上运行 SQL 查询:
import pandas as pd
from pandasql import sqldf
# 读取 CSV 文件作为 Pandas 数据帧
data = pd.read_csv('data.csv')
df = pd.DataFrame(data)
# 在 Pandas 数据帧上运行 SQL 查询
query = "SELECT * FROM df WHERE age >= 30"
result_df = sqldf(query)
# 打印查询结果
print(result_df)