📜  返回表示给定查询结果的 DataFrame - Python (1)

📅  最后修改于: 2023-12-03 15:28:19.435000             🧑  作者: Mango

返回表示给定查询结果的 DataFrame - Python

在Python中,使用pandas库可以轻松地处理数据,其中包括查询数据并返回结果DataFrame的操作。本文介绍如何使用pandas库中的函数来实现这一目的。

准备工作

首先需要安装pandas库,可以通过pip命令进行安装:

pip install pandas

在导入pandas库之前,需要先导入numpy和pandas库:

import numpy as np
import pandas as pd
基本查询操作

假设我们有以下数据:

| Name | Age | Gender | City | |---------------|-----|--------|-----------| | John Smith | 23 | Male | New York | | Jane Doe | 25 | Female | San Diego | | Bob Johnson | 32 | Male | Miami | | Mary Johnson | 28 | Female | Miami |

我们可以将其转换为DataFrame类型:

data = {'Name': ['John Smith', 'Jane Doe', 'Bob Johnson', 'Mary Johnson'],
        'Age': [23, 25, 32, 28],
        'Gender': ['Male', 'Female', 'Male', 'Female'],
        'City': ['New York', 'San Diego', 'Miami', 'Miami']}
df = pd.DataFrame(data)

现在我们可以对其进行查询操作。例如,我们想查询所有年龄大于等于30岁的人:

result = df[df['Age'] >= 30]

此时result的值为:

| Name | Age | Gender | City | |--------------|-----|--------|-------| | Bob Johnson | 32 | Male | Miami | | Mary Johnson | 28 | Female | Miami |

复杂查询操作

除了基本的查询操作,我们还可以进行更加复杂的查询。假设我们有以下数据:

| Name | Age | Gender | City | Income | |------------------|-----|--------|-----------|--------| | John Smith | 23 | Male | New York | 50000 | | Jane Doe | 25 | Female | San Diego | 60000 | | Bob Johnson | 32 | Male | Miami | 70000 | | Mary Johnson | 28 | Female | Miami | 65000 | | Michael Williams | 35 | Male | New York | 75000 |

我们可以将其转换为DataFrame类型:

data = {'Name': ['John Smith', 'Jane Doe', 'Bob Johnson', 'Mary Johnson', 'Michael Williams'],
        'Age': [23, 25, 32, 28, 35],
        'Gender': ['Male', 'Female', 'Male', 'Female', 'Male'],
        'City': ['New York', 'San Diego', 'Miami', 'Miami', 'New York'],
        'Income': [50000, 60000, 70000, 65000, 75000]}
df = pd.DataFrame(data)

现在我们可以对其进行更加复杂的查询操作。例如,我们想查询所有居住在New York的男性的收入:

result = df[(df['City'] == 'New York') & (df['Gender'] == 'Male')]['Income']

此时result的值为:

0    50000
4    75000
Name: Income, dtype: int64
结论

使用pandas库可以轻松地处理数据,包括查询数据并返回结果DataFrame的操作。通过本文的介绍,您应该对如何使用pandas库来实现这一操作有了更清晰的认识。