📜  使用Python在 MongoDB 中进行聚合(1)

📅  最后修改于: 2023-12-03 15:22:20.053000             🧑  作者: Mango

使用Python在 MongoDB 中进行聚合

MongoDB 是一款开源的文档数​​据库管理系统,它使用 BSON(二进制JSON)格式存储数据。 它支持各种数据模型,包括关系,层次结构,面向列等。 聚合是一种在MongoDB中执行数据分析的常见方法。 这里我们将介绍如何使用Python在MongoDB中进行聚合。

安装pymongo

首先,我们需要安装 MongoDB 的 Python 驱动程序 pymongo。您可以使用以下命令进行安装:

pip install pymongo
连接到 MongoDB

接下来,我们需要连接到MongoDB。 您可以使用以下代码来连接MongoDB:

import pymongo

client = pymongo.MongoClient("mongodb://localhost:27017/")
db = client["mydatabase"]

这个代码片段连接到本地 MongoDB 实例,端口号是27017,并且选择mydatabase数据库。

进行聚合查询

一旦您连接到MongoDB,您可以使用以下代码从集合中检索数据并执行聚合操作:

pipeline = [
    { "$match": { "status": "A" } },
    { "$group": { "_id": "$cust_id", "total": { "$sum": "$amount" } } }
]

result = db.mycol.aggregate(pipeline)

for res in result:
    print(res)

在这个代码片段中,我们定义了一个pipeline变量,它包含两个操作符,一个是筛选操作符,另一个是聚合操作符。 pipeline变量将与MongoDB中的mycol集合一起使用,匹配状态”A”的文档,并计算每个客户的总金额。

结论

聚合是MongoDB中的一种十分有用的工具,能够帮助我们处理有用的信息。使用pymongo Python驱动程序,我们可以很容易地在MongoDB中执行聚合操作。