📅  最后修改于: 2023-12-03 15:09:05.846000             🧑  作者: Mango
在实际工作中,经常会遇到需要将 Excel 文件中的数据导入到 MongoDB Collections 中的情况。下面就给大家介绍一种简单有效的方法。
在开始实际操作之前,需要先安装一些必要的工具。
从官网下载 MongoDB 的安装包,安装完成后,将其加入系统环境变量中。
从官网下载 Python3,安装完成后,将其加入系统环境变量中。
打开终端或者命令行界面,输入以下命令:
pip install pymongo pandas xlrd
其中,pymongo 是 Python 操作 MongoDB 的库,pandas 是数据分析库,xlrd 是第三方库,用于读取 Excel 文件。
首先,定义 MongoDB 存储的数据库名称和集合名称,并连接 MongoDB:
import pymongo
# 数据库名称
mydb = "mydatabase"
# 集合名称
mycol = "customers"
# 连接数据库
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient[mydb]
mycol = mydb[mycol]
然后,读取 Excel 文件,将其转换为字典,再将字典插入到 MongoDB 中:
import pandas as pd
# 文件路径
path = "file.xlsx"
# 读取 Excel 文件
df = pd.read_excel(path)
# 将数据转换为字典格式
records = df.to_dict("records")
# 插入到 MongoDB 中
mycol.insert_many(records)
在终端或者命令行界面中,切换到 Python 脚本所在的目录下,并输入以下命令:
python script.py
其中,script.py 是 Python 脚本的文件名。
以上就是将 Excel 文件导入 MongoDB Collections 的全部步骤,希望对大家有所帮助。