使用 Google 表单和 Pandas 收集数据
在本文中,我们将讨论如何使用 Pandas 从 Google 表单中收集数据。
需要的模块
- pydrive:用于简化许多常见的 Google Drive API 任务。要安装此类型,请在终端中输入以下命令。
pip install pydrive
- xlrd:此模块用于从电子表格中提取数据。要安装此类型,请在终端中输入以下命令。
pip install xlrd
- openpyxl :这是一个用于读写 Excel 的Python库。要安装此类型,请在终端中输入以下命令。
pip install openpyxl
入门
整个过程的第一个重要部分是创建一个谷歌表单。访问此链接并创建一个新表单。
data:image/s3,"s3://crabby-images/d64f1/d64f1e578bcea0696d04f981d849cbb01db0b0d4" alt=""
在 Google 表单中创建表单
当我们完成问题设置后,单击发送按钮发布表单。要访问此 Google 表单,请单击此处。
下一步是向 Google 验证我们的Python脚本和本地环境,并通过在 Google Cloud Platform 中启用 Google Drive API 来访问来自 Google Drive 的 Google 表单数据。按着这些次序:
- 转到 Google 表单
- 响应选项卡,
- 单击电子表格图标
- 并为我们的谷歌表单创建一个新的目的地电子表格。
data:image/s3,"s3://crabby-images/32dc2/32dc20b6997f4951b33cc4baf9a2da3697453506" alt=""
关联新电子表格和 Google 表单
此电子表格将被创建并存储在 Google 云端硬盘中。我们必须集成 Google Drive 和Python环境。首先,我们必须通过 Google 进行身份验证。
验证 Google Drive API
现在,要使用 Google Drive API,我们必须设置我们的帐户,启用 Google Drive API 并获取我们的client_secrets.json密钥。
1. 转到 Google Cloud Platform Console,单击 GCP 工具栏上的新建项目 / 项目 → 新建项目。
data:image/s3,"s3://crabby-images/66219/66219faf042553e0ba6b997c2bcec42b55460738" alt=""
单击项目名称,然后选择新建项目
2. 为我们的项目输入一个名称,然后单击创建。
data:image/s3,"s3://crabby-images/1e024/1e0244577f2d27796fc1ba93ef9826a2fb371af8" alt=""
创建 GCP 项目
3. 在我们项目的主屏幕中,单击左上角的导航栏并单击 API 和服务,然后选择 OAuth 同意屏幕。
data:image/s3,"s3://crabby-images/48cc2/48cc27ef560ce2664e8f940e0b9e3d71ba2d3630" alt=""
导航到 Oauth 同意屏幕
4. 在 OAuth 同意屏幕主页中,选择外部并单击创建
data:image/s3,"s3://crabby-images/2cb7d/2cb7d7d3ba74e38b1424158f3802d732fb6a9e7c" alt=""
Oauth 初始步骤
5. 在下一个屏幕中,输入必填详细信息,包括应用程序名称、用户支持电子邮件和开发人员联系信息。单击“保存并继续”并进入摘要页面。
data:image/s3,"s3://crabby-images/b62cb/b62cb0ca97373e5c832d47123ee4a1c3bc166f3c" alt=""
应用详情
6. 在摘要屏幕中,单击“返回仪表板”。我们现在可以选择发布我们的应用程序。现在我们准备将我们的应用程序推送到生产环境。
data:image/s3,"s3://crabby-images/3e749/3e7497f002308114fafb475a595691e9763ac27b" alt=""
发布我们的应用程序
7. 现在我们已经发布了我们的应用程序,点击搜索栏并搜索 Google Drive API。选择 Google Drive API 并启用该服务。
data:image/s3,"s3://crabby-images/20846/20846289064e8bdce9983968a1ce7ed2d59e8394" alt=""
搜索 Google Drive API 服务
data:image/s3,"s3://crabby-images/d2ed9/d2ed9efea36f9b4d9ddfc6970359a36498138747" alt=""
启用 Google Drive API
8. 现在我们已经发布了我们的应用程序并启用了 Google Drive API,点击导航栏,在 APIs and Services 中,选择 Credentials。
data:image/s3,"s3://crabby-images/305e7/305e79094e99a46b8dc30162da94b78dac65cf93" alt=""
创建凭证
9. 在 OAuth 客户端 ID 屏幕中,选择应用程序类型作为桌面应用程序,输入名称并单击创建。
data:image/s3,"s3://crabby-images/73198/731982ab771e60eff7d14daa0aa6e5d3578f800e" alt=""
创建 OAuth 客户端 ID
9. 我们将被重定向到凭据主页,在那里我们将能够找到我们的 OAuth 客户端 ID。单击下载密钥选项并以名称client_secrets.json保存 .JSON 文件
data:image/s3,"s3://crabby-images/470b0/470b02b87d0c6970be9086e3f0dce2d157574805" alt=""
下载密钥
注意:此密钥和下面创建的Python文件应存在于同一目录中。
Python实现:
Python3
from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
import pandas as pd
# Initializing a GoogleAuth Object
gauth = GoogleAuth()
# client_secrets.json file is verified
# and it automatically handles authentication
gauth.LocalWebserverAuth()
# GoogleDrive Instance is created using
# authenticated GoogleAuth instance
drive = GoogleDrive(gauth)
# Initialize GoogleDriveFile instance with file id
file_obj = drive.CreateFile({'id': 'FILE_ID'})
file_obj.GetContentFile('FILE_NAME.xls',
mimetype='application/vnd.openxmlformats-officedocument.spreadsheetml.sheet')
dataframe = pd.read_excel('FILE_NAME.xls')
print(dataframe)
注意:用于创建 Google Forms 和Python Environment GDrive Authentication 的 Google Accounts 必须相同
当我们运行代码时,会在我们的默认 Web 浏览器中弹出一个 Google 身份验证流程窗口。我们必须选择我们的 Google 帐户并继续流程。
data:image/s3,"s3://crabby-images/739f1/739f1bf1ef4dc97bed91c7abe8165f122d5b51c9" alt=""
选择我们的谷歌账户
data:image/s3,"s3://crabby-images/f332c/f332cbcf1b6938e136ed79b8da6676cd5e2bb075" alt=""
点击 Advanced -> Go to GFG App (unsafe)
我们必须允许权限,然后在下一个屏幕中再次单击允许。
data:image/s3,"s3://crabby-images/868bf/868bfb5e1a168054368d7d7ce10e4c995444a5a7" alt=""
为我们的应用程序启用权限
现在我们将在浏览器中收到一条消息,上面写着“身份验证流程已完成”。转到我们的Python环境,我们将能够看到 Pandas Dataframe 格式的数据。
输出:
data:image/s3,"s3://crabby-images/d314f/d314f8cc06bf38baddc2bd81d26b59d349a2be04" alt=""
通过 Google Drive API 从 Google 表单实时获取的 Pandas 数据帧