📅  最后修改于: 2023-12-03 15:23:58.570000             🧑  作者: Mango
Google Cloud 的 Vision API 提供了强大的图像分析功能,包括 OCR 识别、图像标记、人脸检测等。本文将为您介绍如何使用 Google Cloud 的 Vision API。
在 GCP 控制台中创建一个项目,然后创建 Vision API。
设置认证
创建一个服务账号,获取认证文件。
$ gcloud iam service-accounts create [SA-NAME]
$ gcloud iam service-accounts keys create [FILE-NAME].json --iam-account [SA-NAME]@[PROJECT-ID].iam.gserviceaccount.com
$ export GOOGLE_APPLICATION_CREDENTIALS="[PATH]/[FILE-NAME].json"
[SA-NAME]
是服务账号的名称,[FILE-NAME]
是生成的认证文件名,[PROJECT-ID]
是 GCP 项目 ID,[PATH]
是认证文件在本地的路径。
安装 Google Cloud Vision API 客户端库
$ pip install --upgrade google-cloud-vision
使用 Python 代码访问 Vision API
from google.cloud import vision
client = vision.ImageAnnotatorClient()
# Load the image from local file.
with open('example.jpg', 'rb') as image_file:
content = image_file.read()
# perform OCR on image
image = vision.types.Image(content=content)
response = client.text_detection(image=image)
texts = response.text_annotations
for text in texts:
print(text.description)
可以使用 client.annotate_image()
API 进行图像标记或人脸检测等操作,具体该怎么做可以参考Vision API文档。
通过 Google Cloud SDK 命令访问 Vision API
$ export GOOGLE_APPLICATION_CREDENTIALS="[PATH]/[FILE-NAME].json"
$ gcloud auth activate-service-account --key-file [PATH]/[FILE-NAME].json
# to detect text in the image
$ gcloud ml vision detect-text gs://[BUCKET-NAME]/[IMAGE-NAME] > output.txt
# to detect faces in the image
$ gcloud ml vision detect-faces gs://[BUCKET-NAME]/[IMAGE-NAME] > output.txt
这里[BUCKET-NAME]
和 [IMAGE-NAME]
分别是需要识别的图片所在的 GCS 存储通和图片名称。
如果您经常访问 Vision API,可以考虑使用 Cloud Functions 或 Cloud Run 来部署您的代码。
通过本文的介绍,您现在应该对如何使用 Google Cloud Vision API 有了初步的了解,并且可以快速在您的项目中使用该 API。除此之外,您还可以通过阅读 Vision API 文档来了解更多功能和使用方法。