📅  最后修改于: 2023-12-03 15:28:12.720000             🧑  作者: Mango
谷歌英语发音 (Google Text-to-Speech) 是谷歌推出的一个语音合成服务,可以将文本转换为自然流畅的英语语音。它可以被集成到各种应用程序和设备中,例如电话、语音助手、语音邮件等。
谷歌英语发音提供了 API 接口,用于开发者将其集成到自己的应用程序中。具体操作方式如下:
使用谷歌英语发音需要申请 API Key,可以通过下面网址进行授权登陆并创建一个 API Key:
https://console.developers.google.com/apis/credentials
谷歌英语发音的 API 地址为:
https://texttospeech.googleapis.com/v1beta1/text:synthesize
谷歌英语发音的 API 请求参数如下:
Authorization
:身份验证,需要在请求头中设置Content-Type
:请求内容格式,需要设置为 application/json
body
:请求主体,包含以下字段:input
:文本输入,支持纯文本和 SSMLvoice
:音频输出的语音名称和语速等参数audioConfig
:音频格式和编码请求示例:
{
"input": {
"text": "Hello, how are you today?"
},
"voice": {
"languageCode": "en-US",
"ssmlGender": "FEMALE"
},
"audioConfig": {
"audioEncoding": "MP3"
}
}
谷歌英语发音 API 的响应参数如下:
audioContent
:音频内容,Base64 编码的字符串响应示例:
{
"audioContent": "//NExAAR...AAABAA=="
}
下面是一个使用 Python 调用谷歌英语发音 API 实现文本转语音的例子:
import requests
import base64
import json
# 设置 API Key
api_key = "YOUR_API_KEY"
# 文本输入
text = "Hello, how are you today?"
# 构建请求主体
body = {
"input": {"text": text},
"voice": {"languageCode": "en-US", "ssmlGender": "FEMALE"},
"audioConfig": {"audioEncoding": "MP3"}
}
body_json = json.dumps(body)
# 发送请求
response = requests.post(
"https://texttospeech.googleapis.com/v1beta1/text:synthesize",
headers={
"Authorization": f"Bearer {api_key}",
"Content-Type": "application/json"
},
data=body_json
)
# 解析响应
if response.status_code == 200:
audio_content = response.json()["audioContent"]
audio_binary = base64.b64decode(audio_content)
with open("output.mp3", "wb") as f:
f.write(audio_binary)
else:
print(f"Error: {response.text}")
谷歌英语发音是一个强大的语音合成服务,能够帮助开发者将文本转换为流畅自然的英语语音。本文简单介绍了它的 API 接口、请求参数和响应参数,并给出了一个使用 Python 调用它的例子。