📅  最后修改于: 2023-12-03 15:08:12.877000             🧑  作者: Mango
pyttsx3 是一个基于 Python 的文本转语音库,提供了实现语音合成功能的跨平台接口。它支持多种语音,包括 Windows 和 Linux 系统上的 SAPI5 语音,Mac OSX 上的 NSSpeechSynthesizer 语音,以及 Google 和 espeak 语音。然而,默认情况下,pyttsx3 只支持英语语音,如果需要使用其它语言,需要下载并安装对应的语音包。
在安装其它语音包之前,首先需要安装 pyttsx3 库。如果您还没有安装该库,请执行以下命令:
pip install pyttsx3
pyttsx3 提供了丰富的语音,但默认情况下,只有英语语音可用。如果需要使用其它语言,需要从官方网站下载对应的语音包。
pyttsx3 支持多种语音,包括 SAPI5 语音、NSSpeechSynthesizer 语音和 Google 语音。以下是各种语音的下载方法:
SAPI5 语音是 Windows 操作系统上可用的语音。要安装其它语言的 SAPI5 语音,请按以下步骤操作:
下载 TTS 中文语音包。
解压下载的语音包,并复制其中的 M1033LUS.VOX 文件。
将复制的文件粘贴到 C:\Windows\Speech\Common 下。
打开 PowerShell 终端,并执行以下命令:
python -m speech_recognition
此命令会执行 pyttsx3 的演示文件,检查是否安装成功。如果安装成功,则可以在 pyttsx3 中使用中文语音。
NSSpeechSynthesizer 语音是 Mac OSX 操作系统上可用的语音。要安装其它语言的 NSSpeechSynthesizer 语音,请按以下步骤操作:
下载要安装的语音包。
运行下载的语音包安装程序,将语音包安装到 Mac OSX 系统中。
如果安装成功,则可以在 pyttsx3 中使用该语音。
Google 语音是基于云服务的语音,可以使用在线 API 来调用。要使用其它语言的 Google 语音,请按以下步骤操作:
安装并配置 Google Cloud 帐户。
到 Google Cloud 控制台,创建一个新的项目。
在 API 和服务中心中启用 Text-to-Speech API。
创建一个服务帐户,并下载对应的 JSON 证书。
在 Python 中安装 Google Cloud 相关库:
pip install google-cloud-texttospeech
from google.cloud import texttospeech
client = texttospeech.TextToSpeechClient()
# 设置要使用的语音
voice = texttospeech.VoiceSelectionParams(
language_code='zh-CN',
ssml_gender=texttospeech.SsmlVoiceGender.NEUTRAL
)
# 设置要转换的文本
synthesis_input = texttospeech.SynthesisInput(text='你好,世界!')
# 设置声音参数
audio_config = texttospeech.AudioConfig(
audio_encoding=texttospeech.AudioEncoding.MP3
)
# 使用 API 进行转换
response = client.synthesize_speech(
input=synthesis_input,
voice=voice,
audio_config=audio_config
)
# 输出转换的结果
with open('output.mp3', 'wb') as out:
out.write(response.audio_content)
print('Audio content written to file "output.mp3"')
如果您想使用其它语音,可以将代码中的'zh-CN'替换为您需要的语音代码。
随着网络的普及和全球化的趋势,多语言的支持已经变得越来越重要。通过下载和安装 pyttsx3 的多个语音包,可以将其用于多种语言和多种操作系统,满足不同用户的需求。