📅  最后修改于: 2023-12-03 15:34:21.585000             🧑  作者: Mango
Uberi Speech Recognition是Python中使用音频输入进行语音识别的库。它使用Google的语音识别API,可用于转换音频文件(包括实时流)中的语音,以及识别麦克风输入的语音。
在开始使用Uberi Speech Recognition之前,需要安装它的依赖项。在您的命令行终端窗口中运行以下命令:
pip install SpeechRecognition
pip install PyAudio
注意: PyAudio必须在您的系统上正确安装才能使用麦克风输入。请确保您已经在可用的路径中安装了合适版本的PortAudio(V19或更高版本)的开发工具包。
以下是Uberi Speech Recognition的基本用法示例:
import speech_recognition as sr
# 创建Recognizer()对象
r = sr.Recognizer()
# 使用麦克风录音(如果输入文件,将 read_audio() 转换为 file_audio())
with sr.Microphone() as source:
audio = r.listen(source)
# 识别语音
try:
print("You said " + r.recognize_google(audio))
except sr.UnknownValueError: #无法识别
print("Google Speech Recognition could not understand audio")
except sr.RequestError as e: #请求错误
print("Could not request results from Google Speech Recognition service; {0}".format(e))
运行以上代码,可以使用麦克风录音后将语音转换为文本。当然,您可以调用其他方法对音频文件或其他文件输入进行语音识别。关于更多代码片段以及其他高级功能,可以在官方文档中查阅。