📅  最后修改于: 2023-12-03 15:39:42.542000             🧑  作者: Mango
打字稿转译器是一个基于Shell/Bash编写的程序,它可以将你录制的音频或视频文件自动转录为文本。 它可以大大提高文字处理的效率,尤其是在做笔录、采访及学术研究等领域方面。此程序易于安装,并且被许多用户广泛使用。
Clone项目并将所需的软件安装到本地系统:
$ git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git
$ cd python-docs-samples/speech/microphone
$ pip install -r requirements.txt
提示:本程序需要Google Cloud Speech API的帮助,因此您需要一个Google Cloud账号并创建GCP的project。然后,需要启用Google Cloud Speech API并批准服务器的授权。
此程序是命令行程序,可以通过Shell/Bash在终端窗口中直接运行。使用的语法如下:
$ sh transcribe.sh <audio_file>
其中,audio_file
是您想要转录的音视频文件的本地路径。
示例:
$ sh transcribe.sh ./interview.mp3
此程序的核心代码来自Google Cloud,并经过修改以适应各种不同的录音设备和输入格式。主要包含以下几个步骤:
代码片段:
#!/bin/bash
# Step 1: Upload file to Google Cloud Storage
echo "Uploading audio file to Google Cloud Storage..."
gsutil cp $1 gs://$BUCKET_NAME/$1
# Step 2: Transcribe audio file with Speech-to-Text API
echo "Transcribing audio file with Google Cloud Speech API..."
gcloud ml speech recognize-long-running gs://$BUCKET_NAME/$1 --language-code='en-US' > result.json
# Step 3: Extract transcripts from transcribed result
echo "Extracting text from the result file..."
cat result.json | \
python -c "import sys,json;print(json.load(sys.stdin)['results'][0]['alternatives'][0]['transcript'])"
# Clean up
rm result.json
以上就是打字稿转译器的介绍。 该程序可以大大提高文字处理的效率,使您的工作更加便捷。 已经有很多用户在使用此程序并从中受益。如果您需要转录音频或视频文件,请尝试使用打字稿转译器。