📜  从英语到印度语言的文本音译 - 使用 indic-transliteration(1)

📅  最后修改于: 2023-12-03 14:49:28.271000             🧑  作者: Mango

从英语到印度语言的文本音译 - 使用 indic-transliteration

简介

在印度,尽管使用了不同的语言和文字,但英语一直是通用的第二语言。这就是为什么在将英语文本转换为印度语言文本时,音译是非常有用的技术。indic-transliteration是一个Python库,可以从英语到印地语、旁遮普语、马拉雅拉姆语、泰卢固语、泰米尔语、泰卡尔语和乌尔都语的音译。

安装
pip install indic-transliteration
用法

导入indic-transliteration库并使用以下方法进行音译操作:

from indic_transliteration import sanscript

# 选择要将文本转换的语言
targets = sanscript.Schemes[sanscript.DEVANAGARI]

# 准备英语文本
english_text = "Hello, how are you today?"

# 转换文本,输出印度语文本
result = sanscript.transliterate(english_text, sanscript.ITRANS, targets)
print(result)

输出:

हैलो, हॉ अरे यू टुडे?
支持的语言和方案

以下是indic-transliteration支持的语言和方案列表:

  • 印度语(IAST、HK、SLP1、VELTHUIS、NATIONAL、ITRANS、KOLKATA、PUNE、BENGALI、GUJARATI、GURMUKHI、KANNADA、MALAYALAM、ORIYA、TAMIL、TELUGU、DEVANAGARI、HALANTA、GITA、HARVARD-KYOTO、IAST-DEVANAGARI、ISO15919、ITRANS-DEVANAGARI、SANSKRIT2003)
  • 旁遮普语(IPA、SHAHMUKHI、GURMUKHI)
  • 马拉山姆语(MALAYALAM、NATIONAL、KOLKATA、ITRANS、SLP1、VELTHUIS)
  • 泰卢固语(TELUGU、SLP1、VELTHUIS、KANNADA、ITRANS、NATIONAL、APTS)
  • 泰米尔语(TAMIL、NATIONAL、GRANTHA、TSCII、ITRANS、SLP1、VELTHUIS、ISO15919、KOLKATA)
  • 泰卡尔语(KANNADA、SLP1、VELTHUIS、ITRANS、NATIONAL、SCHOLARS、ISO15919)
  • 乌尔都语(NASTALIQ、ROMAN、HINDI、DEVANAGARI、ITRANS)
结论

indic-transliteration是一种非常有用的工具,可以在不熟悉印度语言文本的情况下生成音译文本。它支持多种不同的语言和方案,可以让程序员更轻松地转换文本。