📜  Python文字修补

📅  最后修改于: 2020-11-06 06:22:32             🧑  作者: Mango


一般而言,蒙混意味着通过将它们变脏来清理所有杂物。在我们的案例中,我们将看到如何转换文本以获得一些结果,从而使我们对数据进行一些理想的更改。从简单的角度来看,它仅与转换我们要处理的文本有关。

在下面的示例中,我们计划将第一个和最后一个除外的句子的所有字母重新排列,然后重新排列,以获取可能的替换单词,这些单词可能会在人类书写过程中作为拼写错误的单词生成。这种重新安排有助于我们

import random

import re

def replace(t):
    inner_word = list(t.group(2))
    random.shuffle(inner_word)
    return t.group(1) + "".join(inner_word) + t.group(3)
text = "Hello, You should reach the finish line."
print re.sub(r"(\w)(\w+)(\w)", replace, text)

print re.sub(r"(\w)(\w+)(\w)", replace, text)

当我们运行上面的程序时,我们得到以下输出-

Hlleo, You slouhd raech the fsiinh lnie.
Hlleo, You suolhd raceh the fniish line.

在这里,您可以看到除了第一个和最后一个字母外,单词是如何混杂的。通过对错误拼写采取统计方法,我们可以确定什么是常见的拼写错误的单词,并为其提供正确的拼写。