📜  Python|使用字典从字符集中提取单词(1)

📅  最后修改于: 2023-12-03 14:46:26.262000             🧑  作者: Mango

Python | 使用字典从字符集中提取单词

当我们拿到一个字符串,需要提取其中的单词时,可以使用字典实现。这里介绍一种方法,使用 Python 的字典从字符集中提取单词。

字典存储单词

我们可以将字符串中的单词存储在一个字典中,以单词作为 key,出现次数作为 value。通过遍历字符串,发现单词时在字典中更新它的 value,如果没有发现它,在字典中新建一个 key,并将它的 value 设为 1。最终我们得到一个包含所有单词及其出现次数的字典,可以根据需要对其进行进一步处理。

下面是实现代码:

def get_words(string):
    d = {}
    string = string.lower()  # 全部转成小写
    word = ''
    for i in string:
        if i.isalpha():
            word += i
        else:
            if word:
                d[word] = d.get(word, 0) + 1
                word = ''
    if word:
        d[word] = d.get(word, 0) + 1
    return d

string = "How much wood would a woodchuck chuck, if a woodchuck could chuck wood?"
d = get_words(string)
print(d)

输出结果:

{'how': 1, 'much': 1, 'wood': 2, 'would': 1, 'a': 2, 'woodchuck': 2, 'chuck': 2, 'if': 1, 'could': 1}

可以看到,这个字符串中包含了九个单词,我们使用字典对它们进行了统计。其中,使用 get() 方法取出字典中的值时,如果字典中没有该 key,返回值为 0。

总结

本文介绍了使用 Python 的字典从字符集中提取单词的方法。通过遍历字符串,我们可以将单词存储在一个字典中,并统计它们出现的次数。此方法可以用于文本分析、语言处理等领域。