📜  Python – 字符串速记中的词频(1)

📅  最后修改于: 2023-12-03 15:04:12.230000             🧑  作者: Mango

Python – 字符串速记中的词频

在Python中,字符串是一种非常基本的数据类型。字符串是由字符组成的,可以包含字母、数字或其他字符。在这篇文章中,我们将介绍一些在Python中用于计算字符串中单词出现频率的方法。

单词计数方法一:

def count_words(s):
    words = s.split()
    word_count = {}
    for word in words:
        if word.lower() not in word_count:
            word_count[word.lower()] = 1
        else:
            word_count[word.lower()] += 1
    return word_count

这个函数通过将字符串分割成单个单词并对其进行计数来计算单词出现的频率。它返回一个字典,其中键是每个唯一单词的小写形式,值是出现该单词的次数。

单词计数方法二:

from collections import Counter

def count_words(s):
    words = s.split()
    return Counter(words)

这个函数使用Python的内置Counter类来计算单词出现的频率。它返回一个Counter对象,其中键是每个单词,值是每个单词在字符串中出现的次数。

小结

在Python中,有很多方法可以计算字符串中单词的出现频率。以上两种方法都是很常用的方法,但更适用于不同情境。你可以根据自己的需求决定应该采用哪个方法。

参考资料