📅  最后修改于: 2023-12-03 15:12:03.010000             🧑  作者: Mango
本文介绍如何使用Python计算文件中单词的频率。主要思路是读取文件内容,分割成单个单词,计算每个单词的出现次数,最后输出结果。
使用Python内置的open()
函数可以打开文件并读取文件内容。以下是打开文件并读取文件内容的示例代码:
with open('file.txt') as f:
content = f.read()
其中,file.txt
是你要读取的文件路径,可以自己设置。with
语句可以自动关闭文件,避免文件资源泄漏。
读取了文件内容之后,需要将文件内容分割成单个单词。使用Python内置的split()
函数可以按照空格将文件内容分割成单个单词。以下是将文件内容分割成单个单词的示例代码:
words = content.split()
将文件内容分割成单个单词之后,需要计算每个单词的出现次数。使用Python内置的collections
模块下的Counter()
函数可以快速计算出每个单词的出现次数。以下是计算单词频率的示例代码:
from collections import Counter
word_counts = Counter(words)
最后,我们需要将结果输出。可以使用Python内置的print()
函数将结果输出到控制台。以下是将结果输出到控制台的示例代码:
for word, count in word_counts.items():
print(f'{word}: {count}')
输出的结果将会是每个单词和它的出现次数。
from collections import Counter
with open('file.txt') as f:
content = f.read()
words = content.split()
word_counts = Counter(words)
for word, count in word_counts.items():
print(f'{word}: {count}')
以上是计算文件中单词频率的Python示例代码。使用这个代码,你可以快速计算任何文本文件中的单词出现频率。