📅  最后修改于: 2023-12-03 14:44:36.734000             🧑  作者: Mango
NLP (Natural Language Processing) 是一种人工智能技术,通过计算机处理和分析人类语言,使计算机能够理解、解释和生成自然语言。
NLP 可以用于解决以下主要任务之一或多个:
主要的 NLP 工具和库包括:
在 NLP 中,常见的挑战包括:
import nltk
# 下载并引入停用词列表
nltk.download('stopwords')
from nltk.corpus import stopwords
# 加载示例文本
text = "Natural language processing (NLP) is a subfield of artificial intelligence. It focuses on the interaction between computers and humans using natural language."
# 分词
tokens = nltk.word_tokenize(text)
# 过滤停用词
filtered_tokens = [token for token in tokens if token.lower() not in stopwords.words('english')]
# 统计词频
freq_dist = nltk.FreqDist(filtered_tokens)
# 打印前10个常见词汇
for token, frequency in freq_dist.most_common(10):
print(f"{token}: {frequency}")
这段示例代码使用 NLTK 库进行文本处理,包括分词、停用词过滤和词频统计。结果将输出前10个最常见的词汇及其频率。
希望这个介绍对程序员了解 NLP 提供了一些帮助!请在需要时将此Markdown信息使用适当的格式插入文档中。