带有列表列表的 countvectorizer - 无论代码示例 - 芒果文档

📌 相关文章

📜 带有列表列表的 countvectorizer - 无论代码示例

📅 最后修改于: 2022-03-11 14:57:52.637000 🧑 作者: Mango

代码示例1

corpus = [["this is spam, 'SPAM'"],["this is ham, 'HAM'"],["this is nothing, 'NOTHING'"]]

from sklearn.feature_extraction.text import CountVectorizer
bag_of_words = CountVectorizer(tokenizer=lambda doc: doc, lowercase=False).fit_transform(splited_labels_from_corpus)