📅  最后修改于: 2023-12-03 15:39:51.154000             🧑  作者: Mango
有时候我们需要从文本中提取所有的大写单词,并将其保存到数据框(DataFrame)中进行后续分析处理。本篇文章将介绍如何使用Python提取所有大写单词并将其保存到数据框中。
本次操作需要使用到pandas和re库,需要先导入相关的库:
import pandas as pd
import re
读取包含大写单词的文本文件,如下所示:
with open('file.txt', 'r') as f:
text = f.read()
使用正则表达式提取所有大写单词,并将其保存到列表中:
words = re.findall(r'\b[A-Z]+\b', text)
将提取到的所有大写单词保存到一个数据框中,如下所示:
df = pd.DataFrame({'words': words})
打印出包含所有大写单词的数据框,如下所示:
print(df)
import pandas as pd
import re
with open('file.txt', 'r') as f:
text = f.read()
words = re.findall(r'\b[A-Z]+\b', text)
df = pd.DataFrame({'words': words})
print(df)
使用Python提取所有大写单词并将其保存到数据框中是非常简单的。通过正则表达式和pandas库,我们可以快速地完成这项任务。