📜  提取所有大写单词数据框 - Python (1)

📅  最后修改于: 2023-12-03 15:39:51.154000             🧑  作者: Mango

提取所有大写单词数据框 - Python

有时候我们需要从文本中提取所有的大写单词,并将其保存到数据框(DataFrame)中进行后续分析处理。本篇文章将介绍如何使用Python提取所有大写单词并将其保存到数据框中。

步骤
1. 导入必要的库

本次操作需要使用到pandas和re库,需要先导入相关的库:

import pandas as pd
import re
2. 读取文本文件

读取包含大写单词的文本文件,如下所示:

with open('file.txt', 'r') as f:
    text = f.read()
3. 提取所有大写单词

使用正则表达式提取所有大写单词,并将其保存到列表中:

words = re.findall(r'\b[A-Z]+\b', text)
4. 将所有大写单词保存到数据框中

将提取到的所有大写单词保存到一个数据框中,如下所示:

df = pd.DataFrame({'words': words})
5. 打印数据框

打印出包含所有大写单词的数据框,如下所示:

print(df)
完整代码
import pandas as pd
import re

with open('file.txt', 'r') as f:
    text = f.read()

words = re.findall(r'\b[A-Z]+\b', text)
df = pd.DataFrame({'words': words})
print(df)
总结

使用Python提取所有大写单词并将其保存到数据框中是非常简单的。通过正则表达式和pandas库,我们可以快速地完成这项任务。