📅  最后修改于: 2023-12-03 15:19:35.718000             🧑  作者: Mango
本程序可以帮助你在Python中查找一个字符串中所有单词的开始和结束索引。
import re
def find_word_indexes(text):
# 使用正则表达式匹配所有单词
word_regex = re.compile(r'\b\w+\b')
words = word_regex.findall(text)
# 记录每个单词在原始字符串中的开始和结束索引
word_indexes = []
for word in words:
start_index = text.index(word)
end_index = start_index + len(word)
word_indexes.append((start_index, end_index))
return word_indexes
text = "This is a sample text, containing multiple words."
word_indexes = find_word_indexes(text)
print(word_indexes)
# 输出: [(0, 4), (5, 7), (9, 10), (12, 18), (20, 25), (27, 35), (36, 39)]
\b\w+\b
匹配所有单词,其中\b
表示单词边界,\w+
表示一个或多个字母或数字。str.index
获取每个单词在原始字符串中的开始索引,使用len(word)
获取单词的长度,从而得到单词的结束索引。以上是本程序的代码实现和使用方法,有需要的程序员可以根据自己的需要进行使用和修改。