📅  最后修改于: 2023-12-03 15:23:19.804000             🧑  作者: Mango
在程序开发过程中,经常需要从字符串中获取单词并进行处理。本文将介绍如何在 Python 中获取字符串中的单词,并且将返回 markdown 格式的代码片段。
下面是一个示例代码,它将字符串中的单词提取出来:
import re
def get_words(string):
words = re.findall(r'\b\w+\b', string)
return words
该函数使用 Python 中内置的正则表达式模块 re
,通过 \b\w+\b
的正则表达式,在字符串中匹配单词。其中,\b
表示单词的边界,\w+
表示单词由字母或数字组成且长度大于等于1。最终返回一个列表 words
,包含了字符串中所有的单词。
string = "hello world, this is a test string."
words = get_words(string)
print(words)
输出结果为:
['hello', 'world', 'this', 'is', 'a', 'test', 'string']
本文介绍了使用正则表达式在 Python 中获取字符串中单词的方法,并提供了相应的示例代码。
在获取单词的过程中,我们需要注意字符串的边界以及单词的组成规则。正则表达式的运用能够使代码更加简洁和高效。