📅  最后修改于: 2020-11-06 06:24:04             🧑  作者: Mango
很多时候,获得搜索结果后,我们需要对现有搜索结果的一部分进行更深一层的搜索。例如,在给定的文本正文中,我们旨在获取网址并提取网址的不同部分(例如协议,域名等)。在这种情况下,我们需要借助分组函数来进行划分根据分配的正则表达式将搜索结果分为多个组。我们通过使用可搜索部分周围的括号分隔主要搜索结果(不包括我们要匹配的固定字词)来创建此类分组表达式。
import re
text = "The web address is https://www.tutorialspoint.com"
# Taking "://" and "." to separate the groups
result = re.search('([\w.-]+)://([\w.-]+)\.([\w.-]+)', text)
if result :
print "The main web Address: ",result.group()
print "The protocol: ",result.group(1)
print "The doman name: ",result.group(2)
print "The TLD: ",result.group(3)
当我们运行上面的程序时,我们得到以下输出-
The main web Address: https://www.tutorialspoint.com
The protocol: https
The doman name: www.tutorialspoint
The TLD: com