从 URL 文本文件中提取电子邮件 ID 的Python程序
先决条件:使用Python正则表达式进行模式匹配
给定 URL 文本文件,任务是从该文本文件中提取所有电子邮件 ID 并打印urllib.request
库可用于处理所有与 URL 相关的工作。
例子 :
Input :
Hello
This is Geeksforgeeks
review-team@geeksforgeeks.org
contribute@geeksforgeeks.org
GfG is a portal for geeks
feedback@geeksforgeeks.org
careers@geeksforgeeks.org
Output :
[]
[]
['review-team@geeksforgeeks.org']
['contribute@geeksforgeeks.org']
[]
['feedback@geeksforgeeks.org']
['careers@geeksforgeeks.org']
可以使用urllib.request
处理 URL 文本文件。要使用正则表达式提取电子邮件,可以使用re
库。有关正则表达式的更多详细信息,请参阅此。
# library that handles the URL stuff
import urllib.request
# Importing module required for
# regular expressions
import re
# Assign urlopen to a file object variable
fhand = urllib.request.urlopen
('https://media.geeksforgeeks.org/wp-content/uploads/e-mail-1.txt')
for line in fhand:
# Getting the text file
# content line by line.
s = line.decode().strip()
# regex for extracting all email-ids
# from the text file
reg = re.findall(r"[A-Za-z0-9._%+-]+"
r"@[A-Za-z0-9.-]+"
r"\.[A-Za-z]{2,4}", s)
# printing the list output
print(reg)
输出 :
[]
[]
['review-team@geeksforgeeks.org']
['contribute@geeksforgeeks.org']
[]
['feedback@geeksforgeeks.org']
['careers@geeksforgeeks.org']