📜  从 URL 文本文件中提取电子邮件 ID 的Python程序

📅  最后修改于: 2022-05-13 01:54:30.589000             🧑  作者: Mango

从 URL 文本文件中提取电子邮件 ID 的Python程序

先决条件:使用Python正则表达式进行模式匹配
给定 URL 文本文件,任务是从该文本文件中提取所有电子邮件 ID 并打印urllib.request库可用于处理所有与 URL 相关的工作。

例子 :

Input : 
Hello
This is Geeksforgeeks
review-team@geeksforgeeks.org
contribute@geeksforgeeks.org
GfG is a portal for geeks
feedback@geeksforgeeks.org
careers@geeksforgeeks.org

Output :
[]
[]
['review-team@geeksforgeeks.org']
['contribute@geeksforgeeks.org']
[]
['feedback@geeksforgeeks.org']
['careers@geeksforgeeks.org']


可以使用urllib.request处理 URL 文本文件。要使用正则表达式提取电子邮件,可以使用re库。有关正则表达式的更多详细信息,请参阅此。

# library that handles the URL stuff
import urllib.request
  
# Importing module required for
# regular expressions
import re
  
# Assign urlopen to a file object variable
fhand = urllib.request.urlopen
    ('https://media.geeksforgeeks.org/wp-content/uploads/e-mail-1.txt')
  
for line in fhand:
    # Getting the text file
    # content line by line.
    s = line.decode().strip()
  
    # regex for extracting all email-ids
    # from the text file
    reg = re.findall(r"[A-Za-z0-9._%+-]+"
                     r"@[A-Za-z0-9.-]+"
                     r"\.[A-Za-z]{2,4}", s)
  
    # printing the list output
    print(reg)

输出 :

[]
[]
['review-team@geeksforgeeks.org']
['contribute@geeksforgeeks.org']
[]
['feedback@geeksforgeeks.org']
['careers@geeksforgeeks.org']