📅  最后修改于: 2023-12-03 15:40:38.454000             🧑  作者: Mango
如果你想从永久链接中获取reddit评论的提交ID,那么正则表达式可以帮助你快速解决这个问题。在这里,我将向你展示如何编写一个适用于reddit永久链接的正则表达式,并演示如何在Python代码中使用它。
reddit的永久链接格式如下:
https://www.reddit.com/r/{subreddit}/comments/{post_id}/{post_title}/{comment_id}
其中,{subreddit}
代表子版块名,{post_id}
代表主题帖ID,{post_title}
代表主题帖标题,{comment_id}
代表评论ID。
为了从reddit永久链接中获取评论ID,可以使用以下正则表达式:
^https:\/\/(?:[a-zA-Z]+\.)?reddit\.com\/r\/\w+\/comments\/\w+\/(?:\w+\/)?(\w+)\/?
该正则表达式已将链接的其他组件删除,只留下评论ID。在Python代码中使用时,可以这样写:
import re
url = "https://www.reddit.com/r/learnpython/comments/abc123/sample_post_title/def456"
pattern = "^https:\/\/(?:[a-zA-Z]+\.)?reddit\.com\/r\/\w+\/comments\/\w+\/(?:\w+\/)?(\w+)\/?"
match = re.search(pattern, url)
if match:
comment_id = match.group(1)
print(comment_id)
以上代码将输出:
def456
通过上述正则表达式,你可以轻松地从reddit永久链接中提取评论ID,并将其用于采集、分析或其他目的。如果你对正则表达式感到陌生,可以尝试学习一些基础,以便更好地应用它们来解决自己的问题。