📌  相关文章
📜  正则表达式从永久链接获取 reddit 评论提交 ID (1)

📅  最后修改于: 2023-12-03 15:40:38.454000             🧑  作者: Mango

正则表达式从永久链接获取 reddit 评论提交 ID

如果你想从永久链接中获取reddit评论的提交ID,那么正则表达式可以帮助你快速解决这个问题。在这里,我将向你展示如何编写一个适用于reddit永久链接的正则表达式,并演示如何在Python代码中使用它。

Reddit永久链接格式

reddit的永久链接格式如下:

https://www.reddit.com/r/{subreddit}/comments/{post_id}/{post_title}/{comment_id}

其中,{subreddit}代表子版块名,{post_id}代表主题帖ID,{post_title}代表主题帖标题,{comment_id}代表评论ID。

正则表达式

为了从reddit永久链接中获取评论ID,可以使用以下正则表达式:

^https:\/\/(?:[a-zA-Z]+\.)?reddit\.com\/r\/\w+\/comments\/\w+\/(?:\w+\/)?(\w+)\/?

该正则表达式已将链接的其他组件删除,只留下评论ID。在Python代码中使用时,可以这样写:

import re

url = "https://www.reddit.com/r/learnpython/comments/abc123/sample_post_title/def456"
pattern = "^https:\/\/(?:[a-zA-Z]+\.)?reddit\.com\/r\/\w+\/comments\/\w+\/(?:\w+\/)?(\w+)\/?"
match = re.search(pattern, url)

if match:
    comment_id = match.group(1)
    print(comment_id)

以上代码将输出:

def456
结论

通过上述正则表达式,你可以轻松地从reddit永久链接中提取评论ID,并将其用于采集、分析或其他目的。如果你对正则表达式感到陌生,可以尝试学习一些基础,以便更好地应用它们来解决自己的问题。