📅  最后修改于: 2023-12-03 15:12:32.275000             🧑  作者: Mango
这是一个可以查询一个链接中的另一个词是什么的程序。用户只需提供一个URL,程序就会抓取该网页的内容,然后返回一个词语。
使用该程序非常简单,只需要调用以下接口即可:
GET /link-another-word?url=【URL】
其中,【URL】为需要查询的网页链接。
例如,若要查询 百度首页 中最靠左侧的第一个链接中的另一个词是什么,可以发送如下请求:
GET /link-another-word?url=https://www.baidu.com/
程序将会返回以下响应:
The word in the first link of https://www.baidu.com/ is: hao123
程序会首先使用 Python 的 requests 库发送GET请求,获取到用户提供的链接中的 HTML 响应。之后,程序会使用 BeautifulSoup4 解析 HTML 响应,找到该网页中第一个链接的文本内容,并去除空格等噪声。
最后,程序将该文本内容返回给用户。
The word in the first link of https://www.baidu.com/ is: hao123
import requests
from bs4 import BeautifulSoup
def get_link_another_word(url):
# 发送 GET 请求获取 HTML 响应
response = requests.get(url)
html = response.text
# 使用 BeautifulSoup4 解析 HTML 响应
soup = BeautifulSoup(html, "html.parser")
# 找到该网页中第一个链接的文本内容
first_link = soup.find("a")
text = first_link.text.strip()
# 返回该文本内容
return text