📅  最后修改于: 2023-12-03 15:23:49.790000             🧑  作者: Mango
在进行 SEO 优化工作的过程中,我们经常需要知道某个关键词在谷歌搜索结果中的排名情况。使用 Python 和 BeautifulSoup 库可以轻松地实现这个功能。
在使用之前,我们需要安装 BeautifulSoup 库以及 requests 库。可以通过以下命令进行安装:
pip install beautifulsoup4
pip install requests
import requests
from bs4 import BeautifulSoup
query = 'Python'
url = f'https://www.google.com/search?q={query}'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
page = requests.get(url, headers=headers)
在这里,我们使用了 headers 参数,模拟了一个通过 Chrome 浏览器访问谷歌搜索页面的请求。
soup = BeautifulSoup(page.content, 'html.parser')
links = soup.find_all('a')
rank = 0
for link in links:
href = link.get('href')
if href.startswith('/url?q='):
rank += 1
title = link.find('h3').get_text()
url = href.split('=')[1].split('&')[0]
print(f'{rank}. {title}: {url}')
在这里,我们使用了 find_all 方法查找所有 link 元素,并使用 get 方法获取 href 属性。然后,我们判断 href 是否以 '/url?q=' 开头,如果是,则说明这是一个搜索结果链接。我们可以从中获取页面标题和 URL,并按照排名的顺序输出到控制台。
使用 Python 和 BeautifulSoup 库可以轻松地实现在谷歌搜索结果中获得页面排名的功能。我们只需要发送 HTTP 请求,解析 HTML 内容,然后获取相关信息即可。对于 SEO 优化工作来说,这个功能非常实用。