📜  如何使用Python从 Google 抓取 Web 数据?

📅  最后修改于: 2022-05-13 01:54:24.864000             🧑  作者: Mango

如何使用Python从 Google 抓取 Web 数据?

先决条件: Python请求,使用 BeautifulSoup 在Python中实现 Web Scraping

网页抓取是一种从网站获取数据的技术。在网上冲浪时,许多网站不允许用户保存数据以供个人使用。一种方法是手动复制粘贴数据,这既繁琐又耗时。 Web Scraping 是网站数据提取过程的自动化。

在本文中,我们将从谷歌的搜索结果中抓取天气更新。

所需模块

  • BeautifulSoup:此模块用于在 HTML 或 XML 解析器上迭代、搜索和修改解析树。要下载它,请在终端中键入以下命令。
    pip install beautifulsoup4
  • Requests: Requests 库是Python的组成部分之一,用于向指定的 URL 发出 HTTP 请求。要下载它,请在终端中键入以下命令。
    pip install requests

下面是实现。

import requests
from bs4 import BeautifulSoup
   
# Enter the City Name
city = input("Enter the City Name: ")
search = "Weather in {}".format(city)
  
# URL 
url = f"https://www.google.com / search?&q ={search}" 
   
# Sending HTTP request
req = requests.get(url)
  
# Pulling HTTP data from internet
sor = BeautifulSoup(req.text, "html.parser") 
  
# Finding temperature in Celsius
temp = sor.find("div", class_='BNeawe').text
  
print(temp)

输出 :

蟒蛇天气数据网络抓取