📅  最后修改于: 2023-12-03 15:06:11.845000             🧑  作者: Mango
大家好,今天我们来一起学习如何使用 Python 从 Google 图像搜索中下载图片。
首先,我们需要在本地搭建 Python 环境,包括安装 Python 和 pip。
接着,我们需要安装一些必要的 Python 库,以便于我们进行开发。其中,包括 requests, BeautifulSoup 和 urllib。您可以通过以下命令来安装它们:
pip install requests
pip install beautifulsoup4
pip install urllib3
接下来,我们来一步步实现从 Google 图像搜索中下载图片的过程。
我们可以使用 Google 搜索引擎的图片搜索接口,通过构造 URL 来获取搜索结果中的图片。
例如,我们想要搜索关键词为“Python”的图片,那么就可以通过以下 URL 来获取搜索结果:
https://www.google.com/search?q=Python&tbm=isch
其中,q=Python 表示搜索关键词为“Python”,tbm=isch 表示搜索结果类型为图片。
接下来,我们使用 requests 库来发送 HTTP 请求,以获取搜索结果页面的 HTML 代码。代码如下:
import requests
url = 'https://www.google.com/search?q=Python&tbm=isch'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
response = requests.get(url, headers=headers)
其中,headers 参数表示我们使用的浏览器类型,用于模拟用户行为。
接下来,我们使用 BeautifulSoup 库来解析 HTML 代码,以找到图片的 URL。代码如下:
from bs4 import BeautifulSoup
soup = BeautifulSoup(response.text, 'html.parser')
img_links = soup.find_all('img')
for img_link in img_links:
print(img_link['src'])
其中,find_all 函数用于查找 HTML 中的所有 img 标签,并返回一个包含所有 img 标签的 list。img_link['src'] 表示获取每个 img 标签的 src 属性,也就是图片的 URL。
最后,我们使用 urllib 库来下载图片。代码如下:
import urllib.request
img_url = 'https://www.google.com/images/branding/googlelogo/1x/googlelogo_color_272x92dp.png'
urllib.request.urlretrieve(img_url, 'python.png')
其中,img_url 表示图片的 URL,python.png 表示保存图片的文件名。urlretrieve 函数会自动从 URL 中下载图片,并保存到指定的文件中。
上述就是使用 Python 从 Google 图像搜索中下载图片的完整过程。希望能对大家有帮助。