📅  最后修改于: 2023-12-03 15:24:41.979000             🧑  作者: Mango
如果你想在 Scrapy 爬虫中使用代理,那么 scrapy-user 代理是一个不错的选择。以下是安装 scrapy-user 代理的步骤:
如果你还没有安装 Python,请先下载和安装 Python 3.x。
在终端中输入以下命令来安装所需依赖:
pip3 install pyOpenSSL service_identity
在终端中输入以下命令来安装 scrapy-user 代理:
pip3 install scrapy-user-agent
在 Scrapy 爬虫的 settings.py 文件中,添加以下代码来设置 scrapy-user 代理:
DOWNLOADER_MIDDLEWARES = {
'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware': None,
'scrapy_user_agents.middlewares.RandomUserAgentMiddleware': 400,
'scrapy_user_agents.middlewares.ProxyMiddleware': 410,
}
在 Scrapy 爬虫的 settings.py 文件中,添加以下代码来配置代理信息:
PROXY_LIST = './proxies.txt'
PROXY_MODE = 0
其中,PROXY_LIST 指定代理 IP 的列表文件路径,PROXY_MODE 参数指定代理模式:0 表示使用随机代理,1 表示按顺序使用代理。
在 Scrapy 爬虫的 settings.py 文件中,修改默认配置来启用代理:
HTTP_PROXY = 'http://127.0.0.1:9999'
HTTPS_PROXY = 'https://127.0.0.1:9999'
在终端中输入以下命令来测试 scrapy-user 代理是否正常工作:
scrapy fetch httpbin.org/ip
如果返回结果包含了代理 IP 地址,代表 scrapy-user 代理已经成功安装并工作。