获取 href scrapy xpath - Python (1)

📌 相关文章

scrapy xpath href 包含文本 (1)
scrapy xpath href 包含文本 - 无论代码示例
scrapy xpath 包含类 (1)
scrapy xpath 包含类 - 任何代码示例
Scrapy – 壳
Scrapy – 壳(1)
scrapy shell - Python (1)
XPath轴
XPath-轴(1)
XPath-轴
scrapy xpath a rel next (1)
scrapy shell - Python 代码示例
scrapy xpath a rel next - 任何代码示例
Scrapy-Shell(1)
Scrapy-Shell
javascript中的xpath(1)
javascript xpath (1)
获取 href 属性 javascript (1)
在 jquery 中获取 href 值 - Javascript (1)
scrapy 获取内部属性值 - Python (1)
Scrapy – 设置
Scrapy-设置(1)
Scrapy-设置
Scrapy – 设置(1)
scrapy 获取内部属性值 - Python 代码示例
获取 href 属性 javascript 代码示例
获取属性 href - Javascript 代码示例
xpath 第 n 个元素 (1)
javascript代码示例中的xpath

📜 获取 href scrapy xpath - Python (1)

📅 最后修改于: 2023-12-03 15:41:26.617000 🧑 作者: Mango

获取 href scrapy xpath - Python

在使用scrapy爬虫时，我们需要经常获取HTML页面上的链接地址。这里我们介绍如何使用xpath语法获取页面上的href链接。

导入模块

import scrapy

爬虫类

class MySpider(scrapy.Spider):
    name = 'my_spider'
    start_urls = ['http://example.com']

    def parse(self, response):
        for link in response.xpath('//a/@href'):
            href = link.extract()
            yield {'href': href}

xpath语法解释

//a/@href : 选取所有<a>标签下的href属性。

效果

运行爬虫后，可以获取到所有页面上的链接地址。