📜  如何在 selenium python 中获取 html 代码 - Html (1)

📅  最后修改于: 2023-12-03 14:52:34.337000             🧑  作者: Mango

如何在 Selenium Python 中获取 HTML 代码

在进行 Web 自动化测试中,我们经常需要获取网页的 HTML 代码。Selenium 提供了多种方法来获取网页的 HTML 代码,本文将介绍其中常用的几种方法。

使用 get_attribute('outerHTML') 方法

get_attribute('outerHTML') 方法可以获取当前元素的 HTML 代码。例如,下面代码可以获取 Google 搜索按钮的 HTML 代码:

from selenium import webdriver

driver = webdriver.Chrome()
driver.get('http://www.google.com')

search_button = driver.find_element_by_name('btnK')
html_code = search_button.get_attribute('outerHTML')

print(html_code)

输出:

<input type="submit" name="btnK" jsaction="sf.chk" value="Google 搜索" aria-label="Google 搜索" class="gNO89b">
使用 page_source 属性

page_source 属性可以获取整个页面的 HTML 代码。例如,下面代码可以获取 Google 搜索页面的 HTML 代码:

from selenium import webdriver

driver = webdriver.Chrome()
driver.get('http://www.google.com')

html_code = driver.page_source

print(html_code)
使用 execute_script() 方法

execute_script() 方法可以执行 JavaScript 代码,并返回执行结果。我们可以通过执行 JavaScript 代码来获取网页的 HTML 代码。例如,下面代码可以获取 Google 搜索页面的 HTML 代码:

from selenium import webdriver

driver = webdriver.Chrome()
driver.get('http://www.google.com')

html_code = driver.execute_script('return document.documentElement.outerHTML')

print(html_code)
总结

这篇文章介绍了在 Selenium Python 中获取网页的 HTML 代码的几种方法,具体如下:

  • 使用 get_attribute('outerHTML') 方法。
  • 使用 page_source 属性。
  • 使用 execute_script() 方法。

根据具体的应用场景和需求,我们可以选择适合的方法来获取网页的 HTML 代码。