在Python中使用Selenium计算网页中的链接总数
Selenium是一个强大的工具,用于通过程序控制 Web 浏览器并执行浏览器自动化。它适用于所有浏览器,适用于所有主要操作系统,其脚本是用各种语言编写的,例如Python、 Java、C# 等,我们将使用Python 。
安装
1.1 Python中的Selenium绑定
Selenium Python绑定提供了一个方便的 API 来访问Selenium Web Driver,如 Firefox、Chrome 等。
Pip install Selenium
1.2 网络驱动
Selenium需要一个 Web 驱动程序来与所选浏览器交互。 Web 驱动程序是一个与 Web 浏览器交互的包。它通过一种通用的有线协议与网络浏览器或远程网络服务器交互。您可以检查并安装您选择的浏览器的网络驱动程序。
Chrome: https://sites.google.com/a/chromium.org/chromedriver/downloads
Firefox: https://github.com/mozilla/geckodriver/releases
Safari: https://webkit.org/blog/6900/webdriver-support-in-safari-10/
循序渐进的方法:
- 导入所需模块
Python3
# import modules
from selenium import webdriver
from selenium.webdriver.common.by import By
import time
Python3
# assign web page url
driver.get("https://www.geeksforgeeks.org/")
Python3
#import module
from selenium import webdriver
from selenium.webdriver.common.by import By
driver = webdriver.Chrome()
# url
driver.get('https://www.geeksforgeeks.org/')
# find web links
link = driver.find_elements(By.TAG_NAME, 'a')
# using len function count how many links
print(len(link))
- 以任何URL 。
蟒蛇3
# assign web page url
driver.get("https://www.geeksforgeeks.org/")
- 使用By.TAG_NAME在网页中查找网络链接。
执行:
蟒蛇3
#import module
from selenium import webdriver
from selenium.webdriver.common.by import By
driver = webdriver.Chrome()
# url
driver.get('https://www.geeksforgeeks.org/')
# find web links
link = driver.find_elements(By.TAG_NAME, 'a')
# using len function count how many links
print(len(link))
输出: