更快的抓取 - 无论代码示例

📌 相关文章

更快的解决方案 - C++ 代码示例
更快的解决方案 - C++ (1)
mysql 更快的删除 - SQL 代码示例
mysql 更快的插入 - SQL 代码示例
更快的 mysql 导入 - SQL 代码示例
mysql 更快的删除 - SQL (1)
用C ++ STL更快地编写代码(1)
用C ++ STL更快地编写代码
如何更快地播放 youtube 视频 - 无论代码示例
mysql 更快的插入 - SQL (1)
更快的 mysql 导入 - SQL (1)
数据抓取和屏幕抓取
如何使用 Google 更快地搜索
如何使用 Google 更快地搜索(1)
用于抓取网站的库 - 无论代码示例
在计算机存储中抓取 - 无论代码示例
更快的应用进度条 - Swift 代码示例
如何更快地放松 - Java 代码示例
从特定的 p 标签中抓取文本 - 无论代码示例
抓取参数 - 任何代码示例
电子邮件抓取器 python 代码示例
抓取参数 (1)
更快的应用进度条 - Swift (1)
python代码示例中的最佳抓取包
C# 抓取 html 文档 - C# 代码示例
更难更好更快更强的歌词 - 无论代码示例
如何更快地播放 youtube 视频 (1)
网页抓取 - PHP 代码示例
网页抓取 php 代码示例

📜 更快的抓取 - 无论代码示例

📅 最后修改于: 2022-03-11 14:56:05.607000 🧑 作者: Mango

代码示例1

import requests
from bs4 import BeautifulSoup

BASE_URL = "https://news.ycombinator.com/"
STORY_LINKS = []

for i in range(10):
    resp = requests.get(f"{BASE_URL}news?p={i}")
    soup = BeautifulSoup(resp.content, "html.parser")
    stories = soup.find_all("a", attrs={"class":"storylink"})
    links = [x["href"] for x in stories if "http" in x["href"]]
    STORY_LINKS += links
    time.sleep(0.25)

print(len(STORY_LINKS))

for url in STORY_LINKS[:3]:
    print(url)