在PHP中使用 cURL 进行网页抓取
我们都尝试过以多种方式从网站获取数据。在本文中,我们将学习如何使用机器人进行网络抓取,以从网站中提取内容和数据。
我们将使用PHP cURL 来抓取一个网页,它看起来像是一个大写锁定的错字,但这就是你写它的方式。 cURL 是用于使用PHP发出 HTTP 请求的系统。这是从脚本中调用网页的方式。
“抓取数据,而不是内容”这句话适用于所有想学习网络抓取的人。 cURL 和网页抓取是强大的工具,可用于自动执行一些冗长乏味的重复性任务。我们应该只抓取信息,而不是完整的文章和内容。
示例:以下示例演示了从文章 https://www.geeksforgeeks.org/matlab-data-types/ 中抓取图像
PHP
';
echo '';
echo '';
echo '';
echo 'Web Scraping using cURL
';
// Checking for images
preg_match_all(
'!https://media.geeksforgeeks.org/wp-content/uploads/(.*)/(.*).png!',
$output, $data
);
foreach ($data[0] as $list) {
echo "";
}
echo '';
?>
输出: