📜  在PHP中使用 cURL 进行网页抓取

📅  最后修改于: 2022-05-13 01:56:33.008000             🧑  作者: Mango

在PHP中使用 cURL 进行网页抓取

我们都尝试过以多种方式从网站获取数据。在本文中,我们将学习如何使用机器人进行网络抓取,以从网站中提取内容和数据。

我们将使用PHP cURL 来抓取一个网页,它看起来像是一个大写锁定的错字,但这就是你写它的方式。 cURL 是用于使用PHP发出 HTTP 请求的系统。这是从脚本中调用网页的方式。

抓取数据,而不是内容这句话适用于所有想学习网络抓取的人。 cURL 和网页抓取是强大的工具,可用于自动执行一些冗长乏味的重复性任务。我们应该只抓取信息,而不是完整的文章和内容。

示例:以下示例演示了从文章 https://www.geeksforgeeks.org/matlab-data-types/ 中抓取图像

PHP
';
echo '';
echo '';
echo '';
 
echo '

Web Scraping using cURL

';   // Checking for images preg_match_all( '!https://media.geeksforgeeks.org/wp-content/uploads/(.*)/(.*).png!',     $output, $data );   foreach ($data[0] as $list) {     echo ""; }   echo '';   ?>


输出:

网络抓取