📅  最后修改于: 2020-11-09 04:55:58             🧑  作者: Mango
在本教程中,我们将向您展示如何使用Beautiful Soup 4在Python执行网络抓取,以从HTML,XML和其他标记语言中获取数据。在此,我们将尝试从各种不同的网站(包括IMDB)中抓取网页。我们将介绍漂亮的汤4,这是Python基本工具,可用于有效,清晰地导航,搜索和解析HTML网页。在本教程中,我们尝试涵盖了Beautiful Soup 4的几乎所有功能。您可以将本教程中介绍的多种功能组合到一个更大的程序中,以将网站中的多个有意义的数据捕获为其他子程序作为输入。