📅  最后修改于: 2023-12-03 15:04:05.463000             🧑  作者: Mango
Python IMDbPY 是一个用于处理 IMDb 数据的 Python 库,它提供了访问和解析 IMDb 数据的功能。IMDb 是一个广受欢迎的电影和电视节目数据库,其中包含了大量的影视作品信息、演员信息等。IMDbPY 可以让程序员通过 Python 代码从 IMDb 数据库中提取出所需的信息。
本文主要介绍如何使用 Python IMDbPY 库来获取和解析 XML 格式的个人信息。IMDbPY 能够以 XML 格式导出影人(演员、导演等)的详细信息,包括出生日期、代表作品、个人简介等。
使用 pip 命令可以轻松安装 Python IMDbPY:
pip install IMDbPY
要获取个人信息,我们首先需要创建一个 IMDb 对象,并指定要访问的 IMDb 数据文件。IMDbPY 提供了多个数据文件,其中 actors.xml
包含了影人的详细信息。
import imdb
# 创建 IMDb 对象
ia = imdb.IMDb()
# 指定要使用的数据文件
ia.set_data_charset('utf-8')
ia.set_caching(False)
ia.set_imdb_urls(True) # 让 IMDbPY 返回 IMDb 页面的 URL,方便查看详细信息
# 加载影人数据文件
ia.update('actors')
接下来,我们可以使用 get_person_by_id()
方法通过 IMDb ID 获取影人的详细信息。每个影人都有一个唯一的 IMDb ID,可以在 IMDb 网站上找到。
# 指定要获取的影人的 IMDb ID
person_id = '0000206' # 汤姆·克鲁斯
# 通过 IMDb ID 获取影人信息
person = ia.get_person_by_id(person_id)
# 打印影人信息
print(f"姓名: {person['name']}")
print(f"出生日期: {person['birth date']}")
print(f"代表作品: {person['filmography']}")
print(f"个人简介: {person['mini biography']}")
使用上述代码,我们可以输出个人的姓名、出生日期、代表作品和个人简介等信息。此外,我们还可以从 person
对象中获取其他有用的属性,如出生地、星座等等。
以下是使用 IMDbPY 获取汤姆·克鲁斯(IMDb ID: 0000206)的个人信息的输出示例:
姓名: Tom Cruise
出生日期: 1962-07-03
代表作品: ['Top Gun: Maverick', 'Mission: Impossible - Fallout', 'American Made', ...]
个人简介: Tom Cruise is an American actor and producer. He has received various accolades for his work, including three Golden Globe Awards and three nominations for Academy Awards. With a net worth of $600 million as of 2021, he is one of the highest-paid actors in the world.
Python IMDbPY 提供了方便的方式来访问和解析 IMDb 数据。使用 IMDbPY,我们可以轻松地获取个人信息、电影信息等,并进行进一步的处理。通过指定 IMDb 数据文件和 IMDb ID,我们可以获取影人的详细信息,并将其保存为 XML 格式,以便后续使用或分析。
如果你对电影数据、演员信息等感兴趣,并且想在 Python 中进行相关的分析或应用开发,Python IMDbPY 是一个强大的工具,值得尝试。快速安装 IMDbPY,按照本文介绍的方法去提取和解析 IMDb 数据吧!