📜  Python IMDbPY – XML 格式的个人信息(1)

📅  最后修改于: 2023-12-03 15:04:05.463000             🧑  作者: Mango

Python IMDbPY - XML 格式的个人信息

简介

Python IMDbPY 是一个用于处理 IMDb 数据的 Python 库,它提供了访问和解析 IMDb 数据的功能。IMDb 是一个广受欢迎的电影和电视节目数据库,其中包含了大量的影视作品信息、演员信息等。IMDbPY 可以让程序员通过 Python 代码从 IMDb 数据库中提取出所需的信息。

本文主要介绍如何使用 Python IMDbPY 库来获取和解析 XML 格式的个人信息。IMDbPY 能够以 XML 格式导出影人(演员、导演等)的详细信息,包括出生日期、代表作品、个人简介等。

安装

使用 pip 命令可以轻松安装 Python IMDbPY:

pip install IMDbPY
使用方法

要获取个人信息,我们首先需要创建一个 IMDb 对象,并指定要访问的 IMDb 数据文件。IMDbPY 提供了多个数据文件,其中 actors.xml 包含了影人的详细信息。

import imdb

# 创建 IMDb 对象
ia = imdb.IMDb()

# 指定要使用的数据文件
ia.set_data_charset('utf-8')
ia.set_caching(False)
ia.set_imdb_urls(True)  # 让 IMDbPY 返回 IMDb 页面的 URL,方便查看详细信息

# 加载影人数据文件
ia.update('actors')

接下来,我们可以使用 get_person_by_id() 方法通过 IMDb ID 获取影人的详细信息。每个影人都有一个唯一的 IMDb ID,可以在 IMDb 网站上找到。

# 指定要获取的影人的 IMDb ID
person_id = '0000206'  # 汤姆·克鲁斯

# 通过 IMDb ID 获取影人信息
person = ia.get_person_by_id(person_id)

# 打印影人信息
print(f"姓名: {person['name']}")
print(f"出生日期: {person['birth date']}")
print(f"代表作品: {person['filmography']}")
print(f"个人简介: {person['mini biography']}")

使用上述代码,我们可以输出个人的姓名、出生日期、代表作品和个人简介等信息。此外,我们还可以从 person 对象中获取其他有用的属性,如出生地、星座等等。

输出效果

以下是使用 IMDbPY 获取汤姆·克鲁斯(IMDb ID: 0000206)的个人信息的输出示例:

姓名: Tom Cruise

出生日期: 1962-07-03

代表作品: ['Top Gun: Maverick', 'Mission: Impossible - Fallout', 'American Made', ...]

个人简介: Tom Cruise is an American actor and producer. He has received various accolades for his work, including three Golden Globe Awards and three nominations for Academy Awards. With a net worth of $600 million as of 2021, he is one of the highest-paid actors in the world.

总结

Python IMDbPY 提供了方便的方式来访问和解析 IMDb 数据。使用 IMDbPY,我们可以轻松地获取个人信息、电影信息等,并进行进一步的处理。通过指定 IMDb 数据文件和 IMDb ID,我们可以获取影人的详细信息,并将其保存为 XML 格式,以便后续使用或分析。

如果你对电影数据、演员信息等感兴趣,并且想在 Python 中进行相关的分析或应用开发,Python IMDbPY 是一个强大的工具,值得尝试。快速安装 IMDbPY,按照本文介绍的方法去提取和解析 IMDb 数据吧!