📅  最后修改于: 2023-12-03 15:22:11.632000             🧑  作者: Mango
GetOldTweets3 是一个用 Python 编写的开源库,用于从 Twitter 抓取历史推文。它提供了一个易于使用的接口和丰富的配置选项,可以让我们快速、简便地获取所需的推文数据。
在开始使用 GetOldTweets3 之前,需要先安装它。可以在命令行中使用以下命令安装 GetOldTweets3:
pip install GetOldTweets3
下面是一个使用 GetOldTweets3 获取推文的示例。假设我们要获取 @realDonaldTrump 在 2021 年 1 月 1 日至 2021 年 1 月 10 日发布的推文数据,代码如下:
import GetOldTweets3 as got
from datetime import datetime, timedelta
# 定义时间段
start_date = datetime(2021, 1, 1)
end_date = datetime(2021, 1, 10)
# 配置并执行查询
tweetCriteria = got.manager.TweetCriteria().setUsername('realDonaldTrump')\
.setSince(start_date.strftime('%Y-%m-%d'))\
.setUntil(end_date.strftime('%Y-%m-%d'))\
.setMaxTweets(100)
tweets = got.manager.TweetManager.getTweets(tweetCriteria)
# 输出结果
for tweet in tweets:
print(tweet.text)
print('---')
在上面的示例中,我们首先定义了要查询的时间段(1 月 1 日至 1 月 10 日),然后使用 setUsername
、setSince
、setUntil
和 setMaxTweets
方法来设置查询条件。getTweets
方法会执行查询,并返回符合条件的推文数据。最后,我们使用一个简单的循环来显示所获取的推文内容。
除了上述示例中使用的查询条件,GetOldTweets3 还提供了许多其他的配置选项,可以让我们更精确地获取所需的推文数据。以下列出了一些常用的选项:
setUsername
:指定要查询的 Twitter 用户名;setQuerySearch
:指定要查询的关键词;setSince
:指定要查询的起始日期;setUntil
:指定要查询的结束日期;setMaxTweets
:指定要获取的最大推文数;setLang
:指定要查询的语言;setTopTweets
:仅获取热门推文而非所有推文;setEmoji
:保留或过滤 Emoji 表情符号;setEmojiUnicode
:保留或过滤 Emoji Unicode 码。完整的配置选项列表可以参考 GetOldTweets3 的官方文档。
本文介绍了如何使用 GetOldTweets3 提取推文数据,并列举了一些常用的配置选项,希望对你有所帮助。如果你需要获取 Twitter 的历史数据,可以尝试使用 GetOldTweets3 这个强大的工具。