📅  最后修改于: 2023-12-03 15:06:59.605000             🧑  作者: Mango
Kaggle 是一个面向数据科学家、机器学习工程师和数据分析师的在线社区。它通过举办机器学习竞赛、提供公开数据集等方式,为数据科学家们提供了一个实现数据驱动决策的平台。
如果你需要获取 Kaggle 上的数据集,你可以按照以下步骤进行操作:
首先,在 Kaggle 的官网上注册并登录。Kaggle 的官网网址为 https://www.kaggle.com。
在 Kaggle 的主页上,点击左侧导航栏上的“Datasets”图标。
在“Datasets”页面上,你可以通过搜索框搜索你所需要的数据集。如果你不知道如何搜索,可以直接点击页面中心的“Browse”按钮,浏览 Kaggle 上所有的数据集。
找到你所需要的数据集之后,你需要点击页面上方的“Download”按钮,并选择“Download (with API)”选项。
Kaggle 会生成一个 kaggle.json 文件,你需要将这个文件存储到你本地的一个安全路径下。注意,这个 kaggle.json 文件包含着 Kaggle API 的秘钥,所以一定要注意保密。
接下来,你需要在命令行或终端窗口中输入以下代码:
!pip install kaggle
这个命令会安装 Kaggle Python 包。如果你已经安装过了,你可以跳过这个步骤。
!kaggle datasets list
!kaggle datasets download -d username/dataset-name
其中,username 是指数据集的所有者名称,dataset-name 是指数据集的名称。
!ls
以上就是从 Kaggle 上获取数据集的基本步骤。
注意: