Kaggle 是最受欢迎的数据科学平台。它有多个免费数据集、您可以用于练习的项目以及有疯狂奖品的比赛!它还有一个有用的社区,您可以在其中分享您的想法并学习新事物。但是 Kaggle 最好的功能是 Kaggle Learn。即使你对数据科学一无所知,你也可以从 Kaggle 课程中学习所有基础知识,然后通过做项目来提高你的技能。
这些 Kaggle 数据科学课程是微课程,是获得数据科学项目所需技能的最快方式。如果您是初学者,它们可以快速介绍数据科学,涵盖所有重要主题,如Python、机器学习、数据可视化、Pandas、SQL、深度学习、自然语言处理 (NLP) 等。让我们看看所有这些详细了解课程并了解您可以从中学到什么。
1.Python
这是为数据科学提供的系列课程中的第一个迷你课程。那是因为在冒险进入更深的水域之前,您需要学习Python !本课程从语法到函数、布尔值、条件、列表、循环、列表推导式、字符串、字典和外部库,让您对Python语言有一个基本的了解。课程中的每个模块都包含基本信息,然后是示例和练习,因此您可以边做边学。这些在 2 小时内提供有关Python的整体知识,您可以在此基础上继续学习,直到您掌握最流行的数据科学语言!
2. 机器学习简介
机器学习是数据科学的重要组成部分,因为机器学习算法使用数据进行训练,然后根据其要求与数据一起使用。这就是为什么关于 Kaggle 的第二个迷你课程介绍机器学习,特别关注机器学习模型、模型验证、欠拟合、过拟合、随机森林,以及一个教授更多机器学习竞赛的练习。还有一些关于 AutoML 简介和开始使用自己的 Kaggle 笔记本以参加比赛的奖励课程。您将使用泰坦尼克号:灾难中的机器学习竞赛作为示例。这是 Kaggle 上著名的比赛!
3. 中级机器学习
介绍完之后,Kaggle 有中级机器学习微课程,深入研究机器学习。它主要关注数据集中的缺失值、管道、交叉验证、XGBoost、数据泄漏等。学习本课程将确保您的 Ml 模型比其他方式更准确和有用。
4. 数据可视化
下一课程侧重于数据可视化,这是数据科学的一个非常重要的部分。当数据存储在表的行和行中时,很难向人们传达数据洞察力和模式。这就是数据可视化非常有用的地方,因为它以易于理解的方式传达数据洞察力。这个迷你课程从 Seaborn 开始,然后教您如何创建折线图、条形图、热图、散点图、直方图和密度图。它还有助于为数据选择正确的可视化,然后使用最终项目来测试您所学的技能。
5. 熊猫
Pandas 是一个非常流行的Python软件库,用于数据分析和数据处理。因此,这是您将要学习的下一个迷你课程是理所当然的。它从使用 Pandas 创建、读取和写入数据开始,然后进行索引、选择、组合、排序、重命名、分配、分组等。 这些都是数据科学中的基础技术,因为它们有助于清理和准备你的数据集。本课程还教您如何调查 DataFrame 或 Series 中的数据类型以及如何处理数据中的缺失值。
6. 深度学习简介
Kaggle 课程还侧重于基础级别的深度学习,以便您以后可以自行学习高级主题。本课程首先介绍计算机视觉中的深度学习,然后通过卷积、TensorFlow 和 Keras 编程构建模型,使用迁移学习构建高度准确的模型,以及使用数据增强为模型训练提供更多数据。然后它会教你更深入地了解使用随机梯度下降和反向传播的深度学习,以及如何在没有迁移学习的情况下构建模型。还有一个额外的课程可以帮助你加入 Petals 到 Metal Kaggle 比赛,你需要构建一个机器学习模型来识别图像数据集中的花朵类型。
7. SQL 简介
现在我们进入了数据库领域,随之而来的是 SQL!如您所知,SQL 是一种非常流行的数据库管理语言,因此很明显 Kaggle 微课程也涵盖了这一点。本课程涉及 SQL 和 BigQuery 的基础知识,并教您如何使用常见关键字(如 Select、From、Group By、Where、Having、Count、Order By、As & With 等)创建 SQL 查询。它还教您如何使用 Join 和不同类型的 Join 组合各种数据源。
8. 高级 SQL
在介绍了 SQL 之后,Kaggle 将转到高级 SQL 微课程,该课程将更详细地教授该主题。这包括有关各种连接和联合的更多信息,以及解释分析函数、嵌套数据和重复数据。最后,它会教您如何编写比以前更有效的查询的各种策略。
9. 地理空间分析
地理空间分析侧重于地理空间数据以及如何正确处理它。这个迷你课程首先学习如何在 GeoPandas 中绘图,这是一个开源项目,可以更轻松地在Python处理地理空间数据。您还将了解以 2-D 形式表示 3-D 地球周围的坐标参考系统,以及创建交互式热图和等值线图的基础知识。除了邻近分析的基础知识外,本课程还教您如何操作地理空间数据。
10. 自然语言处理
这是一门短期课程,教授自然语言处理的基础知识。 NLP 是人工智能的一部分,专注于向机器教授语音和文本等语言。 Siri、Alexa 等就是一个很好的例子!由于自然语言处理是一个如此复杂的话题,Kaggle 只有一个基础的微课程,涵盖了 NLP 简介、结合机器学习和 NLP 技能的文本分类,最后是一个关于词向量的模块。
除了所有这些课程之外,还有一些关于 Kaggle 的课程涵盖了数据科学的各个其他方面。其中包括教您如何使用基线模型改进模型的特征工程、分类编码、特征生成和特征选择、计算机视觉、数据清理和机器学习可解释性。另一门课程是游戏 AI 和强化学习介绍。这是一门有趣的课程,可让您使用极小极大算法和深度强化学习来创建视频游戏机器人。除了所有这些课程之外,还有一个单独的微型挑战模块,让您可以应用所学的所有知识并测试您的技能。
所有这些 Kaggle 微课程和挑战可能不会让你单枪匹马地成为专家数据科学家,但它们会让你更聪明,更有能力使用这些基础知识来进一步建立你的知识。而且他们是免费的!所以你没有什么可失去的,但你会得到很多!