📜  Python数据科学教程

📅  最后修改于: 2022-05-13 01:54:40.868000             🧑  作者: Mango

Python数据科学教程

这个Python数据科学教程将帮助您学习Python的基础知识以及数据科学的不同步骤,例如数据预处理、数据可视化、统计、制作机器学习模型等,并借助详细且解释清楚的示例进行更多操作。本教程将帮助初学者和一些训练有素的专业人员使用Python掌握数据科学。

Python 数据科学教程

相关课程:

对于任何有抱负的数据分析师和数据科学家,以及希望将大量原始数据转化为趋势和预测的人来说,机器学习都是一项基本技能。立即通过机器学习基础 - 自定进度课程学习这项技能,该课程由在 ML 和基于行业的项目方面拥有多年专业知识的行业专家设计和策划。

介绍

  • 数据科学导论
  • 什么是数据?
  • 用于数据科学的Python
  • Python熊猫
  • Python麻木
  • Python Scikit-学习
  • Python Matplotlib

Python基础

  • 在Python中接受输入
  • Python|使用 print()函数输出
  • 变量、表达式条件和函数
  • Python中的基本运算符
  • 数据类型
    • 字符串
    • 列表
    • 元组
    • 字典
    • 数组
  • 循环
  • Python中的循环和控制语句(继续、中断和通过)
  • 否则为
  • Python中的函数
  • 收益而不是回报
  • Python OOP 概念
  • 异常处理

有关更多信息,请参阅我们的Python教程

数据处理

  • 了解数据处理
  • Python:对 Numpy 数组的操作
  • 数据清洗概述
  • 切片、索引、操作和清理 Pandas 数据框
  • 在 Pandas 中处理缺失数据
  • 熊猫和 CSV
    • Python|读取 CSV
    • 将 Pandas 数据框导出到 CSV 文件
  • 熊猫和 JSON
    • 熊猫 |解析 JSON 数据集
    • 将 Pandas DataFrame 导出为 JSON 文件
  • 使用 Pandas 处理 excel 文件
  • Python关系数据库
    • 使用 MySQL-Connector Python连接 MySQL 数据库
    • Python:MySQL 创建表
    • Python MySQL – 插入表格
    • Python MySQL – 选择查询
    • Python MySQL – 更新查询
    • Python MySQL – 删除查询
  • Python NoSQL 数据库
  • Python日期时间
  • Python中的数据整理
  • Pandas Groupby:汇总、聚合和分组数据
  • 什么是非结构化数据?
  • 数据集的标签编码
  • 数据集的一种热编码

数据可视化

  • 使用 Matplotlib 进行数据可视化
  • 使用 Matplotlib 绘制样式
  • Matplotlib 中的折线图
  • Matplotlib 中的条形图
  • 使用 Matplotlib 在Python中绘制箱线图
  • Matplotlib 中的散点图
  • Matplotlib 中的热图
  • 使用 Matplotlib 进行三维绘图
  • Pandas 的时间序列图或线图
  • Python地理空间数据
  • Python中的其他绘图库
    • 使用Python Seaborn 进行数据可视化
    • 在Python中使用 Plotly 进行交互式数据可视化
    • 使用 Bokeh 进行交互式数据可视化

统计数据

  • 集中趋势测度
  • 使用Python进行统计
  • 测量方差
  • 正态分布
  • 二项分布
  • 泊松离散分布
  • 伯努利分布
  • P值
  • 在Python中探索相关性
  • 使用Python创建相关矩阵
  • 皮尔逊卡方检验

机器学习

监督学习

  • 学习类型——监督学习
  • 分类入门
  • 回归技术的类型
  • 分类与回归
  • 线性回归
    • 线性回归简介
    • 实现线性回归
    • 单变量线性回归
    • 多元线性回归
    • Python|使用 sklearn 进行线性回归
    • 使用 TensorFlow 进行线性回归
    • 使用 PyTorch 进行线性回归
    • 派斯帕克 |使用 Apache MLlib 进行线性回归
    • 波士顿住房 Kaggle 挑战与线性回归
  • 多项式回归
    • 多项式回归(从零开始使用Python )
    • 多项式回归
    • 非线性数据的多项式回归
    • 使用 Turicreate 进行多项式回归
  • 逻辑回归
    • 了解逻辑回归
    • 实现逻辑回归
    • 使用 TensorFlow 进行逻辑回归
    • 使用 TensorFlow 的 Softmax 回归
    • 使用 Keras 的 Softmax 回归
  • 朴素贝叶斯
    • 朴素贝叶斯分类器
    • 使用Python实现朴素贝叶斯从头开始
    • 补充朴素贝叶斯 (CNB) 算法
    • 将多项朴素贝叶斯应用于 NLP 问题
  • 支持向量
    • 支持向量机算法
    • Python中的支持向量机 (SVM)
    • 使用 GridSearchCV 进行 SVM 超参数调整
    • 在Python中创建线性核 SVM
    • 支持向量机 (SVM) 中的主要核函数
    • 使用 SVM 对非线性数据集进行分类
  • 决策树
    • 决策树
    • 实施决策树
    • 使用 sklearn 进行决策树回归
  • 随机森林
    • Python中的随机森林回归
    • 使用 Scikit-learn 的随机森林分类器
    • 随机森林分类器的超参数
    • 使用 Sklearn 的投票分类器
    • 装袋分类器
  • K-最近邻(KNN)
    • K 最近邻与Python |机器学习
    • 使用Python从 Scratch 实现 K-Nearest Neighbors
    • Python中的K最近邻算法
    • 使用 Sklearn 实现 KNN 分类器
    • 使用 KNNimputer() 进行插补
    • 使用 OpenCV 实现 KNN

无监督学习

  • 学习类型——无监督学习
  • 机器学习中的聚类
  • 不同类型的聚类算法
  • K 表示聚类 - 简介
  • KMeans 中 k 最优值的肘部方法
  • K-means++ 算法
  • 在Python中使用 K-Means 聚类分析测试数据
  • Mini Batch K-means 聚类算法
  • 均值漂移聚类
  • DBSCAN – 基于密度的聚类
  • 使用 Sklearn 实现 DBSCAN 算法
  • 模糊聚类
  • 光谱聚类
  • 光学集群
  • 使用 Sklearn 实现 OPTICS 集群
  • 层次聚类(凝聚和分裂聚类)
  • 使用 Sklearn 实现凝聚聚类
  • 高斯混合模型

深度学习

  • 深度学习简介
  • 人工神经网络简介
  • 在Python中实现人工神经网络训练过程
  • Python中的单个神经元神经网络
  • 卷积神经网络
    • 卷积神经网络简介
    • 池化层简介
    • 填充介绍
    • 卷积层中的填充类型
    • 在 mnist 数据集上应用卷积神经网络
  • 递归神经网络
    • 递归神经网络简介
    • 循环神经网络解释
    • seq2seq 模型
    • 长短期记忆简介
    • 长短期记忆网络解释
    • 门控循环单元网络(GAN)
    • 使用门控循环单元网络生成文本
  • GANs – 生成对抗网络
    • 生成对抗网络简介
    • 生成对抗网络 (GAN)
    • 生成对抗网络的用例
    • 使用 Keras 构建生成对抗网络
    • GAN 中的模态崩溃

自然语言处理

  • 自然语言处理简介
  • Python中的文本预处理 |套装 – 1
  • Python中的文本预处理 |设置 2
  • 在Python中使用 NLTK 删除停用词
  • 在Python中使用 NLTK 标记文本
  • 标记文本、句子、单词的工作原理
  • 词干简介
  • 使用 NLTK 词干词干
  • 使用 NLTK 进行词形还原
  • 使用 TextBlob 进行词形还原
  • 如何在Python中从 NLTK WordNet 获取同义词/反义词?

GeeksforGeeks 课程