📝 Python机器学习教程

28篇技术文档
  使用Python机器学习的教程

📅  最后修改于: 2020-12-10 05:26:52        🧑  作者: Mango

机器学习(ML)基本上是计算机科学领域,计算机系统可以像人类一样提供对数据的感知。简而言之,ML是一种人工智能,可以通过使用算法或方法从原始数据中提取模式。 ML的重点是允许计算机系统从经验中学习,而无需进行明确的编程或人工干预。对于对本学科感兴趣或将其作为课程一部分的研究生,研究生和研究型学生,本教程将非常有用。读者可以是初学者或高级学习者。本教程已经为学生和专业人士准备,可以迅速提高。本教程是...

  使用Python机器学习-基础

📅  最后修改于: 2020-12-10 05:27:35        🧑  作者: Mango

我们生活在一个“数据时代”,它具有更好的计算能力和更多的存储资源。这些数据或信息每天都在增加,但真正的挑战是要理解所有数据。企业和组织正在尝试通过使用来自数据科学,数据挖掘和机器学习的概念和方法构建智能系统来应对它。其中,机器学习是计算机科学中最令人兴奋的领域。如果我们将机器学习称为为数据提供意义的算法的应用和科学,那就没错。什么是机器学习?机器学习(ML)是计算机科学领域,计算机系统可以像人类一...

  使用Python机器学习-生态系统

📅  最后修改于: 2020-12-10 05:28:49        🧑  作者: Mango

Python简介Python是一种流行的面向对象的编程语言,具有高级编程语言的功能。它易于学习的语法和可移植性功能使其近来很受欢迎。以下事实为我们提供了Python的介绍-Python由荷兰Stichting Mathematisch Centrum的Guido van Rossum开发。它被编写为名为“ ABC”的编程语言的后继者。它的第一个版本于1991年发布。Python是Guido van...

  使用Python机器学习-方法

📅  最后修改于: 2020-12-10 05:29:42        🧑  作者: Mango

可以使用多种ML算法,技术和方法来构建用于通过使用数据解决实际问题的模型。在本章中,我们将讨论这种不同类型的方法。不同类型的方法以下是基于一些广泛类别的各种ML方法-基于人的监督在学习过程中,一些基于人工监督的方法如下:监督学习监督学习算法或方法是最常用的机器学习算法。该方法或学习算法在训练过程中获取数据样本(即训练数据)及其相关输出(即每个数据样本的标签或响应)。监督学习算法的主要目标是在执行多...

  ML项目的数据加载

📅  最后修改于: 2020-12-10 05:30:22        🧑  作者: Mango

假设如果要启动ML项目,那么您需要做的第一件事也是最重要的事情是什么?这是我们启动任何ML项目都需要加载的数据。关于数据,对于ML项目,最常见的数据格式是CSV(逗号分隔值)。基本上,CSV是一种简单的文件格式,用于以纯文本格式存储表格数据(数字和文本),例如电子表格。在Python,我们可以通过不同的方式将CSV数据加载到其中,但是在加载CSV数据之前,我们必须要注意一些注意事项。加载CSV数据...

  ML-通过统计数据了解数据

📅  最后修改于: 2020-12-10 05:31:11        🧑  作者: Mango

介绍在进行机器学习项目时,通常我们会忽略两个最重要的部分,称为数学和数据。这是因为,我们知道ML是一种数据驱动的方法,而我们的ML模型只会产生与提供给它的数据一样好的或坏的结果。在上一章中,我们讨论了如何将CSV数据上传到ML项目中,但是最好在上传之前了解数据。我们可以通过统计和可视化两种方式来理解数据。在本章中,在遵循以下Python食谱的帮助下,我们将了解具有统计信息的ML数据。查看原始数据第...

  ML-通过可视化了解数据

📅  最后修改于: 2020-12-10 05:31:48        🧑  作者: Mango

介绍在上一章中,我们讨论了数据对于机器学习算法的重要性以及一些Python配方,以了解具有统计信息的数据。还有另一种称为可视化的方式来理解数据。借助数据可视化,我们可以看到数据的外观以及数据的属性保持什么样的关联。这是查看要素是否与输出相对应的最快方法。借助以下Python食谱,我们可以了解具有统计信息的ML数据。单变量图:独立理解属性最简单的可视化类型是单变量或“单变量”可视化。借助单变量可视化...

  使用Python机器学习-准备数据

📅  最后修改于: 2020-12-10 05:32:48        🧑  作者: Mango

介绍机器学习算法完全依赖于数据,因为这是使模型训练成为可能的最关键方面。另一方面,如果我们无法从这些数据中获得任何意义,那么在将其提供给ML算法之前,一台机器将毫无用处。简而言之,对于我们希望机器解决的问题,我们始终需要提供正确的数据,即正确比例,格式和包含有意义特征的数据。这使得数据准备成为机器学习过程中最重要的步骤。数据准备可以定义为使我们的数据集更适合ML处理的过程。为什么要进行数据预处理?...

  带有Python的ML-数据功能选择

📅  最后修改于: 2020-12-10 05:33:27        🧑  作者: Mango

在上一章中,我们详细介绍了如何为机器学习预处理和准备数据。在本章中,让我们详细了解数据特征选择及其涉及的各个方面。数据特征选择的重要性机器学习模型的性能与用于训练它的数据特征成正比。如果提供给它的数据特征不相关,则ML模型的性能将受到负面影响。另一方面,使用相关数据功能可以提高ML模型的准确性,尤其是线性和逻辑回归。现在出现的问题是什么是自动特征选择?它可以定义为一个过程,借助该过程,我们可以选择...

  分类-简介

📅  最后修改于: 2020-12-10 05:34:22        🧑  作者: Mango

分类简介分类可以定义为根据观测值或给定数据点预测类别或类别的过程。分类的输出可以采用“黑色”或“白色”或“垃圾邮件”或“无垃圾邮件”的形式。在数学上,分类是从输入变量(X)到输出变量(Y)近似映射函数(f)的任务。它基本上属于有监督的机器学习,在该机器学习中,还提供了目标以及输入数据集。分类问题的一个示例可以是电子邮件中的垃圾邮件检测。只能有两类输出,“垃圾邮件”和“无垃圾邮件”;因此,这是一个二...

  分类算法-Logistic回归

📅  最后修改于: 2020-12-10 05:35:09        🧑  作者: Mango

Logistic回归简介逻辑回归是一种监督学习分类算法,用于预测目标变量的概率。目标或因变量的性质是二分法的,这意味着将只有两个可能的类。简而言之,因变量本质上是二进制的,其数据编码为1(代表成功/是)或0(代表失败/否)。在数学上,逻辑回归模型预测P(Y = 1)作为X的函数。它是最简单的ML算法之一,可用于各种分类问题,例如垃圾邮件检测,糖尿病预测,癌症检测等。Logistic回归的类型通常,...

  支持向量机(SVM)

📅  最后修改于: 2020-12-10 05:35:59        🧑  作者: Mango

SVM简介支持向量机(SVM)是强大而灵活的有监督的机器学习算法,可用于分类和回归。但通常,它们用于分类问题。在1960年代,SVM首次推出,但在1990年得到了完善。与其他机器学习算法相比,SVM具有其独特的实现方式。最近,由于它们能够处理多个连续和分类变量,它们非常受欢迎。SVM的工作SVM模型基本上是多维空间中超平面中不同类的表示。 SVM将以迭代方式生成超平面,从而可以最大程度地减少误差。...

  分类算法-决策树

📅  最后修改于: 2020-12-10 05:36:41        🧑  作者: Mango

决策树简介通常,决策树分析是一种预测建模工具,可以应用于许多领域。决策树可以通过一种算法方法构建,该算法可以根据不同条件以不同方式拆分数据集。决策树是属于监督算法类别的最强大的算法。它们可用于分类和回归任务。一棵树的两个主要实体是决策节点,在这里数据被拆分并离开,在这里我们得到结果。下面提供了用于预测一个人是否适合或不适合的二叉树示例,它提供了诸如年龄,饮食习惯和运动习惯等各种信息-在上面的决策树...

  分类算法-朴素贝叶斯

📅  最后修改于: 2020-12-10 05:37:13        🧑  作者: Mango

朴素贝叶斯算法简介朴素贝叶斯算法是一种基于应用贝叶斯定理的分类技术,其中强烈假设所有预测变量彼此独立。简而言之,假设是某个类中某个要素的存在独立于同一类中其他任何要素的存在。例如,如果一部电话具有触摸屏,互联网设施,优质的摄像头等,则可以认为它是智能的。尽管所有这些功能都相互依赖,但它们独立地有助于该电话成为智能电话。在贝叶斯分类中,主要的兴趣是找到后验概率,即给定某些观察到的特征的标签的概率ð’...

  分类算法-随机森林

📅  最后修改于: 2020-12-10 05:37:43        🧑  作者: Mango

介绍随机森林是一种监督学习算法,可用于分类和回归。但是,它主要用于分类问题。众所周知,森林由树木组成,更多的树木意味着更坚固的森林。同样,随机森林算法在数据样本上创建决策树,然后从每个样本中获取预测,最后通过投票选择最佳解决方案。它是一种集成方法,比单个决策树要好,因为它通过对结果求平均值来减少过度拟合。随机森林算法的工作我们可以通过以下步骤来了解随机森林算法的工作原理-步骤1-首先,从给定的数据...