📝 Python

1615篇技术文档
  Python | 多项式回归的实现

📅  最后修改于: 2020-02-01 13:40:23        🧑  作者: Mango

多项式回归是线性回归的一种形式,其中将自变量x和因变量y之间的关系建模为n次多项式。多项式回归拟合x的值与y的相应条件均值之间的非线性关系,表示为E(y | x)为什么多项式回归:研究人员将假设某些关系是曲线关系。显然,此类情况将包含多项式项。通常的多元线性回归分析中的一个假设是所有自变量都是独立的。在多项式回归模型中,不满足该假设。多项式回归的用途:这些基本上用于定义或描述非线性现象,例如:组织...

  Python线性回归的波士顿房屋Kaggle挑战 | 机器学习 Machine Learning

📅  最后修改于: 2020-02-02 08:46:17        🧑  作者: Mango

波士顿房屋数据:此数据集取自StatLib库,由卡内基梅隆大学维护。该数据集涉及房屋城市波士顿的房价。提供的数据集具有506个实例和13个特征。数据集描述取自:让我们建立线性回归模型,预测房价输入库和数据集。输入波士顿数据的形状并获取feature_names将数据从nd-array转换为dataframe并将特征名称添加到数据在数据集中添加“Price”列波士顿数据集的描述波士顿数据集的信息获取...

  卷积神经网络在mnist数据集上的应用 Python

📅  最后修改于: 2020-02-02 08:49:08        🧑  作者: Mango

CNN基本上是一种被称为卷积神经网络的模型,并且由于其实用性,在最近一段时间它已广受欢迎。CNN使用多层感知器来进行计算工作。与其他图像分类算法相比,CNN使用的预处理相对较少。因此,对于图像处理任务,CNN是最适合的选项。MNIST数据集:mnist数据集是手写图像的数据集,如下图所示:通过使用卷积神经网络(CNN),我们可以得到99.06%的精度。首先,包括所有必要的库创建训练数据和测试数据测...

  Python保存机器学习模型

📅  最后修改于: 2020-02-02 08:51:12        🧑  作者: Mango

在机器学习中,与scikit学习库一起使用时,我们需要将经过训练的模型保存在文件中并进行还原,以便重用它以将模型与其他模型进行比较,以在新数据上测试模型。保存数据称为序列化,而恢复数据称为反序列化。此外,我们处理不同类型和大小的数据。一些数据集很容易训练,即它们花费的时间更少,但是即使是使用GPU,大数据集(大于1GB)的数据集也可能需要很长时间才能在本地计算机上训练。当我们在不同的项目中或以后需...

  Python | NLP餐厅评论的分析

📅  最后修改于: 2020-02-02 08:55:05        🧑  作者: Mango

自然语言处理(NLP)是计算机科学和人工智能的一个领域,与计算机和人类(自然)语言之间的交互有关,尤其是如何对计算机进行编程以处理和分析大量自然语言数据。这是机器学习的一个分支,它涉及分析任何文本并处理预测分析。Scikit-learn是用于Python编程语言的免费软件机器学习库。Scikit-learn主要用Python编写,一些核心算法用Cython编写以实现性能。Cython是Python...

  Python 主成分分析(PCA)

📅  最后修改于: 2020-02-02 09:02:08        🧑  作者: Mango

主成分分析(PCA)是一种统计过程,它使用正交变换将一组相关变量转换为一组不相关变量。PCA是探索性数据分析和预测模型的机器学习中使用最广泛的工具。此外,PCA是一种无监督的统计技术,用于检查一组变量之间的相互关系。这也被称为一般因素分析,其中回归确定一条最佳拟合线。所需模块:代码1:输出:代码#2:输出:#减少至569,2输出:输出:输出:...

  K最近邻居的Python实现

📅  最后修改于: 2020-02-02 09:08:50        🧑  作者: Mango

先决条件:K临近算法介绍假设我们获得了一组数据,每个数据项均具有数值特征(例如身高,体重,年龄等)。如果特征数为n,则可以将这些项表示为n维网格中的点。给定一个新项目,我们可以计算出该项目到集合中所有其他项目的距离。我们选择k个最近的邻居,然后看到大多数这些邻居被归类在哪里。我们在那里对新项目进行分类。因此,问题就变成了我们如何计算项目之间的距离。解决方案取决于数据集。如果值是实数,我们通常使用欧...

  Scikit-learn中的模型构建:Python机器学习库

📅  最后修改于: 2020-02-02 09:14:05        🧑  作者: Mango

scikit-learn是一个开放源代码Python库,它使用统一的界面实现一系列机器学习,预处理,交叉验证和可视化算法。scikit-learn的重要功能:简单有效的数据挖掘和数据分析工具。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度提升,k均值等。每个人都可以访问,并且可以在各种情况下重用。建立在NumPy, SciPy和matplotlib之上。开源,可商业使用– BSD许...

  使用Scikit-learn进行癌细胞分类

📅  最后修改于: 2020-02-02 09:20:36        🧑  作者: Mango

机器学习是人工智能的一个子领域,它使系统能够学习自身,而无需对其进行明确的编程。机器学习可用于解决许多现实问题。让我们根据癌细胞的特征对其进行分类,并确定它们是“恶性”还是“良性”。我们将scikit-learn用于机器学习问题。Scikit-learn是针对Python编程语言的开源机器学习,数据挖掘和数据分析库。数据集:Scikit-learn附带了一些小的标准数据集,不需要从任何外部网站下载...

  在Python中使用NLTK标记文本

📅  最后修改于: 2020-02-02 09:23:33        🧑  作者: Mango

要运行以下Python程序,必须在系统中安装(NLTK)自然语言工具包。NLTK模块是一个庞大的工具套件,旨在帮助您使用整个自然语言处理(NLP)方法。为了安装NLTK,请在终端中运行以下命令。sudo pip install nltk然后,只需键入Python,即可在终端中输入Python shell输入:import nltk输入:nltk.download(‘all’)由于大量的令牌化程序,...

  在Python中使用NLTK删除停用词

📅  最后修改于: 2020-02-02 09:25:15        🧑  作者: Mango

将数据转换为计算机可以理解的内容的过程称为预处理。预处理的主要形式之一是过滤掉无用的数据。在自然语言处理中,无用的单词(数据)称为停用词。什么是停用词?停用词:停用词是在为索引条目进行搜索或检索时被搜索引擎忽略的常用词(例如“ the”,“ a”,“ an”,“ in”)搜索查询的结果。我们不希望这些单词占用我们数据库中的空间或占用宝贵的处理时间。为此,我们可以通过存储您认为是停用词的单词列表来轻...

  Python | NLTK的词形还原lemmatization

📅  最后修改于: 2020-02-02 09:26:34        🧑  作者: Mango

词形还原是将单词的不同变形形式组合在一起的过程,因此可以将它们作为单个项目进行分析。词形还原与词干相似,但它为单词带来了上下文。因此,它将具有相似含义的单词链接到一个单词。文本预处理包括词干和词法化。很多时候人们发现这两个术语令人困惑。有些人将这两个视为相同。实际上,词干比词干更适合,因为词干对词进行形态分析。lemmatization的应用是:用于搜索引擎等全面的检索系统。用于紧凑型索引词形还原...

  Python | 用NLTK进行词干分析

📅  最后修改于: 2020-02-02 09:38:09        🧑  作者: Mango

词干是产生词根/基词形态变异的过程。阻止程序通常称为阻止算法或阻止程序。词干算法将单词“ chocolates”,“ chocolatey”,“ chocolate”减少到词根“ choco”,将“ retrieval”,“ retrieved”,“ retrieves”减少到词干“ retrieve”。提取词根“ like”的更多示例包括:在制止错误:主要有在制止两个错误-Overstemmin...

  如何在Python中从NLTK WordNet获取同义词/反义词

📅  最后修改于: 2020-02-02 09:40:48        🧑  作者: Mango

WordNet是一个大型的英语词汇数据库。名词,动词,形容词和副词被分组为认知同义词(同义词集),每组表达不同的概念。同义词集通过概念语义和词汇关系相互关联。WordNet的结构使其成为计算语言学和自然语言处理的有用工具。WordNet表面上类似于一个同义词库,它根据单词的含义将单词分组在一起。但是,有一些重要的区别。首先,WordNet不仅链接单词形式(字母字符串),而且链接特定的单词含义。结果...

  在Python中使用NLTK对停用词进行语音标记

📅  最后修改于: 2020-02-02 09:42:49        🧑  作者: Mango

自然语言工具包(NLTK)是用于构建文本分析程序的平台。语音标签是NLTK模块更强大的方面之一。为了运行下面的Python程序,您必须安装NLTK。请遵循安装步骤。打开终端,运行pip install nltk。在命令提示符下编写Python,以便Python Interactive Shell准备执行您的代码/脚本。输入importNLTKnltk.download()将会弹出一个GUI,然后选...