📝 Python

1615篇技术文档
  Python | 使用Pandas进行数据分析

📅  最后修改于: 2020-02-01 06:53:49        🧑  作者: Mango

Pandas是最流行的用于数据分析的Python库之一。它使用完全用C或Python编写的后端源代码提供了高度优化的性能。我们可以使用以下方法分析熊猫中的数据:SeriesDataFramesSeries:Series是在熊猫中定义的一维(1-D)数组,可用于存储任何数据类型。代码1:创建Series在这里,数据可以是:标量值,其可以是integerValue,stringPython的字典,可以...

  Python | 使用pandas.read_csv()读取csv

📅  最后修改于: 2020-02-01 06:56:08        🧑  作者: Mango

Python是进行数据分析的一种出色语言,主要是因为以数据为中心的Python软件包具有奇妙的生态系统。Pandas是其中的一种,使导入和分析数据更加容易。导入 Pandas:代码#1:read_csv是重要的pandas函数,用于读取csv文件并对其进行操作。通过此操作轻松打开CSV文件。但是还有很多其他事情可以通过此函数来完成,以完全更改返回的对象。例如,不仅可以在本地读取csv文件,还可以通...

  Python | 使用Panda合并,联接和连接DataFrame

📅  最后修改于: 2020-02-01 06:57:32        🧑  作者: Mango

数据帧是具有多个行和列的二维数据结构。在数据框中,数据仅以行和列的形式对齐。数据帧可以执行算术运算和条件运算。它的大小可变。下面是使用Numpy和Pandas的实现。所需模块:代码#1:DataFrames串联concat()函数完成了沿一个轴执行串联操作的所有繁重工作,同时在其他轴上执行了索引(如果有)的可选设置逻辑(联合或相交)。输出:代码2:DataFrames合并Pandas提供了一个单一...

  Python | 使用Pandas.drop()从DataFrame删除行/列

📅  最后修改于: 2020-02-01 07:00:10        🧑  作者: Mango

Python是进行数据分析的一种出色语言,主要是因为以数据为中心的Python软件包具有奇妙的生态系统。Pandas是其中的一种,使导入和分析数据更加容易。Pandas为数据分析人员提供了一种使用.drop()方法删除和过滤数据帧的方法。使用此方法,可以使用索引标签或列名删除行或列。语法:参数:labels:引用行或列名称的字符串或字符串列表。axis:整数或字符串值,“ 0″用于行,“ 1″用于...

  Python | Pandas数据比较与选择

📅  最后修改于: 2020-02-01 07:02:54        🧑  作者: Mango

Python是进行数据分析的一种出色语言,主要是因为以数据为中心的Python软件包具有奇妙的生态系统。Pandas是其中的一种,使导入和分析数据更加容易。数据分析中最重要的事情是比较值并相应地选择数据。“ ==”运算符也适用于Pandas数据框中的多个值。以下两个示例将说明如何比较和选择“熊猫数据”框架中的数据。要下载使用的CSV文件,请单击此处。示例1:比较数据在以下示例中,从csv文件创建数...

  线性回归(Python实现)

📅  最后修改于: 2020-02-01 07:05:09        🧑  作者: Mango

本文讨论了线性回归的基础知识及其在Python编程语言中的实现。线性回归是一种统计方法,用于对因变量与给定的一组自变量之间的关系进行建模。注意:在本文中,为简单起见,我们将因变量称为响应,将自变量称为函数。为了提供对线性回归的基本了解,我们从线性回归的最基本版本开始,即简单线性回归。简单线性回归简单线性回归是一种使用单个特征预测响应的方法。假定两个变量线性相关。因此,我们尝试找到一个线性函数,该线...

  使用Tensorflow进行线性回归

📅  最后修改于: 2020-02-01 07:08:31        🧑  作者: Mango

先决条件在使用Tensorflow实施线性回归之前,我们将简要总结一下线性回归。由于我们不会涉及线性回归或Tensorflow的详细信息,请阅读以下文章以了解更多详细信息:线性回归(Python实现)线性回归的简要概述线性回归是一种非常普遍的统计方法,它使我们能够从给定的连续数据集中学习函数或关系。例如,我们给出的一些数据点x和相应的y,我们需要学习他们之间的关系的假说。在线性回归的情况下,假设是...

  了解逻辑回归 Python实现

📅  最后修改于: 2020-02-01 07:10:36        🧑  作者: Mango

先决条件:线性回归本文讨论Logistic回归的基本知识及其在Python中的实现。逻辑回归基本上是一种监督分类算法。在分类问题中,目标变量(或输出)y对于给定的一组特征(或输入)X只能采用离散值。与普遍的看法相反,逻辑回归是一种回归模型。该模型构建回归模型,以预测给定数据条目属于编号为“ 1″的类别的概率。就像线性回归假设数据遵循线性函数一样,逻辑回归也使用S型函数对数据进行建模。仅当将决策阈值...

  K means聚类Python–简介

📅  最后修改于: 2020-02-01 08:07:38        🧑  作者: Mango

我们获得了具有某些特征的项目数据集,以及这些特征的值(如矢量)。任务是将这些项目归类。为了达到这个目的,我们将使用kMeans算法。一种无监督的学习算法。总览(如果您将项目视为n维空间中的点,它将很有帮助)。该算法会将项目分类为k个相似度组。为了计算相似度,我们将使用欧式距离作为度量。该算法的工作原理如下:首先,我们随机初始化k个点,称为均值。我们将每个项目归类到最接近的均值,并更新均值的坐标,这...

  在Python中使用K-Means聚类分析测试数据

📅  最后修改于: 2020-02-01 08:22:48        🧑  作者: Mango

本文演示了使用open-cv库在样本随机数据上进行K均值聚类的示例。先决条件:Numpy让我们首先使用matplot-lib工具可视化具有多项函数。这里的“ Z”是一个大小为100的数组,值的范围从0到255。现在,将“ z”reshape为列向量。如果存在多个功能,它将更加有用。然后将数据更改为np.float32类型。输出:现在,将k-Means聚类算法应用于上述测试数据中的示例,并查看其行为...

  ML | Python无监督人脸聚类管线

📅  最后修改于: 2020-02-01 13:15:28        🧑  作者: Mango

实时面部识别是自动化安全部门仍然面临的问题。随着卷积神经网络的发展以及CNN特别创新的方式,已经证实,使用我们当前的技术,我们可以选择监督学习的选择,例如FaceNet,YOLO,以便在现实环境中进行快速和实时的人脸识别。要训​​练监督模型,我们需要获取目标标签的数据集,这仍然是一项繁琐的任务。我们需要一种高效且自动化的解决方案,用于数据集的生成,而用户干预所需的标记工作却很少。拟议的解决方案简介...

  Python中的多维数据分析

📅  最后修改于: 2020-02-01 13:19:54        🧑  作者: Mango

多维数据分析是对数据的信息分析,其中考虑了许多关系。让我们阐明一些使用Python编写的开源库来分析多维/多元数据的基本技术。从此处找到用于说明的数据的链接。以下代码用于从zoo_data.csv读取2D表格数据。输出:注意:我们这里拥有的数据类型通常是分类的。本案例研究中用于分类数据分析的技术是非常基本的技术,易于理解,解释和实施。其中包括聚类分析,相关性分析,PCA(主成分分析)和EDA(探索...

  Python | 电影推荐系统的实现

📅  最后修改于: 2020-02-01 13:28:21        🧑  作者: Mango

推荐系统是一种试图根据用户的选择来预测或过滤偏好的系统。推荐系统广泛用于电影,音乐,新闻,书籍,研究文章,搜索查询,社交标签和产品等各个领域。推荐系统以两种方式中的任何一种产生建议列表:协作过滤:协作过滤方法根据用户过去的行为(即用户购买或搜索的商品)以及其他用户做出的类似决策来构建模型。然后,此模型用于预测用户可能感兴趣的项目(或项目的评级)。基于内容的过滤:基于内容的过滤方法使用项目的一系列离...

  Python | 使用sklearn进行决策树回归

📅  最后修改于: 2020-02-01 13:34:29        🧑  作者: Mango

决策树是使用类似于流程图的树形结构的决策工具,或者是决策及其所有可能结果(包括结果,投入成本和效用)的模型。决策树算法属于监督学习算法的范畴。它适用于连续和分类输出变量。分支/边表示节点的结果,并且节点具有以下任一项:条件[决策节点]结果[终端节点]分支/边表示语句的真/假,并根据以下示例中的内容进行决策,该示例显示了一个决策树,该决策树评估三个数字中的最小数字:决策树回归:决策树回归观察对象的特...

  使用Python进行主成分分析PCA

📅  最后修改于: 2020-02-01 13:37:19        🧑  作者: Mango

主成分分析PCA是一种统计过程,用于将一组可能相关变量的观测值转换为一组线性不相关变量的值。以这样一种方式选择每个主成分,使得它将描述大多数仍然可用的方差,并且所有这些主成分彼此正交。在所有主成分中,第一个主成分具有最大方差。PCA的用途:它用于查找数据中变量之间的相互关系。它用于解释和可视化数据。随着变量数量的减少,这使得进一步分析变得更加简单。它通常用于可视化群体之间的距离和相关性。这些基本上...