Python - 芒果文档

📅 最后修改于: 2020-02-01 06:53:49 🧑 作者: Mango

Pandas是最流行的用于数据分析的Python库之一。它使用完全用C或Python编写的后端源代码提供了高度优化的性能。我们可以使用以下方法分析熊猫中的数据：SeriesDataFramesSeries:Series是在熊猫中定义的一维(1-D)数组，可用于存储任何数据类型。代码1：创建Series在这里，数据可以是：标量值，其可以是integerValue，stringPython的字典，可以...

Python | 使用pandas.read_csv()读取csv

📅 最后修改于: 2020-02-01 06:56:08 🧑 作者: Mango

Python是进行数据分析的一种出色语言，主要是因为以数据为中心的Python软件包具有奇妙的生态系统。Pandas是其中的一种，使导入和分析数据更加容易。导入 Pandas：代码＃1：read_csv是重要的pandas函数，用于读取csv文件并对其进行操作。通过此操作轻松打开CSV文件。但是还有很多其他事情可以通过此函数来完成，以完全更改返回的对象。例如，不仅可以在本地读取csv文件，还可以通...

Python | 使用Panda合并，联接和连接DataFrame

📅 最后修改于: 2020-02-01 06:57:32 🧑 作者: Mango

数据帧是具有多个行和列的二维数据结构。在数据框中，数据仅以行和列的形式对齐。数据帧可以执行算术运算和条件运算。它的大小可变。下面是使用Numpy和Pandas的实现。所需模块：代码＃1：DataFrames串联concat()函数完成了沿一个轴执行串联操作的所有繁重工作，同时在其他轴上执行了索引(如果有)的可选设置逻辑(联合或相交)。输出：代码2：DataFrames合并Pandas提供了一个单一...

Python | 使用Pandas.drop()从DataFrame删除行/列

📅 最后修改于: 2020-02-01 07:00:10 🧑 作者: Mango

Python是进行数据分析的一种出色语言，主要是因为以数据为中心的Python软件包具有奇妙的生态系统。Pandas是其中的一种，使导入和分析数据更加容易。Pandas为数据分析人员提供了一种使用.drop()方法删除和过滤数据帧的方法。使用此方法，可以使用索引标签或列名删除行或列。语法：参数：labels：引用行或列名称的字符串或字符串列表。axis：整数或字符串值，“ 0″用于行，“ 1″用于...

Python | Pandas数据比较与选择

📅 最后修改于: 2020-02-01 07:02:54 🧑 作者: Mango

Python是进行数据分析的一种出色语言，主要是因为以数据为中心的Python软件包具有奇妙的生态系统。Pandas是其中的一种，使导入和分析数据更加容易。数据分析中最重要的事情是比较值并相应地选择数据。“ ==”运算符也适用于Pandas数据框中的多个值。以下两个示例将说明如何比较和选择“熊猫数据”框架中的数据。要下载使用的CSV文件，请单击此处。示例1：比较数据在以下示例中，从csv文件创建数...

线性回归(Python实现)

📅 最后修改于: 2020-02-01 07:05:09 🧑 作者: Mango

本文讨论了线性回归的基础知识及其在Python编程语言中的实现。线性回归是一种统计方法，用于对因变量与给定的一组自变量之间的关系进行建模。注意：在本文中，为简单起见，我们将因变量称为响应，将自变量称为函数。为了提供对线性回归的基本了解，我们从线性回归的最基本版本开始，即简单线性回归。简单线性回归简单线性回归是一种使用单个特征预测响应的方法。假定两个变量线性相关。因此，我们尝试找到一个线性函数，该线...

使用Tensorflow进行线性回归

📅 最后修改于: 2020-02-01 07:08:31 🧑 作者: Mango

先决条件在使用Tensorflow实施线性回归之前，我们将简要总结一下线性回归。由于我们不会涉及线性回归或Tensorflow的详细信息，请阅读以下文章以了解更多详细信息：线性回归(Python实现)线性回归的简要概述线性回归是一种非常普遍的统计方法，它使我们能够从给定的连续数据集中学习函数或关系。例如，我们给出的一些数据点x和相应的y，我们需要学习他们之间的关系的假说。在线性回归的情况下，假设是...

了解逻辑回归 Python实现

📅 最后修改于: 2020-02-01 07:10:36 🧑 作者: Mango

先决条件：线性回归本文讨论Logistic回归的基本知识及其在Python中的实现。逻辑回归基本上是一种监督分类算法。在分类问题中，目标变量(或输出)y对于给定的一组特征(或输入)X只能采用离散值。与普遍的看法相反，逻辑回归是一种回归模型。该模型构建回归模型，以预测给定数据条目属于编号为“ 1″的类别的概率。就像线性回归假设数据遵循线性函数一样，逻辑回归也使用S型函数对数据进行建模。仅当将决策阈值...

K means聚类Python–简介

📅 最后修改于: 2020-02-01 08:07:38 🧑 作者: Mango

我们获得了具有某些特征的项目数据集，以及这些特征的值(如矢量)。任务是将这些项目归类。为了达到这个目的，我们将使用kMeans算法。一种无监督的学习算法。总览(如果您将项目视为n维空间中的点，它将很有帮助)。该算法会将项目分类为k个相似度组。为了计算相似度，我们将使用欧式距离作为度量。该算法的工作原理如下：首先，我们随机初始化k个点，称为均值。我们将每个项目归类到最接近的均值，并更新均值的坐标，这...

在Python中使用K-Means聚类分析测试数据

📅 最后修改于: 2020-02-01 08:22:48 🧑 作者: Mango

本文演示了使用open-cv库在样本随机数据上进行K均值聚类的示例。先决条件：Numpy让我们首先使用matplot-lib工具可视化具有多项函数。这里的“ Z”是一个大小为100的数组，值的范围从0到255。现在，将“ z”reshape为列向量。如果存在多个功能，它将更加有用。然后将数据更改为np.float32类型。输出：现在，将k-Means聚类算法应用于上述测试数据中的示例，并查看其行为...

ML | Python无监督人脸聚类管线

📅 最后修改于: 2020-02-01 13:15:28 🧑 作者: Mango

实时面部识别是自动化安全部门仍然面临的问题。随着卷积神经网络的发展以及CNN特别创新的方式，已经证实，使用我们当前的技术，我们可以选择监督学习的选择，例如FaceNet，YOLO，以便在现实环境中进行快速和实时的人脸识别。要训练监督模型，我们需要获取目标标签的数据集，这仍然是一项繁琐的任务。我们需要一种高效且自动化的解决方案，用于数据集的生成，而用户干预所需的标记工作却很少。拟议的解决方案简介...

Python中的多维数据分析

📅 最后修改于: 2020-02-01 13:19:54 🧑 作者: Mango

多维数据分析是对数据的信息分析，其中考虑了许多关系。让我们阐明一些使用Python编写的开源库来分析多维/多元数据的基本技术。从此处找到用于说明的数据的链接。以下代码用于从zoo_data.csv读取2D表格数据。输出：注意：我们这里拥有的数据类型通常是分类的。本案例研究中用于分类数据分析的技术是非常基本的技术，易于理解，解释和实施。其中包括聚类分析，相关性分析，PCA(主成分分析)和EDA(探索...

Python | 电影推荐系统的实现

📅 最后修改于: 2020-02-01 13:28:21 🧑 作者: Mango

推荐系统是一种试图根据用户的选择来预测或过滤偏好的系统。推荐系统广泛用于电影，音乐，新闻，书籍，研究文章，搜索查询，社交标签和产品等各个领域。推荐系统以两种方式中的任何一种产生建议列表：协作过滤：协作过滤方法根据用户过去的行为(即用户购买或搜索的商品)以及其他用户做出的类似决策来构建模型。然后，此模型用于预测用户可能感兴趣的项目(或项目的评级)。基于内容的过滤：基于内容的过滤方法使用项目的一系列离...

Python | 使用sklearn进行决策树回归

📅 最后修改于: 2020-02-01 13:34:29 🧑 作者: Mango

决策树是使用类似于流程图的树形结构的决策工具，或者是决策及其所有可能结果(包括结果，投入成本和效用)的模型。决策树算法属于监督学习算法的范畴。它适用于连续和分类输出变量。分支/边表示节点的结果，并且节点具有以下任一项：条件[决策节点]结果[终端节点]分支/边表示语句的真/假，并根据以下示例中的内容进行决策，该示例显示了一个决策树，该决策树评估三个数字中的最小数字：决策树回归：决策树回归观察对象的特...

使用Python进行主成分分析PCA

📅 最后修改于: 2020-02-01 13:37:19 🧑 作者: Mango

主成分分析PCA是一种统计过程，用于将一组可能相关变量的观测值转换为一组线性不相关变量的值。以这样一种方式选择每个主成分，使得它将描述大多数仍然可用的方差，并且所有这些主成分彼此正交。在所有主成分中，第一个主成分具有最大方差。PCA的用途：它用于查找数据中变量之间的相互关系。它用于解释和可视化数据。随着变量数量的减少，这使得进一步分析变得更加简单。它通常用于可视化群体之间的距离和相关性。这些基本上...