📝 Python教程中的逻辑回归
15篇技术文档📅  最后修改于: 2020-12-13 13:59:33        🧑  作者: Mango
Logistic回归是对象分类的一种统计方法。在本教程中,我们将重点介绍使用逻辑回归技术解决二进制分类问题。本教程还提供了一个案例研究,可让您学习如何在Python编码和应用Logistic回归。本教程已为学生和专业人士准备,以获取有关在Python执行Logistic回归的知识。先决条件本教程的编写假设是学习者熟悉Python及其库,例如Pandas,Numpy和Matplotlib。如果您不熟...
📅  最后修改于: 2020-12-13 13:59:57        🧑  作者: Mango
Logistic回归是对象分类的一种统计方法。本章将通过一些示例介绍逻辑回归。分类要了解逻辑回归,您应该知道分类的含义。让我们考虑以下示例以更好地理解这一点-医生将肿瘤分类为恶性或良性。银行交易可能是欺诈性的或真实的。多年来,人类一直在执行此类任务-尽管它们容易出错。问题是我们可以训练机器为我们更好地完成这些任务吗?这样的机器进行分类的示例是您机器上的电子邮件客户端,该电子邮件客户端将所有传入邮件...
📅  最后修改于: 2020-12-13 14:00:22        🧑  作者: Mango
考虑到一家银行会与您联系,开发一种机器学习应用程序,这将帮助他们确定可能与他们一起开立定期存款(某些银行也称为定期存款)的潜在客户。银行定期通过电话或网络表格进行调查,以收集有关潜在客户的信息。该调查本质上是一般性的,针对的受众非常广泛,其中许多人可能不愿与该银行本身打交道。在其余的帐户中,只有少数几个有兴趣开设定期存款。其他人可能会对银行提供的其他服务感兴趣。因此,不一定需要进行调查来识别开通T...
📅  最后修改于: 2020-12-13 14:00:43        🧑  作者: Mango
在本章中,我们将详细了解设置项目以在Python执行逻辑回归的过程。安装Jupyter我们将使用Jupyter-机器学习最广泛使用的平台之一。如果您的计算机上未安装Jupyter,请从此处下载。对于安装,您可以按照其网站上的说明安装平台。正如该站点所建议的那样,您可能更喜欢使用Python附带的Anaconda Distribution和用于科学计算和数据科学的许多常用Python软件包。这将减少...
📅  最后修改于: 2020-12-13 14:01:15        🧑  作者: Mango
本章详细讨论了获取数据以在Python中执行逻辑回归的步骤。下载数据集如果尚未下载前面提到的UCI数据集,请立即从此处下载。单击数据文件夹。您将看到以下屏幕-通过单击给定的链接下载bank.zip文件。压缩文件包含以下文件-我们将使用bank.csv文件进行模型开发。 bank-names.txt文件包含您稍后将需要的数据库描述。 bank-full.csv包含更大的数据集,您可以将其用于更高级的...
📅  最后修改于: 2020-12-13 14:01:48        🧑  作者: Mango
每当任何组织进行调查时,他们都会尝试从客户那里收集尽可能多的信息,以为该信息在以后的某个时间点将以一种或另一种方式对组织有用。为了解决当前的问题,我们必须选择与我们的问题直接相关的信息。显示所有字段现在,让我们看看如何选择对我们有用的数据字段。在代码编辑器中运行以下语句。您将看到以下输出-输出显示数据库中所有列的名称。最后一列“ y”是布尔值,指示此客户是否在银行有定期存款。该字段的值为“ y”或...
📅  最后修改于: 2020-12-13 14:02:32        🧑  作者: Mango
为了创建分类器,我们必须以分类器构建模块要求的格式准备数据。我们通过进行一次热编码来准备数据。编码数据我们将在短期内讨论编码数据的含义。首先,让我们运行代码。在代码窗口中运行以下命令。如评论所述,以上语句将创建数据的一种热编码。让我们看看它创造了什么?通过在数据库中打印头记录来检查称为“数据”的创建数据。您将看到以下输出-为了理解上述数据,我们将通过运行data.columns命令列出列名称,如下...
📅  最后修改于: 2020-12-13 14:03:01        🧑  作者: Mango
我们有大约四万一千条记录。如果我们将全部数据用于模型构建,则不会剩下任何数据用于测试。因此,通常,我们将整个数据集分为两个部分,例如70/30百分比。我们将70%的数据用于模型构建,其余的用于测试预测所创建模型的准确性。您可以根据需要使用不同的拆分比率。创建特征数组在拆分数据之前,我们将数据分为两个数组X和Y。X数组包含我们要分析的所有要素(数据列),Y数组是布尔值的一维数组,是布尔值的输出预测。...
📅  最后修改于: 2020-12-13 14:03:24        🧑  作者: Mango
不需要您必须从头开始构建分类器。建筑物分类器很复杂,并且需要一些领域的知识,例如统计,概率论,优化技术等等。市场上有几种预构建的库,这些库对这些分类器进行了全面测试并且非常有效。我们将使用sklearn中的一种这样的预构建模型。sklearn分类器从sklearn工具箱创建Logistic回归分类器很简单,并且在单个程序语句中完成,如下所示-创建分类器后,您会将训练数据输入分类器,以便它可以调整其...
📅  最后修改于: 2020-12-13 14:03:48        🧑  作者: Mango
在投入生产使用之前,我们需要测试上面创建的分类器。如果测试表明模型不符合期望的精度,我们将不得不返回上述过程,选择另一组特征(数据字段),再次构建模型并进行测试。这将是一个迭代步骤,直到分类器满足您的所需精度要求为止。因此,让我们测试分类器。预测测试数据为了测试分类器,我们使用在较早阶段生成的测试数据。我们在创建的对象上调用预报方法,并传递测试数据的X数组,如以下命令所示-这将为整个训练数据集生成...
📅  最后修改于: 2020-12-13 14:04:05        🧑  作者: Mango
从上面的示例中可以看出,将逻辑回归应用于机器学习并不是一项艰巨的任务。但是,它有其自身的局限性。逻辑回归将无法处理大量分类特征。在到目前为止讨论的示例中,我们在很大程度上减少了特征数量。但是,如果这些功能在我们的预测中很重要,我们将不得不将它们包括在内,但是逻辑回归将无法为我们提供良好的准确性。 Logistic回归也容易过拟合。它不能应用于非线性问题。在与目标不相关且彼此相关的自变量下,其性能会...
📅  最后修改于: 2020-12-13 14:04:24        🧑  作者: Mango
Logistic回归是二进制分类的一种统计技术。在本教程中,您学习了如何训练机器以使用逻辑回归。创建机器学习模型时,最重要的要求是数据的可用性。没有足够的相关数据,您将无法简单地学习机器。拥有数据后,下一个主要任务是清除数据,消除不需要的行,字段,并为模型开发选择适当的字段。完成此操作后,您需要将数据映射为分类器训练所需的格式。因此,数据准备是任何机器学习应用程序中的主要任务。一旦准备好数据,就可...
📅  最后修改于: 2020-12-13 14:08:03        🧑  作者: Mango
Logistic回归是对象分类的一种统计方法。本章将通过一些示例介绍逻辑回归。分类要了解逻辑回归,您应该知道分类的含义。让我们考虑以下示例以更好地理解这一点-医生将肿瘤分类为恶性或良性。银行交易可能是欺诈性的或真实的。多年来,人类一直在执行此类任务-尽管它们容易出错。问题是我们可以训练机器为我们更好地完成这些任务吗?这样的机器进行分类的示例是您机器上的电子邮件客户端,该电子邮件客户端将所有传入邮件...
📅  最后修改于: 2020-12-13 14:08:22        🧑  作者: Mango
以下资源包含有关PythonLogistic回归的其他信息。请使用它们来获得有关此方面的更深入的知识。Python逻辑回归的有用链接Logistic回归在Python– logistic回归的在Python维基百科参考。关于Python逻辑回归的实用书籍要在此页面上注册您的网站,请发送电子邮件至...
📅  最后修改于: 2020-12-13 14:08:34        🧑  作者: Mango
Logistic回归是对象分类的一种统计方法。在本教程中,我们将重点介绍使用逻辑回归技术解决二进制分类问题。本教程还提供了一个案例研究,可让您学习如何在Python编码和应用Logistic回归。...