📝 Python Pandas教程

33篇技术文档
  Python Pandas教程

📅  最后修改于: 2020-11-06 05:34:15        🧑  作者: Mango

Pandas是经过BSD许可的开源Python库,为Python编程语言提供了高性能,易于使用的数据结构和数据分析工具。带有Pandas的Python被广泛用于包括学术,商业领域在内的各个领域,包括金融,经济学,统计,分析等。在本教程中,我们将学习Python Pandas的各种功能以及如何在实践中使用它们。本教程是为那些想要学习熊猫的基础知识和各种功能的人准备的。这对于从事数据清理和分析工作的人...

  Python Pandas-简介

📅  最后修改于: 2020-11-06 05:34:36        🧑  作者: Mango

Pandas是一个开放源代码的Python库,利用其强大的数据结构提供了高性能的数据处理和分析工具。熊猫这个名字来源于“面板数据”一词-来自多维数据的计量经济学。2008年,开发人员Wes McKinney在需要高性能,灵活的数据分析工具时开始开发熊猫。在Pandas之前, Python主要用于数据处理和准备。它对数据分析的贡献很小。熊猫解决了这个问题。使用Pandas,无论数据的来源如何,我们都...

  Python Pandas-环境设置

📅  最后修改于: 2020-11-06 05:34:53        🧑  作者: Mango

标准Python发行版未与Pandas模块捆绑在一起。一种轻量级的替代方法是使用流行的Python软件包安装程序pip安装NumPy。如果您安装Anaconda Python软件包,则默认情况下将使用以下命令安装Pandas-视窗Anaconda(来自https://www.continuum.io)是SciPy堆栈的免费Python发行版。它还适用于Linux和Mac。Canopy(https:...

  数据结构简介

📅  最后修改于: 2020-11-06 05:35:18        🧑  作者: Mango

熊猫处理以下三个数据结构-系列数据框面板这些数据结构建立在Numpy数组之上,这意味着它们非常快。尺寸说明考虑这些数据结构的最佳方法是,高维数据结构是其低维数据结构的容器。例如,DataFrame是Series的容器,Panel是DataFrame的容器。Data StructureDimensionsDescriptionSeries11D labeled homogeneous array, ...

  Python Pandas-系列

📅  最后修改于: 2020-11-06 05:36:04        🧑  作者: Mango

系列是一维标记的数组,能够保存任何类型的数据(整数,字符串,浮点数, Python对象等)。轴标签统称为索引。熊猫系列熊猫系列可以使用以下构造函数创建-构造函数的参数如下-Sr.NoParameter & Description1datadata takes various forms like ndarray, list, constants2indexIndex values must be ...

  Python熊猫-DataFrame

📅  最后修改于: 2020-11-06 05:37:12        🧑  作者: Mango

数据框是二维数据结构,即,数据以表格形式在行和列中对齐。DataFrame的功能潜在的列是不同类型的大小–可变标记的轴(行和列)可以对行和列执行算术运算结构体让我们假设我们正在使用学生的数据创建一个数据框架。您可以将其视为SQL表或电子表格数据表示形式。熊猫.DataFrame可以使用以下构造函数创建pandas DataFrame-构造函数的参数如下-Sr.NoParameter & Descr...

  Python Pandas-面板

📅  最后修改于: 2020-11-06 05:37:39        🧑  作者: Mango

面板是3D数据容器。面板数据一词是从计量经济学派生而来的,部分原因是名称pandas-pan(el)-da(ta)-s。3个轴的名称旨在为描述涉及面板数据的操作提供某种语义上的含义。他们是-项目-轴0,每个项目都对应一个包含在其中的DataFrame。major_axis-轴1,它是每个DataFrame的索引(行)。minor_axis-轴2,它是每个DataFrame的列。pandas.Pan...

  Python Pandas-基本功能

📅  最后修改于: 2020-11-06 05:38:59        🧑  作者: Mango

到目前为止,我们了解了三个Pandas DataStructures以及如何创建它们。由于它在实时数据处理中的重要性,因此我们将主要关注DataFrame对象,并讨论其他一些DataStructures。系列基本功能Sr.No.Attribute orMethod & Description1axesReturns a list of the row axis labels2dtypeReturn...

  Python Pandas-描述性统计

📅  最后修改于: 2020-11-06 05:39:45        🧑  作者: Mango

大量方法共同在DataFrame上计算描述性统计信息和其他相关操作。其中大多数是聚合,例如sum(),mean(),但是其中一些聚合(例如sumsum())会产生相同大小的对象。一般而言,这些方法采用轴参数,就像ndarray。{sum,std,…}一样,但是轴可以通过名称或整数指定DataFrame-“索引”(轴= 0,默认值),“列”(轴= 1)让我们创建一个DataFrame并在本章中使用此...

  Python Pandas-函数应用程序

📅  最后修改于: 2020-11-06 05:40:13        🧑  作者: Mango

要将您自己的或另一个库的功能应用于Pandas对象,您应该了解这三种重要方法。该方法已在下面讨论。使用的适当方法取决于您的函数希望对整个DataFrame进行操作,还是按行或按列,或者按元素进行操作。逐表函数应用程序:pipe()行或列明智功能应用程序:apply()元素明智的功能应用程序:applymap()逐表函数应用可以通过传递函数和适当数量的参数作为管道参数来执行自定义操作。因此,对整个D...

  Python Pandas-重新索引

📅  最后修改于: 2020-11-06 05:40:42        🧑  作者: Mango

重新索引会更改DataFrame的行标签和列标签。重新索引是指使数据与特定轴上的一组给定标签匹配。通过索引可以完成多个操作,例如-重新排序现有数据以匹配一组新标签。在标签数据不存在的标签位置插入缺失值(NA)标记。例现场演示其输出如下-重新索引以与其他对象对齐您可能希望获取一个对象并为其轴重新索引,使其标记为与另一个对象相同。考虑以下示例以了解相同的内容。例现场演示其输出如下-注意-在这里,df1...

  Python Pandas-迭代

📅  最后修改于: 2020-11-06 05:41:10        🧑  作者: Mango

在Pandas对象上进行基本迭代的行为取决于类型。在Series上进行迭代时,它被视为类似于数组,并且基本迭代会生成值。其他数据结构(如DataFrame和Panel)遵循类似dict的约定,即在对象的键上进行迭代。简而言之,基本迭代(对于对象中的i)产生-系列-值DataFrame-列标签面板-项目标签迭代一个DataFrame迭代DataFrame会给出列名。让我们考虑以下示例以了解相同的情况...

  Python Pandas-排序

📅  最后修改于: 2020-11-06 05:41:36        🧑  作者: Mango

熊猫有两种排序方式。他们是-按标签按实际值让我们考虑一个带有输出的示例。其输出如下-在unsorted_df中,标签和值未排序。让我们看看如何对它们进行排序。按标签使用sort_index()方法,通过传递轴参数和排序顺序,可以对DataFrame进行排序。默认情况下,对行标签按升序进行排序。其输出如下-排序顺序通过将布尔值传递给升序参数,可以控制排序的顺序。让我们考虑以下示例以了解相同的情况。其...

  Python Pandas-使用文本数据

📅  最后修改于: 2020-11-06 05:42:36        🧑  作者: Mango

在本章中,我们将使用基本的Series / Index讨论字符串操作。在随后的章节中,我们将学习如何在DataFrame上应用这些字符串函数。Pandas提供了一组字符串函数,可以轻松地对字符串数据进行操作。最重要的是,这些函数忽略(或排除)缺少的/ NaN值。几乎所有的这些方法使用Python字符串函数工作(参见:HTTPS://文档Python.ORG / 3 /库/ stdtypes.htm...

  Python Pandas-选项和自定义

📅  最后修改于: 2020-11-06 05:43:06        🧑  作者: Mango

熊猫提供API来自定义其行为的某些方面,显示是最常用的。该API由五个相关功能组成。他们是-get_option()set_option()reset_option()describe_option()option_context()现在让我们了解功能如何运行。get_option(参数)get_option接受单个参数并返回以下输出中给出的值-display.max_rows显示默认值的数量。解...