📜  Python图形语法简介

📅  最后修改于: 2022-05-13 01:55:29.584000             🧑  作者: Mango

Python图形语法简介

图形语法基本上是一种工具,使我们能够描述给定图形的组件。基本上,这使我们能够看到命名图形之外的内容(散点图,仅举一个例子),并且基本上可以看到它背后的基本统计数据。图形的语法最初是由 Leland Wilkinson 在 1990 年代引入的,并由 Hadley Wickham 用ggplot 推广

图形语法的组成部分

通常,要构建或描述具有一个或多个维度的任何可视化,我们可以使用如下组件。

  • 数据
    数据是图形语法的重要组成部分。毕竟,它包含了我们需要可视化的所有信息。因此,重要的是要知道数据的格式是什么,以及我们正在使用什么信息。

  • 基本上,层是您在现实生活中也可以关联的东西。我们可以将图层视为包含图形的透明薄片,可以以多种方式排列和组合。
  • 几何
    geom的可视化显示称为geom。一个几何图形可以是一条线、一个点,甚至是一个条形图、饼图等。我们可以通过“分层”几何图形来显示很多信息。
  • 缩放数据
    重新缩放我们的数据非常有用。缩放数据不会改变数据,也就是说,它只是改变了数据集的观点。

这种图形语法最初是在 R 中引入的,使用的是 ggplot 和 ggplot2。考虑到它过去的成功,它也在Python中作为 plotnine 引入。

Python绑定

plotnine是Python中图形语法的实现/绑定。它基于ggplot2。所以,基本上,如果你熟悉 R 编程和 ggplot2,你很可能会很快赶上 plotnine。 ggplot2 和 plotnine 中只有 2 个明显的变化。

  • 在 R 中,加号表示继续到下一行的代码/指令。但是,如果我们在Python中做同样的事情,它会抛出一个异常。为了涵盖这一点,在 plotnine 中,加号之前的表达式用大括号括起来,因此可以这样使用。
  • 列名必须是字符串。这更有可能是 R 的一个特性,您可以将列名作为函数参数传递,而无需将其括在引号中。但是,在Python中,如果单词没有用双引号或单引号括起来,它会将单词视为变量。

安装

这个模块没有内置在Python中。要安装此模块,请在终端中键入以下命令。

pip install plotnine 

注意:这是以下示例中使用的 CSV 文件的链接:dataset.csv

示例 1:

Python3
import pandas as pd
from plotnine import *
 
 
# load dataset
dataset = pd.read_csv("dataset.csv")
 
# ggplot is to plot the given data
(ggplot(dataset, aes(x = "area_0", y = "area_1"))+
    geom_point()
)
 
# aes contains parameters which work
# as x-axis and y-axis for the given plot
# geom.point() makes the data entries as points


Python3
import pandas as pd
from plotnine import *
 
 
# load dataset
dataset = pd.read_csv("dataset.csv")
 
(ggplot(dataset, aes(x = "area_0", y = "area_1"))+
    geom_point(color = "label", alpha = 0.7,
               size = 0.5)
)


输出:

示例 2:

Python3

import pandas as pd
from plotnine import *
 
 
# load dataset
dataset = pd.read_csv("dataset.csv")
 
(ggplot(dataset, aes(x = "area_0", y = "area_1"))+
    geom_point(color = "label", alpha = 0.7,
               size = 0.5)
)

输出: