📝 R教程

107篇技术文档
  R-因素

📅  最后修改于: 2020-11-29 07:45:46        🧑  作者: Mango

因子是用于对数据进行分类并将其存储为级别的数据对象。它们可以存储字符串和整数。它们在唯一值数量有限的列中很有用。像“男”,“女”和“真”,“假”等。它们在统计建模的数据分析中很有用。通过将向量作为输入,使用factor()函数创建因子。例现场演示当我们执行以上代码时,它产生以下结果-数据框架中的因素在使用文本数据列创建任何数据框时,R会将文本列视为分类数据并在其上创建因子。现场演示当我们执行以上代...

  R-数据框

📅  最后修改于: 2020-11-29 07:46:14        🧑  作者: Mango

数据帧是表或二维数组状结构,其中每一列包含一个变量的值,每一行包含来自每一列的一组值。以下是数据帧的特征。列名应为非空。行名应该是唯一的。存储在数据框中的数据可以是数字,因子或字符类型。每列应包含相同数量的数据项。创建数据框现场演示当我们执行以上代码时,它产生以下结果-获取数据框的结构可以使用str()函数查看数据帧的结构。现场演示当我们执行以上代码时,它产生以下结果-数据框中的数据摘要统计摘要和...

  R-套件

📅  最后修改于: 2020-11-29 07:46:42        🧑  作者: Mango

R包是R函数,编译后的代码和示例数据的集合。它们存储在R环境中的一个名为“库”的目录下。默认情况下,R在安装过程中安装一组软件包。当出于某些特定目的需要它们时,会在以后添加更多软件包。当我们启动R控制台时,默认情况下仅默认软件包可用。已安装的其他软件包必须显式加载,以供将要使用它们的R程序使用。R软件包中列出了所有可用R语言提供的软件包。以下是用于检查,验证和使用R软件包的命令列表。检查可用的R包...

  R-数据重塑

📅  最后修改于: 2020-11-29 07:47:16        🧑  作者: Mango

R中的数据重塑是关于改变数据组织成行和列的方式。大多数时候,R中的数据处理都是通过将输入数据作为数据帧来完成的。从数据帧的行和列中提取数据很容易,但是在某些情况下,我们需要的数据帧格式与接收数据的格式不同。 R具有许多功能,可将数据帧中的行拆分,合并和更改为列,反之亦然。连接数据框中的列和行我们可以使用cbind()函数将多个向量连接起来以创建数据帧。我们也可以使用rbind()函数合并两个数据帧...

  R-CSV文件

📅  最后修改于: 2020-11-29 07:47:50        🧑  作者: Mango

在R中,我们可以从R环境外部存储的文件中读取数据。我们还可以将数据写入文件,这些文件将由操作系统存储和访问。 R可以读写各种文件格式,例如csv,excel,xml等。在本章中,我们将学习从csv文件读取数据,然后将数据写入csv文件。该文件应存在于当前工作目录中,以便R可以读取它。当然,我们也可以设置自己的目录并从中读取文件。获取和设置工作目录您可以使用getwd()函数检查R工作区指向的目录。...

  R-Excel文件

📅  最后修改于: 2020-11-29 07:48:09        🧑  作者: Mango

Microsoft Excel是使用最广泛的电子表格程序,以.xls或.xlsx格式存储数据。 R可以使用某些excel特定软件包直接从这些文件中读取。很少有这样的软件包-XLConnect,xlsx,gdata等。我们将使用xlsx软件包。 R也可以使用此程序包写入excel文件。安装xlsx软件包您可以在R控制台中使用以下命令来安装“ xlsx”软件包。它可能会要求安装此软件包所依赖的其他一些...

  R-二进制文件

📅  最后修改于: 2020-11-29 07:48:31        🧑  作者: Mango

二进制文件是仅包含以位和字节(0和1)形式存储的信息的文件。它们不是人类可读的,因为其中的字节会转换为包含许多其他不可打印字符的字符和符号。尝试使用任何文本编辑器读取二进制文件都会显示Ø和ð等字符。二进制文件必须由特定程序读取才能使用。例如,Microsoft Word程序的二进制文件只能由Word程序读取为人类可读的形式。这表明,除了人类可读的文本外,还有很多信息,例如字符格式和页码等,这些信息...

  R-XML文件

📅  最后修改于: 2020-11-29 07:48:59        🧑  作者: Mango

XML是一种文件格式,它使用标准ASCII文本在Internet,Intranet和其他地方共享文件格式和数据。它代表可扩展标记语言(XML)。与HTML相似,它包含标记标签。但是与HTML的markup标签描述页面结构不同,在xml中,markup标签描述文件中包含的数据的含义。您可以使用“ XML”包读取R中的xml文件。可以使用以下命令安装此软件包。输入数据通过将以下数据复制到文本编辑器(如...

  R-JSON文件

📅  最后修改于: 2020-11-29 07:49:18        🧑  作者: Mango

JSON文件以人类可读格式将数据存储为文本。 Json代表JavaScript对象表示法。 R可以使用rjson包读取JSON文件。安装rjson包在R控制台中,您可以发出以下命令来安装rjson软件包。输入数据通过将以下数据复制到文本编辑器(如记事本)中来创建JSON文件。保存扩展名为.json的文件,然后选择文件类型为所有文件(*。*)。读取JSON文件R使用JSON()中的函数读取JSON文...

  R-Web数据

📅  最后修改于: 2020-11-29 07:49:36        🧑  作者: Mango

许多网站提供供用户使用的数据。例如,世界卫生组织(WHO)以CSV,txt和XML文件的形式提供有关健康和医疗信息的报告。使用R程序,我们可以以编程方式从此类网站中提取特定数据。 R中用于从Web抓取数据的某些软件包是-“ RCurl”,XML”和“ stringr”,它们用于连接到URL,标识文件的必需链接并将其下载到本地环境。安装R包需要以下软件包来处理URL以及指向文件的链接。如果它们在R环...

  R-数据库

📅  最后修改于: 2020-11-29 07:50:05        🧑  作者: Mango

数据是关系数据库系统以规范化格式存储的。因此,要进行统计计算,我们将需要非常高级和复杂的Sql查询。但是R可以很容易地连接到许多关系数据库,例如MySql,Oracle,Sql server等,并从它们中获取记录作为数据帧。一旦数据在R环境中可用,它就会变成普通的R数据集,并且可以使用所有强大的软件包和功能来进行操纵或分析。在本教程中,我们将使用MySql作为连接到R的参考数据库。RMySQL包R...

  R-饼图

📅  最后修改于: 2020-11-29 07:50:28        🧑  作者: Mango

R编程语言具有大量的库来创建图表。饼图是值的表示形式,是具有不同颜色的圆的一部分。切片被标记,并且每个切片对应的数字也显示在图表中。在R中,使用pie()函数创建饼形图,该函数将正数作为向量输入。附加参数用于控制标签,颜色,标题等。句法使用R创建饼图的基本语法是-以下是所用参数的描述-x是一个向量,其中包含饼图中使用的数值。标签用于对切片进行描述。radius表示饼图的圆的半径。(值介于-1和+1...

  R-条形图

📅  最后修改于: 2020-11-29 07:50:49        🧑  作者: Mango

条形图以矩形条形表示数据,其长度与变量值成比例。 R使用函数barplot()创建条形图。 R可以在条形图中绘制垂直条和水平条。在条形图中,每个条都可以指定不同的颜色。句法在R中创建条形图的基本语法是-以下是所用参数的描述-H是包含在条形图中使用的数值的向量或矩阵。xlab是x轴的标签。ylab是y轴的标签。主要是条形图的标题。names.arg是出现在每个条形下方的名称的向量。col用于为图表中...

  R-箱线图

📅  最后修改于: 2020-11-29 07:51:11        🧑  作者: Mango

箱线图是衡量数据集中数据分布程度的一种方法。它将数据集分为三个四分位数。该图表示数据集中的最小,最大,中位数,第一四分位数和第三四分位数。通过为每个数据集绘制箱形图来比较数据在数据集之间的分布,这也很有用。通过使用boxplot()函数在R中创建箱线图。句法在R中创建箱线图的基本语法是-以下是所用参数的描述-x是向量或公式。data是数据帧。缺口是一个逻辑值。设置为TRUE将绘制一个凹口。varw...

  R-直方图

📅  最后修改于: 2020-11-29 07:51:29        🧑  作者: Mango

直方图表示存储在范围内的变量的值的频率。直方图类似于酒吧聊天,但不同之处在于它将值分为连续的范围。直方图中的每个条形表示该范围内存在的值的数量的高度。R使用hist()函数创建直方图。此函数将向量作为输入,并使用更多参数来绘制直方图。句法使用R创建直方图的基本语法是-以下是所用参数的描述-v是包含直方图中使用的数值的向量。main表示图表标题。col用于设置条形的颜色。border用于设置每个条的...