📝 R教程
107篇技术文档📅  最后修改于: 2021-01-08 09:57:23        🧑  作者: Mango
R条形图条形图是一种图形表示形式,其中变量的数值由等宽度的线或矩形的长度或高度表示。条形图用于汇总一组分类数据。在条形图中,数据通过矩形条显示,矩形条的长度与变量的值成比例。在R中,我们可以创建条形图以高效地可视化数据。为此,R提供了barplot()函数,该函数具有以下语法:S.NoParameterDescription1.HA vector or matrix which contains ...
📅  最后修改于: 2021-01-08 09:58:21        🧑  作者: Mango
R箱图箱线图是衡量数据在整个数据集中的分布情况的一种度量。这将数据集分为三个四分位数。该图表示数据集中的最小,最大,平均值,第一四分位数和第三四分位数。在通过为每个数据集绘制一个箱形图来比较数据集中数据的分布时,箱形图也很有用。R提供了一个boxplot()函数来创建一个boxplot。 boxplot()函数具有以下语法:这里,S.NoParameterDescription1.xIt is a...
📅  最后修改于: 2021-01-08 09:59:18        🧑  作者: Mango
R直方图直方图是一种条形图,它显示与一组值范围进行比较的值的数量的频率。直方图用于分布,而条形图用于比较不同实体。在直方图中,每个条形表示给定范围内存在的值的数量的高度。为了创建直方图,R提供了hist()函数,该函数将向量作为输入并使用更多参数来添加更多功能。 hist()函数具有以下语法:这里,S.NoParameterDescription1.vIt is a vector that con...
📅  最后修改于: 2021-01-08 10:00:13        🧑  作者: Mango
R线图折线图是随时间连续变化的信息的图形表示。折线图也可以称为折线图。在折线图中,有些点连接数据以显示连续变化。折线图中的线可以根据数据上下移动。我们可以使用折线图比较不同的事件,信息和情况。折线图用于通过在点之间绘制线段来连接一系列点。折线图用于识别数据趋势。对于线图构造,R提供了plot()函数,该函数具有以下语法:这里,S.NoParameterDescription1.vIt is a v...
📅  最后修改于: 2021-01-08 10:01:22        🧑  作者: Mango
R散点图散点图用于比较变量。当我们需要定义一个变量受另一变量影响的程度时,需要对变量进行比较。在散点图中,数据表示为点的集合。散点图上的每个点都定义了两个变量的值。垂直轴选择一个变量,水平轴选择另一个变量。在R中,有两种创建散点图的方法,即使用plot()函数和使用ggplot2包的函数。在R中创建散点图有以下语法:这里,S.NoParametersDescription1.xIt is the ...
📅  最后修改于: 2021-01-08 10:02:21        🧑  作者: Mango
线性回归线性回归用于基于一个或多个输入预测变量x预测结果变量y的值。换句话说,线性回归用于在预测变量和响应变量之间建立线性关系。在线性回归中,预测变量和响应变量通过方程式关联,其中两个变量的指数均为1。在数学上,当绘制为图形时,线性关系表示一条直线。有以下用于线性回归的一般数学方程式:这里,y是一个响应变量。x是一个预测变量。a和b是称为系数的常数。建立回归的步骤一个人的身高已知时对体重的预测就是...
📅  最后修改于: 2021-01-08 10:03:16        🧑  作者: Mango
R-多元线性回归多元线性回归是简单线性回归的扩展,它用于基于多个不同的预测变量(x)预测结果变量(y)。借助于三个预测变量(x1,x2,x3),使用以下公式来表示y的预测:y = b0+ b1* x1+ b2* x2+ b3* x3“ b”值表示回归权重。他们测量结果与预测变量之间的关联。 ”要么多元线性回归是线性回归在两个以上变量之间的关系中的扩展。在简单的线性回归中,我们有一个预测变量和一个响...
📅  最后修改于: 2021-01-08 10:04:12        🧑  作者: Mango
R逻辑回归在逻辑回归中,拟合了回归曲线y = f(x)。在回归曲线方程中,y是类别变量。该回归模型用于预测y给定了一组预测变量x。因此,预测变量可以是分类的,连续的或两者的混合。逻辑回归是一种属于非线性回归的分类算法。该模型用于将给定的二进制结果(1/0,是/否,是/否)预测为一组独立变量。此外,它有助于使用虚拟变量表示分类/二进制结果。Logistic回归是一种回归模型,其中响应变量具有分类值,...
📅  最后修改于: 2021-01-08 10:05:11        🧑  作者: Mango
R泊松回归泊松回归模型用于对以结果为计数的事件进行建模。计数数据是具有非负整数值的离散数据,该整数值对事物进行计数,例如杂货店排队的人数或在给定时间范围内事件发生的次数。我们还可以将计数数据定义为费率数据。这样就可以将事件在时间范围内发生的次数表示为原始计数或比率。泊松回归使我们能够确定哪个解释变量(x值)影响给定的响应变量(y值,计数或比率)。例如,杂货店可以实施泊松回归以更好地理解并预测连续的...
📅  最后修改于: 2021-01-08 10:06:08        🧑  作者: Mango
R正态分布在从独立来源随机收集数据时,通常可以看到数据分布是正常的。这意味着,如果在水平轴上绘制变量值并在垂直轴上计数值的图形,则将得到钟形曲线。曲线中心代表数据集的平均值。在图中,百分之五十的值位于平均值的左侧。其余50%位于图表的右侧。这称为正态分布。R允许我们通过提供以下函数来生成正态分布:这些函数可以具有以下参数:S.NoParameterDescription1.xIt is a vec...
📅  最后修改于: 2021-01-08 10:07:05        🧑  作者: Mango
二项分布二项式分布也称为离散概率分布,用于发现事件成功的概率。在一系列实验中,该事件只有两个可能的结果。抛硬币是二项式分布的最好例子。抛硬币时,它的正面或反面都可以。在二项式分布过程中,发现将三枚硬币反复抛十次时恰好找到三个正头的可能性是近似的。R允许我们通过提供以下函数来创建二项式分布:这些函数可以具有以下参数:S.NoParameterDescription1.xIt is a vector ...
📅  最后修改于: 2021-01-08 10:08:07        🧑  作者: Mango
R分类分类算法的思想非常简单。我们通过分析训练数据集来预测目标类别。我们使用训练数据集获得更好的边界条件,这些条件可用于确定每个目标类别。确定边界条件后,下一个任务是预测目标类别。整个过程称为分类。分类算法有一些要点:分类器这是一种将输入数据映射到特定类别的算法。分类模型分类模型试图从给出的用于训练的输入值中得出一些结论。该结论将预测新数据的类别标签/类别。功能这是正在观察的事件的单个可测量属性。...
📅  最后修改于: 2021-01-08 10:09:18        🧑  作者: Mango
R时间序列分析在规则的时间间隔内测量的任何度量标准都会创建一个时间序列。由于工业上的必要性和相关性,时间序列的分析在商业上很重要,尤其是在预测(需求,供应和销售等)方面。其中每个数据点都与时间戳关联的一系列数据点称为时间序列。一天中股票在不同时间点的价格是时间序列的最简单示例。一年中不同月份降雨量的另一个例子。 R提供了几个用于创建,处理和绘制时间序列数据的函数。在R对象中,时间序列数据称为时间序...
📅  最后修改于: 2021-01-08 10:10:33        🧑  作者: Mango
R-随机森林随机森林也称为决策树森林。它是流行的基于决策树的集成模型之一。这些模型的准确性高于其他决策树。该算法可用于分类和回归应用。在一个随机森林中,我们创建了大量决策树,并且在每个决策树中,每个观察结果都得到反馈。最终输出是每个观察结果最常见的结果。通过向所有树木提供新的观察结果,我们为每种分类模型投了多数票。对于在构造树时未使用的情况进行了错误估计。这被称为袋外(OOB)错误估计,以百分比表...
📅  最后修改于: 2021-01-08 10:11:31        🧑  作者: Mango
R中的T检验在统计中,T检验是最常见的检验之一,用于确定两组的平均值是否相等。该测试的假设是,两组均从具有相同波动的正态分布中采样。零假设是两个均值是相同的,而替代假设是它们不相同。众所周知,在原假设下,我们可以计算出t统计量,该统计量将遵循t分布为n1 + n2-2个自由度。在R中,存在多种类型的T检验,例如一个样本和Welch T检验。 R提供了t.test()函数,该函数提供了多种T检验。不...