如何在 R 中使用 sum函数?
在本文中,我们将讨论如何在 R 编程语言中使用 sum()函数。
sum()函数:用于返回给定数据的总和
Syntax:
sum(data)
Arguments:
- data can be a vector or a dataframe
示例 1:使用 sum()函数计算向量元素的总和
在这种方法中,用户必须简单地调用 sum()函数,将参数作为数字向量传递,该函数将返回 R 语言函数中存在的所有整数的总和。
句法:
sum(vector_name)
其中,vector_name:要计算总和的数值向量的名称。
示例 1:
在此示例中,我们将在 R 语言中找到从 1 到 20 的 20 个元素的向量中给定值的总和。
R
# create vector
data=c(1:20)
# get the sum
sum(data)
R
# create dataframe with 3 columns
data=data.frame(col1=c(1:20),col2=c(21:40),
col3=c(41:60))
# get the sum of column1
sum(data$col1)
# get the sum of column2
sum(data$col2)
# get the sum of column3
sum(data$col3)
R
# create dataframe with 3 columns
data=data.frame(col1=c(1:20),col2=c(21:40),col3=c(41:60))
# get the sum of three columns
sapply(data[ , c('col1', 'col2','col3')], sum)
R
# create a vector
data=c(NA,NA,1,2,3,4,5,6,NA,NA)
# get the sum
sum(data,na.rm=TRUE)
R
# load the package
library(dplyr)
# create a dataframe with 3 columns
data=data.frame(col1=c(1:5),col2=c(21:25),col3=c(41:45))
# get sum of first and third column
data%>%rowwise() %>%mutate(Total_Sum = sum(c(col1,col3)))
R
# load the package
library(dplyr)
# create a dataframe with 3 columns
data=data.frame(col1=c("java","java","php","python","python"),
col2=c(21:25),col3=c(41:45))
# get sum of third column by group with first column
aggregate(data$col3, by= list(data$col1), FUN=sum)
输出:
[1] 210
示例 2:使用 sum()函数计算数据框列的总和
在这种计算数据框列的总和的方法中,用户必须调用 sum函数,并将数据框列的名称作为参数传递,这将返回所有提到的整数元素的总和在给定的列中。
句法:
sum(dataframe$column)
在哪里,
- 数据框:数据框的名称
- column:要计算总和的数据框列的名称
示例 2:
在这个例子中,我们将计算数据框列中给定值的总和,其中包含 3 列,我们将在 R 语言中分别找到前三列中的总和。
R
# create dataframe with 3 columns
data=data.frame(col1=c(1:20),col2=c(21:40),
col3=c(41:60))
# get the sum of column1
sum(data$col1)
# get the sum of column2
sum(data$col2)
# get the sum of column3
sum(data$col3)
输出:
[1] 210
[1] 610
[1] 1010
示例 3:使用 sum()函数计算多列的总和
在这种计算多列总和的方法中,用户必须调用 sapply()函数,并将 sum 参数放入 in 中,并将向量中提到的所需列的名称作为该函数的参数,进一步这将导致以 R 编程语言传递给用户的所有倍数列的总和。
语法:
sapply(dataframe[ , c('column1', 'column2',.,'column n)], sum)
例子:
在此示例中,我们将创建一个包含 3 列的数据框,并使用 sapply()函数一次查找三列的总和。
R
# create dataframe with 3 columns
data=data.frame(col1=c(1:20),col2=c(21:40),col3=c(41:60))
# get the sum of three columns
sapply(data[ , c('col1', 'col2','col3')], sum)
输出:
col1 col2 col3
210 610 1010
示例 4:使用 sum()函数计算具有 NA 值的向量元素的总和
在这种方法中,我们将使用 sum()函数和给定向量中存在的 NA(不是数字)值。在这里,用户必须在函数中传递 na.rm 参数以删除所有存在的 NA 值并仅计算给定向量中存在的整数的总和,进一步这将返回仅存在于中的所有整数的总和给定的向量。
语法:
sum(vector,na.rm=TRUE)
例子:
在这个例子中,我们将首先创建一个包含 10 个元素的向量,其中包括 4 个 NA 值,然后在 sum()函数和 na.rm 参数的帮助下,我们将计算向量中存在的元素的总和。
R
# create a vector
data=c(NA,NA,1,2,3,4,5,6,NA,NA)
# get the sum
sum(data,na.rm=TRUE)
输出:
[1] 21
示例 5:使用 sum()函数计算数据帧的逐行总和
在这种方法中,用户需要安装并导入 dplyr 包,这里这个包负责将其功能的访问权提供给用户,然后用户需要使用 sum函数来欺骗下面给出的 suntax 以获得行使用 R 编程语言中的 mutate()函数对结果求和并将结果存储在另一个新列中。
语法:
data%>%rowwise() %>%mutate(new_column = sum(c(columns)))
在哪里,
- 数据是输入数据框
- columns 是执行求和运算的列
安装和导入 dplyr 包的语法:
install.package("dplyr")
library("dplyr")
例子:
在此示例中,我们将创建一个包含 3 列的数据框,并使用 R 语言中的 sum 和 mutate()函数添加第一列和第三列。
R
# load the package
library(dplyr)
# create a dataframe with 3 columns
data=data.frame(col1=c(1:5),col2=c(21:25),col3=c(41:45))
# get sum of first and third column
data%>%rowwise() %>%mutate(Total_Sum = sum(c(col1,col3)))
输出:
示例 6:使用 sum()函数按组计算列的总和
在这种通过数据框组计算列总和的方法中,用户需要安装并导入 dplyr 包,然后从 dplyr 包中调用聚合函数,并在其中传递所需的参数,这里通过聚合函数将在一列中进行分组数据,然后使用 sum()函数计算 R 语言中分组列的总和。
安装和导入 dplyr 包的语法:
install.package("dplyr")
library("dplyr")
Syntax:
aggregate(dataframe$column_name, by= list(dataframe$group_column), FUN=sum)
where
- dataframe is the input dataframe
- column_name is the column to get sum
- group_column is the column to be grouped
- FUN specifies sum parameter to get sum operation
例子:
在此示例中,我们将查看 R 程序以创建三列并执行求和运算,以使用 R 语言中的 aggregate()函数按组计算列的总和。
R
# load the package
library(dplyr)
# create a dataframe with 3 columns
data=data.frame(col1=c("java","java","php","python","python"),
col2=c(21:25),col3=c(41:45))
# get sum of third column by group with first column
aggregate(data$col3, by= list(data$col1), FUN=sum)
输出: