在 R 中使用 dplyr 包跨多行和多列求和
在本文中,我们将看到如何使用 R 编程语言中的 Dplyr 包对多个行和列求和。
dplyr 包用于通过执行操作和转换在数据中执行模拟。可以使用以下命令将其安装到工作空间中:
install.packages("dplyr")
计算行总和
R 中的 is.na() 方法用于检查变量值是否等于 NA。这很重要,因为大多数具有 NA 值的算术运算的结果是 NA。 R 中的 replace() 方法可用于替换数据框中变量的值。此方法应用于输入数据框的所有单元格,并在找到的任何地方与 0 交换。
Syntax: replace(data, replace-val)
然后将 mutate() 方法应用于输出数据帧,通过修改数据帧的结构来修改数据帧的结构。可以在现有数据框中添加或修改新的列或行。新列名可以在方法参数中提及并分配给预定义的 R函数。
Syntax: mutate(new-col-name = rowSums(.))
rowSums() 方法用于计算每行的总和,然后将值附加到指定的新列名下的每行末尾。论据。用于将函数应用于数据帧的所有单元格。
Syntax: rowSums(.)
代码:
R
library("dplyr")
# creating a data frame
data_frame <- data.frame(col1 = c(NA,2,3,4),
col2 = c(1,2,NA,0),
col3 = c(5,6,7,8)
)
print("Original DataFrame")
print(data_frame)
# eliminating NA values
data_without_na <- data_frame %>%
replace(is.na(.), 0)
print("Row Wise Sum")
data_mod <- data_without_na%>%
mutate(sum_of_rows = rowSums(.))
print(data_mod)
R
library("dplyr")
# creating a data frame
data_frame <- data.frame(col1 = c(NA,2,3,4),
col2 = c(1,2,NA,0),
col3 = c(5,6,7,8)
)
print("Original DataFrame")
print(data_frame)
# eliminating NA values
data_without_na <- data_frame %>%
replace(is.na(.), 0)
print("Column Wise Sum")
# computing column wise sum
data_mod <- data_without_na%>%
summarise_all(sum)
# printing final output
print(data_mod)
输出:
计算列总和
NA 值(如果存在)可以使用 R 中的 replace() 方法从数据帧中删除。接着,数据帧会受到一个方法 summarise_all() 的影响,该方法应用于数据帧中的每个变量。它将函数sum 作为参数来计算数据框每一列的总和。
Syntax: summarise_all (sum)
代码:
电阻
library("dplyr")
# creating a data frame
data_frame <- data.frame(col1 = c(NA,2,3,4),
col2 = c(1,2,NA,0),
col3 = c(5,6,7,8)
)
print("Original DataFrame")
print(data_frame)
# eliminating NA values
data_without_na <- data_frame %>%
replace(is.na(.), 0)
print("Column Wise Sum")
# computing column wise sum
data_mod <- data_without_na%>%
summarise_all(sum)
# printing final output
print(data_mod)
输出: