📜  r 语言 - R 编程语言(1)

📅  最后修改于: 2023-12-03 14:46:53.236000             🧑  作者: Mango

R 编程语言介绍

R 编程语言是一种免费开源的、高级别的编程语言和数据分析工具,广泛应用于统计分析、数据可视化和数据挖掘等领域。R 语言功能强大,有着众多的数据分析库和工具,支持多种数据格式,如 csv、Excel、SQL 数据库等,以及多种图形化输出,如静态和交互式图形。

R 语言的优点
  • 免费开源: R 语言是完全免费的,任何人都可以自由使用和修改它。
  • 功能丰富:R 语言拥有丰富的数据分析、可视化和科学计算函数库,广泛应用于数据科学、统计学、生物信息学、社会科学等领域。
  • 易于学习:R 语言的语法简单易懂,学习曲线平稳,很容易上手。
  • 可扩展性:通过 R 包(package),可以增加各种功能和数据集。
  • 交互式图形:R 语言支持静态和交互式图形,并提供了丰富的数据可视化工具。
R 语言的语法

R 语言的语法遵循 S 语言和 Scheme 语言的传统,使用一系列函数和操作符来进行数据分析和可视化。以下是 R 语言的基本语法:

变量定义
a <- 5
b <- "hello world"
函数定义
my_func <- function(x, y) {
  x + y
}
条件语句
if (a > 0) {
  print("a is positive")
} else {
  print("a is negative")
}
循环语句
for (i in 1:10) {
  print(i)
}

while (a < 10) {
  a <- a + 1
}
R 语言的数据类型

R 语言支持多种数据类型,包括标量、向量、矩阵、数组、列表、数据框等。以下是 R 语言的数据类型:

标量
a <- 5   # 整数
b <- 3.2 # 浮点数
c <- TRUE # 布尔值
d <- "hello world" # 字符串
向量
a <- c(1, 2, 3, 4, 5) # 整型向量
b <- c(2.3, 4.5, 6.7) # 浮点型向量
c <- c(TRUE, FALSE, TRUE) # 布尔型向量
d <- c("apple", "orange", "banana") # 字符串向量
矩阵
a <- matrix(1:12, nrow=3) # 3行4列的矩阵
数组
a <- array(1:24, dim=c(3, 4, 2)) # 3行4列2深度的数组
列表
a <- list("apple", 5, TRUE) # 包含字符串、整数和布尔值的列表
数据框
a <- data.frame(name=c("Alice", "Bob", "Charlie"), age=c(28, 35, 42))  # 2列3行的数据框
R 语言的数据分析

R 语言拥有丰富的数据分析函数和包,以下是 R 语言的基本数据分析操作:

导入数据
my_data <- read.csv("mydata.csv")
数据可视化
library(ggplot2)
ggplot(my_data, aes(x=x_var, y=y_var)) + geom_point()
描述性统计
summary(my_data)
建立模型
my_model <- lm(y ~ x1 + x2, data=my_data)
预测
new_data <- data.frame(x1=5, x2=3)
predict(my_model, new_data)
R 语言的扩展

R 语言可以通过编写 R 包(package)来扩展功能和数据集,以下是 R 包的制作方法:

创建 R 包
library(devtools)
create("my_package")
添加函数
my_func <- function(x, y) {
  x + y
}
构建 R 包
library(devtools)
document()
build()
安装 R 包
library(devtools)
install()