📜  R教程(1)

📅  最后修改于: 2023-12-03 15:04:58.805000             🧑  作者: Mango

R教程

R是一种高级编程语言和环境,用于数据分析、统计计算和可视化。它非常流行,在数据科学、生物统计、社会科学、金融领域等多个领域都被广泛使用。

安装R

你可以到R官网下载R的软件,安装后你就可以使用R命令进入R环境了。

基础语法
变量和运算符

在R中,你可以使用赋值符<-或者等号=来为变量赋值,例如:

x <- 5
y = 10

+-可以进行加减运算,*/可以进行乘除运算,^可以进行幂运算,例如:

x + y # 15
x * y # 50
y / x # 2
x ^ 2 # 25
数据类型

R中常用的数据类型有数字、字符串、向量、矩阵和数据框等。例如:

# 数字
x <- 5
y <- 10.5

# 字符串
s <- "Hello, World!"

# 向量
v <- c(1, 2, 3)

# 矩阵
m <- matrix(c(1, 2, 3, 4), nrow=2, ncol=2)

# 数据框
df <- data.frame(name=c("Alice", "Bob", "Charlie"),
                 age=c(25, 30, 35),
                 weight=c(60.5, 70.0, 80.5))
条件语句和循环

在R中,你可以使用ifelse()函数实现条件语句,例如:

x <- 5
ifelse(x > 10, "x大于10", "x小于等于10")

你也可以使用forwhile循环实现重复执行的语句块,例如:

# for循环
for (i in 1:5) {
  print(i)
}

# while循环
i <- 1
while (i <= 5) {
  print(i)
  i <- i + 1
}
数据处理和可视化

R的优势之一就是数据处理和可视化能力非常强大,它提供了丰富的第三方扩展包来完成各种任务。这里简单介绍一些常用的扩展包。

dplyr

dplyr是一个用于数据处理和操作的扩展包,它提供了多种函数来进行数据筛选、排序、分组、汇总等操作。例如:

library(dplyr)

# 选择指定列
select(df, name, age)

# 条件筛选
filter(df, age > 30)

# 按照年龄排序
arrange(df, age)

# 按照姓名分组并计算平均年龄
group_by(df, name) %>% summarize(avg_age=mean(age))
ggplot2

ggplot2是一个用于数据可视化的扩展包,它提供了各种图形绘制函数,可以绘制各种复杂的图形。例如:

library(ggplot2)

# 绘制散点图
ggplot(df, aes(x=age, y=weight, color=name)) + geom_point()

# 绘制柱状图
ggplot(df, aes(x=name, y=age)) + geom_bar(stat="identity")
总结

R是一个强大的编程语言和环境,它可以用于数据分析、统计计算和可视化。在学习R时,你需要掌握基础语法、常用扩展包和数据处理、可视化等技巧。希望这篇R教程能对你有所帮助!