📅  最后修改于: 2023-12-03 14:46:53.327000             🧑  作者: Mango
R 是一种流行的、面向数据分析的编程语言和环境。它提供了丰富的数据处理、统计分析和可视化工具,被广泛应用于数据科学和统计学领域。
要使用 R,首先需要在你的计算机上安装 R 软件。请按照以下步骤进行安装:
R 的代码可以直接在 R 控制台中输入和执行,也可以保存为 R 脚本文件(以 .R
扩展名结尾),然后使用 R 解释器执行。
打开 R 控制台,可以通过以下方法执行 R 代码:
# 计算 2 加 2
2 + 2
创建一个新的 R 脚本文件(如 my_script.R
),然后在文件中编写 R 代码:
# 打印 "Hello, World!"
print("Hello, World!")
保存文件后,可以通过以下方法运行 R 脚本:
Rscript my_script.R
下面是一个使用 R 进行数据清洗和可视化的示例代码:
# 加载需要的扩展包
library(ggplot2)
library(dplyr)
# 读取数据
data <- read.csv("data.csv")
# 数据处理
cleaned_data <- data %>%
filter(!is.na(column1)) %>%
select(column1, column2) %>%
mutate(column3 = column1 + column2)
# 数据可视化
ggplot(cleaned_data, aes(x = column1, y = column2)) +
geom_point() +
geom_smooth() +
labs(title = "Scatter plot of column1 and column2")
这段代码假设已经有一个名为 data.csv
的数据文件,其中包含了 column1
和 column2
两列数据。它首先加载了 ggplot2
和 dplyr
扩展包,然后读取数据文件。接着对数据进行了清洗和处理,最后使用 ggplot2
扩展包绘制了散点图并添加了标题。