R 备忘清单

该备忘单提供了使用 R 语言的示例,涵盖 R 语言基础知识、控制流、类型、结构/类、运算符、函数方法等

入门

获取帮助

访问帮助文件

?mean
# 获取特定功能的帮助
help.search('weighted mean')
# 在帮助文件中搜索单词或短语
help(package = 'dplyr')
# 查找软件包的帮助。

有关对象的更多信息

str(iris)
# 获取对象结构的摘要
class(iris)
# 查找对象所属的类

下载和使用库

install.packages('dplyr')
# 从 CRAN 下载并安装软件包
install.packages(“BiocManager”)
library(BiocManager)
BiocManager::install("dplyr")
# 使用Bioconductor的BiocManager包下载并安装软件包
devtools::install_github("clusterProfiler")
# 直接从github中下载并安装软件包
library(dplyr)
# 将包加载到会话中,使所有其功能可供使用
dplyr::select
# 使用包中的特定函数
data(iris)
# 将内置数据集加载到环境中。

工作目录

查找当前工作目录(其中找到输入并发送输出)

getwd()

更改当前工作目录

setwd(‘C://file/path’)

使用 RStudio 中的项目来设置工作目录到您正在使用的文件夹

基础入门

变量和赋值

x <- 10   # 使用箭头赋值
y = 20    # 或者直接使用等号赋值

数据类型

numeric_var <- 3.14   # 数值型
character_var <- "hello"  # 字符串
logical_var <- TRUE   # 逻辑型

向量和列表

# 向量
numeric_vector <- c(1, 2, 3, 4)
character_vector <- c("apple", "orange", "banana")

# 列表
my_list <- list(name = "John", age = 30, city = "New York")

向量和操作

# 创建向量
numbers <- c(1, 2, 3, 4, 5)
# 计算向量的和
sum_result <- sum(numbers)
# 计算向量的平均值
mean_result <- mean(numbers)

数据框(Data Frame)

my_df <- data.frame(name = c("John", "Alice"), age = c(30, 25))

# 创建数据框
student_data <- data.frame(
  name = c("John", "Alice", "Bob"),
  age = c(25, 23, 22),
  grade = c("A", "B", "C")
)

# 显示数据框
print(student_data)

函数

# 定义函数
add_numbers <- function(a, b) {
  result <- a + b
  return(result)
}

# 调用函数
sum_result <- add_numbers(10, 5)

条件语句

if (x > 0) {
  print("Positive")
} else {
  print("Non-positive")
}

for 循环语句

for (i in 1:5) {
  print(i)
}

while 循环

counter <- 1
while (counter <= 5) {
  print(counter)
  counter <- counter + 1
}

数据读取和输出

# 读取数据
my_data <- read.csv("data.csv")
# 输出数据
write.csv(my_data, "output.csv")

清理工作空间

# 清空所有变量
rm(list = ls())
# 退出 R
q()

图形绘制

散点图

plot(x, y)

直方图

hist(data)

线图

plot(x, y, type = "l")

绘制散点图

x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 5, 6, 7)
plot(x, y, main = "Scatter Plot", xlab = "X-axis", ylab = "Y-axis")

绘制直方图

data <- c(1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 5)
hist(data, main = "Histogram", xlab = "Value", col = "lightblue")

绘制折线图

x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 5, 6, 7)
plot(x, y, type = "l", main = "Line Plot", xlab = "X-axis", ylab = "Y-axis")

向量

创建向量

:---
c(2, 4, 6)2 4 6将元素连接成向量
2:62 3 4 5 6整数序列
seq(2, 3, by=0.5)2.0 2.5 3.0复杂的序列
rep(1:2, times=3)1 2 1 2 1 2重复向量
rep(1:2, each=3)1 1 1 2 2 2重复向量的元素

选择向量元素

按位置

:--
x[4]第四个元素
x[-4]除了第四个之外的所有
x[2:4]元素二到四
x[-(2:4)]除二到四之外的所有元素
x[c(1, 5)]元素一和元素五

按值

:--
x[x == 10]等于 10 的元素
x[x < 0]所有元素小于零
x[x %in% c(1, 2, 5)]集合 1, 2, 5 中的元素

命名向量

:--
x['apple']名为“apple”的元素。

重复向量的元素

:--
sort(x)返回排序后的 x
rev(x)返回 x 的反转
table(x)查看值的计数
unique(x)查看唯一值

另见