当前位置：首页 > news >正文

【R语言速通】1.数据类型

news 2026/4/11 9:32:29

文章目录

- 0. 变量名
- 1.基本数据类型
- - 1.1 数值型
  - 1.2 整型
  - 1.3 复数型
  - 1.4 逻辑型
  - 1.5 字符型
- 2.复合数据类型
- - 2.1 向量
  - - 向量操作
    - 向量的常用函数
  - 2.2 矩阵
  - - 矩阵操作
    - 矩阵的常用函数
  - 2.3 数组
  - - 数组的操作
    - - 数据的运算
      - 数组的访问
      - 数组的维度操作
    - 数组的常用函数
  - 2.4 数据框
  - - 数据框操作
    - 数据框的常用函数
  - 2.5 列表
  - - 列表的操作
    - 列表的常用函数

0. 变量名

R 语言的有效的变量名称由字母，数字以及点号 . 或下划线 _ 组成

不能以数字和下划线 _开头
. 号开头后面不能跟着数字
区分大小写
不要使用保留名

1.基本数据类型

1.1 数值型

# 一般数值
x <- 10       # 整数(实际存储为浮点数)
y <- 3.14     # 浮点数
# 科学计数（e,E都可以使用）
large_num <- 2.5e6    # 等于 2.5 * 10^6，表示2500000
small_num <- 3.1E-4   # 等于 3.1 * 10^-4，表示0.00031

1.2 整型

和数值型整数的区别就是，整型占往往用的内存更少（4字节，数值型是8字节）

x <- 5L  
y <- -6L

1.3 复数型

# 使用 complex() 函数创建复数
z1 <- complex(real = 3, imaginary = 4) 
# 使用 1i 表示虚数单位
z2 <- 2 + 3i  # 创建复数 2 + 3i

1.4 逻辑型

要大写

x <- TRUE
y <- FALSE

1.5 字符型

text1 <- "Hello, World!"
text2 <- 'R语言字符型'

2.复合数据类型

在这里插入图片描述

2.1 向量

向量是最基本的复合数据类型(一维)，向量中的所有元素必须是相同的数据类型，可以是以下几种

# 数字型向量（Numeric）
numeric_vector <- c(1.5, 2.5, 3.5, 4.5, 5.5)# 字符型向量（Character）
character_vector <- c("a", "b", "c", "d", "e")# 逻辑型向量（Logical）
logical_vector <- c(TRUE, FALSE, TRUE)# 整数型向量（Integer）
integer_vector <- c(1L, 2L, 3L, 4L, 5L)# 复杂型向量（Complex）
complex_vector <- c(1+2i, 3-4i, 5+6i, 7-8i, 9+10i)

可以使用typeof()或class()函数来查看向量的类型：

typeof(numeric_vector)  # 返回 "double"
class(character_vector)  # 返回 "character"

向量操作

元素访问：可以通过索引访问向量的元素（索引从1开始）

numeric_vector[1]  # 返回 1.5

向量运算：可以对向量进行数学运算，这些运算会逐元素执行。

numeric_vector + 2  # 每个元素加2，结果为 c(3.5, 4.5, 5.5, 6.5, 7.5)

逻辑操作：可以对逻辑向量进行与（&）、或（|）操作。

logical_vector & c(TRUE, TRUE, FALSE)  # 结果为 c(TRUE, FALSE, FALSE)

如果长的对象长度是短的对象长度的整倍数，R会将较短的向量自动扩展（重复）以匹配较长的向量。这种特性称为“回收规则”（recycling rule）。

向量的常用函数

length()：返回向量的长度。

sum()：计算向量的所有元素之和（适用于数值向量）。

mean()：计算向量的平均值（适用于数值向量）。

sort()：对向量进行排序。

sort(x, decreasing = FALSE, na.last = TRUE)

x：要排序的向量。
decreasing：逻辑值，默认为 FALSE，表示升序排列；如果为 TRUE，则表示降序排列。
na.last：控制 NA 值的位置，默认为 TRUE，表示将 NA 值放在最后；如果为 FALSE，则将 NA 值放在最前面；如果为 NA，则去除所有 NA 值。

unique()：返回向量中的唯一值，即去重复，类似python中的set作用

2.2 矩阵

矩阵是一个二维的数据结构，它是一个由行和列组成的元素集合，所有元素的类型必须相同。

mat <- matrix(data, nrow=number_of_rows, ncol=number_of_columns, byrow=logical_value)

data: 用于填充矩阵的数据。

nrow: 矩阵的行数。

ncol: 矩阵的列数。

byrow: 是否按行填充（默认为按列填充）

# 创建一个2x3的矩阵，按列填充
mat <- matrix(1:6, nrow = 2, ncol = 3)
print(mat)

     [,1] [,2] [,3]
[1,]    1    3    5
[2,]    2    4    6

矩阵操作

矩阵访问：使用方括号[]来访问矩阵中的元素。格式为matrix[row, col]，其中row表示行，col表示列。

mat[1, 2]  # 访问第一行第二列的元素
mat[1, ] # 选择第一行
mat[, 2] # 选择第二列
mat[1:2, ] # 子矩阵提取

访问的同时也可以修改：matrix[row, col] <- new_value

行列绑定:

rbind(): 按行绑定，将多个矩阵或向量合并为一个矩阵。
cbind(): 按列绑定，将多个矩阵或向量合并为一个矩阵。

# 创建两个矩阵
mat1 <- matrix(1:6, nrow = 2)
mat2 <- matrix(7:12, nrow = 2)# 按行绑定
mat_rbind <- rbind(mat1, mat2)
print(mat_rbind)# 按列绑定
mat_cbind <- cbind(mat1, mat2)
print(mat_cbind)

矩阵运算：

# 创建两个矩阵
mat1 <- matrix(1:4, nrow = 2)
mat2 <- matrix(5:8, nrow = 2)# 矩阵加法
mat_add <- mat1 + mat2
print(mat_add)# 矩阵减法
mat_sub <- mat1 - mat2
print(mat_sub)# 逐元素乘法
mat_mult <- mat1 * mat2
print(mat_mult)# 逐元素除法
mat_div <- mat1 / mat2
print(mat_div)# 矩阵乘法(线性代数)
mat_product <- mat1 %*% mat2
print(mat_product)

矩阵的常用函数

矩阵转置：矩阵的转置将行变为列，列变为行。

# 矩阵转置
mat <- matrix(1:6, nrow = 2)
transposed_mat <- t(mat)
print(transposed_mat)

求逆矩阵：solve()函数用于求解矩阵的逆矩阵，适用于方阵（行数和列数相等）。

# 求逆矩阵
square_mat <- matrix(c(1, 2, 3, 4), nrow = 2)
inverse_mat <- solve(square_mat)
print(inverse_mat)

矩阵的行列式：det()函数计算方阵的行列式。

# 计算行列式
determinant <- det(square_mat)
print(determinant)

矩阵的秩：qr()函数可以用来计算矩阵的秩。

# 矩阵的秩
rank_mat <- qr(square_mat)$rank
print(rank_mat)

特征值和特征向量：eigen()函数计算方阵的特征值和特征向量）。

# 计算特征值和特征向量
eigen_result <- eigen(square_mat)
print(eigen_result$values)    # 特征值
print(eigen_result$vectors)   # 特征向量

2.3 数组

数组是用于存储相同数据类型的多维数据结构。数组与向量类似，但它可以有多个维度，比如二维数组（矩阵）或三维及更高维的数组。

array(data = NA, dim = length(data), dimnames = NULL)

ata：要填充数组的元素（通常是一个向量）。

dim：数组的维度。可以是一个向量，表示每个维度的大小。

dimnames：数组中每个维度的名称（可选）。

data <- 1:18
dim_names <- list(c("Row1", "Row2", "Row3"), c("Col1", "Col2", "Col3"), c("Matrix1", "Matrix2"))
my_array <- array(data, dim = c(3, 3, 2), dimnames = dim_names)
print(my_array)

, , Matrix1Col1 Col2 Col3
Row1    1    4    7
Row2    2    5    8
Row3    3    6    9, , Matrix2Col1 Col2 Col3
Row1   10   13   16
Row2   11   14   17
Row3   12   15   18

数组的操作

数据的运算

与之前的类似，长的对象长度是短的对象长度的整倍数，R会将较短的向量自动扩展（重复）以匹配较长的向量。

# 创建两个3x3x2的数组
array1 <- array(1:18, dim = c(3, 3, 2))
array2 <- array(18:1, dim = c(3, 3, 2))# 加法
sum_array <- array1 + array2# 减法
diff_array <- array1 - array2# 乘法
prod_array <- array1 * array2# 除法
div_array <- array1 / array2# 与标量的运算
scalar_add <- array1 + 5

数组的访问

单个元素的访问：

element <- array1[2, 3, 1]

选择子数组：

sub_array <- array1[,,2]

数组的维度操作

dim()函数：获取或设置数组的维度。

dim(array1) # 获取数组的维度
dim(array1) <- c(9, 2) # 修改数组的维度

dimnames()函数：获取或设置数组的维度名称。

dimnames(array_named) # 获取维度名称
dimnames(array1) <- list(c("A", "B", "C"), c("X", "Y", "Z"), c("M1", "M2")) # 设置维度名称

数组的常用函数

apply()函数：apply()函数可以沿数组的任一维度应用函数（如求和、平均值等）：

apply(X, MARGIN, FUN, ...)

# 创建一个3x3x2的数组
array1 <- array(1:18, dim = c(3, 3, 2))# 沿第一个维度求和
sum_result <- apply(array1, 1, sum)
print(sum_result)# 沿第二个维度计算平均值
mean_result <- apply(array1, 2, mean)
print(mean_result)

2.4 数据框

数据框是一种用于存储表格数据的结构，它的每一列可以包含不同的数据类型（如数值、字符、因子等）。

df <- data.frame(Name = c("Alice", "Bob", "Charlie"),Age = c(25, 30, 35),Salary = c(50000, 55000, 60000)
)

数据框操作

查看数据框结构

str(df)

'data.frame':	3 obs. of  3 variables:$ Name  : chr  "Alice" "Bob" "Charlie"$ Age   : num  25 30 35$ Salary: num  50000 55000 60000

访问数据框中的列

df$Name  # 访问 Name 列, 返回一个向量
df[["Name"]]  # 访问 Name 列, 返回一个向量
df["Name"]  # 访问 Name 列, 返回一个数据框
df[1]  # 访问第 1 列，结果是一个数据框

子集操作

df[1:2, ]  # 选择前两行
df[, 1:2]  # 选择前两列
df[df$Age > 28, ]  # 筛选 Age 大于 28 的行

添加新列

df$Department <- c("HR", "IT", "Finance")  # 使用 $ 符号
df["Experience"] <- c(2, 5, 7)  # 使用 [] 操作符

删除列

df$Department <- NULL  # 删除 Department 列

合并数据框

# 创建另一个数据框
df2 <- data.frame(Name = c("David", "Eva"),Age = c(28, 24),Salary = c(58000, 52000)
)# 按行合并
combined_df <- rbind(df, df2)# 按列合并
combined_df <- cbind(df, Experience = c(2, 5, 7, 3, 4))

数据框的常用函数

·head(df, n) 和 tail(df, n)：查看前 n 行或后 n 行。

·dim(df)：查看数据框的维度（行数和列数）。

·nrow(df) 和 ncol(df)：分别返回行数和列数。

·summary(df)：生成数据框的摘要统计信息。

·merge(df1, df2, by = "column_name")：按列合并两个数据框。

2.5 列表

列表是一种通用的数据结构，可以容纳不同类型的数据对象。列表是R中的一种非常灵活的数据类型，因为它可以包含多种类型的元素，包括向量、矩阵、数据框、甚至其他列表。

my_list <- list(1, "Hello", TRUE) # 创建一个简单的列表my_named_list <- list(Number = 1, Text = "Hello", Logical = TRUE) # 创建一个带有名称的列表nested_list <- list(list(1, 2), list("a", "b")) # 嵌套列表

列表的操作

my_list[[1]] # 访问第一个元素
my_list[1] # 返回一个列表，只包含第一个元素
my_named_list$Text # 访问名为 "Text" 的元素
nested_list[[1]][[2]] # 访问嵌套列表中的第二个元素my_list[[1]] <- 100 # 修改元素
my_list[[4]] <- NULL # 删除元素

列表的常用函数

length(my_list) # 来获取列表的长度
combined_list <- c(my_list, my_named_list)v # 使用c()函数来合并两个或多个列表
is.list(my_list) # 判断一个对象是否是列表

列表和数据框都可以包含不同类型的对象，但列表和数据框的区别是列表是一维和数据框是二维。除此之外，数据框要求每列的长度必须一致（即数据框的行数相同），但列表并不要求每个元素的长度一致。

【R语言速通】1.数据类型

文章目录 0. 变量名1.基本数据类型1.1 数值型1.2 整型1.3 复数型1.4 逻辑型1.5 字符型 2.复合数据类型2.1 向量向量操作向量的常用函数 2.2 矩阵矩阵操作矩阵的常用函数 2.3 数组数组的操作数据的运算数组的访问数组的维度操作数组的常用函数 2.4 数据框数据框操作数据框的常用…...

编程日记 2024/9/5 18:21:40

【C++设计模式】（三）创建型模式：单例模式

文章目录 （三）创建型模式：单例模式饿汉式懒汉式饿汉式 v.s. 懒汉式 （三）创建型模式：单例模式单例模式在于确保一个类只有一个实例，并提供一个全局访问点来访问该实例。在某些情况下&#xff0…...

编程日记 2024/9/5 18:20:39

基于Android Studio的行程记录APK开发指南(三)---界面设计及两种方法获取用户位置

前言本系列教程我们来看看如何使用Android Studio去开发一个APK用于用户的实时行程记录第一期：基于Android Studio的用户行程记录APK开发指南(一)：项目基础配置与速通Kotlin-CSDN博客第二期：基于Android Studio的行程记录APK开发指南(二):…...

编程日记 2024/9/5 18:19:13

大厂趋势：低代码不等于低能力，赋能高效开发新纪元

大厂趋势：低代码不等于低能力，赋能高效开发新纪元在数字化转型的浪潮中，科技巨头（大厂）作为行业的引领者，不断探索和创新，以应对日益复杂多变的市场需求和技术挑战。其中，“低代码…...

编程日记 2024/9/5 18:16:06

CentOS全面停服，国产化提速，央国企信创即时通讯/协同门户如何选型？

01. CentOS停服带来安全新风险， 国产操作系统迎来新的发展机遇 2024年6月30日，CentOS 7版本全面停服，于2014年发布的开源类服务器操作系统——CentOS全系列版本生命周期画上了句号。国内大量基于CentOS开发和适配的服务器及平台&#xff0c…...

编程日记 2024/9/5 18:15:05

如何确定Kubernetes是在采用哪种方式进行部署的？

这里写目录标题 1. 查看 Kubernetes 安装方式的常见文件和工具2. 检查 Kubernetes 的节点信息3. 检查 Kubernetes API 服务器的版本信息4. 检查系统服务和容器5. 查看安装文档或管理员笔记为什么可以确定是 kubeadm 部署？下一步确认如果存在多个master节点&#xf…...

编程日记 2024/9/5 18:14:04

【PostgreSQL】地理空间数据的数据类型定义、索引优化、查询优化策略

PostgreSQL 是开源关系型数据库，对于地理空间数据的处理提供了很好的支持。在处理地理空间数据时，优化索引和查询的性能至关重要，因为地理空间操作通常涉及大量的数据计算和复杂的几何形状比较。一、地理空间数据类型注意geometry和geogra…...

编程日记 2024/9/5 18:11:58

RocketMQ广播消费消息

1、基础概念 RocketMQ 支持两种消息模式：集群消费（ Clustering ）和广播消费（ Broadcasting ）。集群消费模式（Cluster）： 在集群消费模式下，同一个消费者组&#xff08…...

编程日记 2024/9/5 18:10:51

C#基础（2）枚举

前言我们其实在前面已经了解过枚举到底有什么作用，但是那毕竟是概念性的语言，理解起来很抽象，今天我们会具体来讲一讲枚举，并谈一谈它的应用。希望你能从今天的C#基础中有所收获。基本概念 1.枚举：是一个比较特…...

编程日记 2024/9/5 18:08:36

Linux之MySQL日志

前言数据库就像一个庞大的图书馆，而日志则是记录这个图书馆内每一本书的目录。正如在图书馆中找到特定书籍一样，数据库日志帮助我们追溯数据的变更、定位问题和还原状态。在MySQL中，日志是非常重要的一个组成部分，它记录了数据…...

编程日记 2024/9/5 18:07:26

Redis集群模式—主从集群、哨兵集群、分片集群

主从集群主从模式中，包括一个主节点（Master）和一个或多个从节点（Slave）。主节点负责处理所有写操作和读操作，而从节点则复制主节点的数据，并且只能处理读操作。当主节点发生故障时，…...

编程日记 2024/9/5 18:06:22

并发工具类（二）：CyclicBarrier

1、CyclicBarrier 介绍从字面上看 CyclicBarrier 就是一个循环屏障，它也是一个同步助手工具，它允许多个线程在执行完相应的操作后彼此等待共同到达一个屏障点。 CyclicBarrier可以被循环使用，当屏障点值变为0之后，可以在接下来…...

编程日记 2024/9/5 18:04:01

Spring Cloud全解析：负载均衡之Ribbon简介

Ribbon简介 Ribbon是一种客户端的软件负载均衡算法，将Netflix的中间层服务连接在一起，提供了一系列完善的配置如连接超时、重试等，Ribbon会自动的帮助基于某种规则(如简单轮询、随机连接等)去连接那些机器，也可以自定义的负载均衡…...

编程日记 2024/9/5 18:00:57

Kettle安装与使用指南

1. 介绍什么是Kettle？ Kettle，全称Pentaho Data Integration (PDI)，是Pentaho BI套件的一部分。它提供了一个可视化的ETL工具，允许用户通过图形界面设计复杂的数据集成流程。Kettle支持多种数据源，包括关系型数据库…...

编程日记 2024/9/5 17:58:54

教育行业解决方案：智能PPT在教育行业的创新应用

在信息化时代，教育行业面临着巨大的变革。随着人工智能技术的不断发展，传统教学方式正在被重新定义。彩漩科技作为 AI 技术的先行者，推出了歌者 PPT &彩漩 PPT，为教师、学生和家长提供了一种全新的教育体验，实现了…...

编程日记 2024/9/5 17:57:49

Matlab程序练习

Part1 1.求 [100,999] 之间能被 21整除的数的个数。程序： 主文件：main.m clear; start_num 100; end_num 999; div_num 21; res div(start_num,end_num,div_num); fprintf("[%d,%d]之间能被%d整除的数的个数为%d个\n",start_num,end_…...

编程日记 2024/9/5 17:56:48

cesium可不可以改变影像底图颜色，如何给地球底图影像添加一层滤镜蒙版？

废话：你的球是不是很丑？是不是没有科技感？是不是没有好看的影像？ 因果： 因：客户问，底图可不可以改变颜色，想让球更漂亮一些。答：可以改变影像饱和度，透明度…...

编程日记 2024/9/5 17:54:45

MyBatis-MappedStatement什么时候生成？QueryWrapper如何做到动态生成了SQL？

通过XML配置的MappedStatement 这部分MappedStatement主要是由MybatisXMLMapperBuilder进行解析，核心逻辑如下： 通过注解配置的MappedStatement 核心逻辑就在这个里面了： 继承BaseMapper的MappedStatement 我们看看这个类，里…...

编程日记 2024/9/5 17:53:41

Netty系列-2 NioServerSocketChannel和NioSocketChannel介绍

背景本文介绍Netty的通道组件NioServerSocketChannel和NioSocketChannel，从源码的角度介绍其实现原理。 1.NioServerSocketChannel Netty本质是对NIO的封装和增强，因此Netty框架中必然包含了对于ServerSocketChannel的构建、配置以及向选择器注册&am…...

编程日记 2024/9/5 17:51:37

智能客服的四大优势，提升企业服务效率

在这个信息化快速发展的时代，客户服务的重要性越来越凸显。传统的客服方式已经无法满足企业日益增长的服务需求，于是智能客服服务应运而生。智能客服服务不仅改变了企业与客户的互动方式，还提高了服务效率和客户满意度。本文将深入探讨智能客…...

编程日记 2024/9/5 17:50:36

WaveTools鸣潮工具箱：3大核心功能让你告别卡顿，科学抽卡不迷路

WaveTools鸣潮工具箱：3大核心功能让你告别卡顿，科学抽卡不迷路【免费下载链接】WaveTools 🧰鸣潮工具箱项目地址: https://gitcode.com/gh_mirrors/wa/WaveTools 如果你正在玩《鸣潮》PC版，一定经历过游戏卡顿、帧率限制…...

编程新知 2026/4/11 9:23:43

Qwen3-Reranker-0.6B部署优化：如何提升服务响应速度与稳定性？

Qwen3-Reranker-0.6B部署优化：如何提升服务响应速度与稳定性？ 1. 理解Qwen3-Reranker-0.6B的核心特性 1.1 模型架构与性能优势 Qwen3-Reranker-0.6B作为阿里云推出的轻量级重排序模型，基于Qwen3系列架构设计，具有以下显著特点&…...

编程新知 2026/4/11 9:15:38

tao-8k嵌入模型实战：如何用WebUI轻松实现文本语义相似度计算

tao-8k嵌入模型实战：如何用WebUI轻松实现文本语义相似度计算 1. 引言：从文本到向量的魔法你有没有想过，计算机是如何“理解”两句话意思差不多的？比如，“今天天气真好”和“阳光明媚的一天”，我们人类一…...

编程新知 2026/4/11 8:53:07

Twine高级技巧：10个提升故事质量的实用方法

Twine高级技巧：10个提升故事质量的实用方法【免费下载链接】twinejs Twine, a tool for telling interactive, nonlinear stories 项目地址: https://gitcode.com/gh_mirrors/tw/twinejs Twine是一款强大的互动叙事创作工具，让你轻松构建非线性故…...

编程新知 2026/4/11 7:07:43