【R语言速通】1.数据类型
文章目录
- 0. 变量名
- 1.基本数据类型
- 1.1 数值型
- 1.2 整型
- 1.3 复数型
- 1.4 逻辑型
- 1.5 字符型
- 2.复合数据类型
- 2.1 向量
- 向量操作
- 向量的常用函数
- 2.2 矩阵
- 矩阵操作
- 矩阵的常用函数
- 2.3 数组
- 数组的操作
- 数据的运算
- 数组的访问
- 数组的维度操作
- 数组的常用函数
- 2.4 数据框
- 数据框操作
- 数据框的常用函数
- 2.5 列表
- 列表的操作
- 列表的常用函数
0. 变量名
R 语言的有效的变量名称由字母,数字以及点号 . 或下划线 _ 组成
- 不能以数字和下划线 _开头
.号开头后面不能跟着数字- 区分大小写
- 不要使用保留名
1.基本数据类型
1.1 数值型
# 一般数值
x <- 10 # 整数(实际存储为浮点数)
y <- 3.14 # 浮点数
# 科学计数(e,E都可以使用)
large_num <- 2.5e6 # 等于 2.5 * 10^6,表示2500000
small_num <- 3.1E-4 # 等于 3.1 * 10^-4,表示0.00031
1.2 整型
和数值型整数的区别就是,整型占往往用的内存更少(4字节,数值型是8字节)
x <- 5L
y <- -6L
1.3 复数型
# 使用 complex() 函数创建复数
z1 <- complex(real = 3, imaginary = 4)
# 使用 1i 表示虚数单位
z2 <- 2 + 3i # 创建复数 2 + 3i
1.4 逻辑型
要大写
x <- TRUE
y <- FALSE
1.5 字符型
text1 <- "Hello, World!"
text2 <- 'R语言字符型'
2.复合数据类型

2.1 向量
向量是最基本的复合数据类型(一维),向量中的所有元素必须是相同的数据类型,可以是以下几种
# 数字型向量(Numeric)
numeric_vector <- c(1.5, 2.5, 3.5, 4.5, 5.5)# 字符型向量(Character)
character_vector <- c("a", "b", "c", "d", "e")# 逻辑型向量(Logical)
logical_vector <- c(TRUE, FALSE, TRUE)# 整数型向量(Integer)
integer_vector <- c(1L, 2L, 3L, 4L, 5L)# 复杂型向量(Complex)
complex_vector <- c(1+2i, 3-4i, 5+6i, 7-8i, 9+10i)
可以使用typeof()或class()函数来查看向量的类型:
typeof(numeric_vector) # 返回 "double"
class(character_vector) # 返回 "character"
向量操作
元素访问:可以通过索引访问向量的元素(索引从1开始)
numeric_vector[1] # 返回 1.5
向量运算:可以对向量进行数学运算,这些运算会逐元素执行。
numeric_vector + 2 # 每个元素加2,结果为 c(3.5, 4.5, 5.5, 6.5, 7.5)
逻辑操作:可以对逻辑向量进行与(&)、或(|)操作。
logical_vector & c(TRUE, TRUE, FALSE) # 结果为 c(TRUE, FALSE, FALSE)
如果长的对象长度是短的对象长度的整倍数,R会将较短的向量自动扩展(重复)以匹配较长的向量。这种特性称为“回收规则”(recycling rule)。
向量的常用函数
length():返回向量的长度。
sum():计算向量的所有元素之和(适用于数值向量)。
mean():计算向量的平均值(适用于数值向量)。
sort():对向量进行排序。
sort(x, decreasing = FALSE, na.last = TRUE)
x:要排序的向量。decreasing:逻辑值,默认为FALSE,表示升序排列;如果为TRUE,则表示降序排列。na.last:控制NA值的位置,默认为TRUE,表示将NA值放在最后;如果为FALSE,则将NA值放在最前面;如果为NA,则去除所有NA值。
unique():返回向量中的唯一值,即去重复,类似python中的set作用
2.2 矩阵
矩阵是一个二维的数据结构,它是一个由行和列组成的元素集合,所有元素的类型必须相同。
mat <- matrix(data, nrow=number_of_rows, ncol=number_of_columns, byrow=logical_value)
data: 用于填充矩阵的数据。
nrow: 矩阵的行数。
ncol: 矩阵的列数。
byrow: 是否按行填充(默认为按列填充)
# 创建一个2x3的矩阵,按列填充
mat <- matrix(1:6, nrow = 2, ncol = 3)
print(mat)
[,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
矩阵操作
矩阵访问:使用方括号[]来访问矩阵中的元素。格式为matrix[row, col],其中row表示行,col表示列。
mat[1, 2] # 访问第一行第二列的元素
mat[1, ] # 选择第一行
mat[, 2] # 选择第二列
mat[1:2, ] # 子矩阵提取
访问的同时也可以修改:
matrix[row, col] <- new_value
行列绑定:
rbind(): 按行绑定,将多个矩阵或向量合并为一个矩阵。cbind(): 按列绑定,将多个矩阵或向量合并为一个矩阵。
# 创建两个矩阵
mat1 <- matrix(1:6, nrow = 2)
mat2 <- matrix(7:12, nrow = 2)# 按行绑定
mat_rbind <- rbind(mat1, mat2)
print(mat_rbind)# 按列绑定
mat_cbind <- cbind(mat1, mat2)
print(mat_cbind)
矩阵运算:
# 创建两个矩阵
mat1 <- matrix(1:4, nrow = 2)
mat2 <- matrix(5:8, nrow = 2)# 矩阵加法
mat_add <- mat1 + mat2
print(mat_add)# 矩阵减法
mat_sub <- mat1 - mat2
print(mat_sub)# 逐元素乘法
mat_mult <- mat1 * mat2
print(mat_mult)# 逐元素除法
mat_div <- mat1 / mat2
print(mat_div)# 矩阵乘法(线性代数)
mat_product <- mat1 %*% mat2
print(mat_product)
矩阵的常用函数
矩阵转置:矩阵的转置将行变为列,列变为行。
# 矩阵转置
mat <- matrix(1:6, nrow = 2)
transposed_mat <- t(mat)
print(transposed_mat)
求逆矩阵:solve()函数用于求解矩阵的逆矩阵,适用于方阵(行数和列数相等)。
# 求逆矩阵
square_mat <- matrix(c(1, 2, 3, 4), nrow = 2)
inverse_mat <- solve(square_mat)
print(inverse_mat)
矩阵的行列式:det()函数计算方阵的行列式。
# 计算行列式
determinant <- det(square_mat)
print(determinant)
矩阵的秩:qr()函数可以用来计算矩阵的秩。
# 矩阵的秩
rank_mat <- qr(square_mat)$rank
print(rank_mat)
特征值和特征向量:eigen()函数计算方阵的特征值和特征向量)。
# 计算特征值和特征向量
eigen_result <- eigen(square_mat)
print(eigen_result$values) # 特征值
print(eigen_result$vectors) # 特征向量
2.3 数组
数组是用于存储相同数据类型的多维数据结构。数组与向量类似,但它可以有多个维度,比如二维数组(矩阵)或三维及更高维的数组。
array(data = NA, dim = length(data), dimnames = NULL)
ata:要填充数组的元素(通常是一个向量)。
dim:数组的维度。可以是一个向量,表示每个维度的大小。
dimnames:数组中每个维度的名称(可选)。
data <- 1:18
dim_names <- list(c("Row1", "Row2", "Row3"), c("Col1", "Col2", "Col3"), c("Matrix1", "Matrix2"))
my_array <- array(data, dim = c(3, 3, 2), dimnames = dim_names)
print(my_array)
, , Matrix1Col1 Col2 Col3
Row1 1 4 7
Row2 2 5 8
Row3 3 6 9, , Matrix2Col1 Col2 Col3
Row1 10 13 16
Row2 11 14 17
Row3 12 15 18
数组的操作
数据的运算
与之前的类似,长的对象长度是短的对象长度的整倍数,R会将较短的向量自动扩展(重复)以匹配较长的向量。
# 创建两个3x3x2的数组
array1 <- array(1:18, dim = c(3, 3, 2))
array2 <- array(18:1, dim = c(3, 3, 2))# 加法
sum_array <- array1 + array2# 减法
diff_array <- array1 - array2# 乘法
prod_array <- array1 * array2# 除法
div_array <- array1 / array2# 与标量的运算
scalar_add <- array1 + 5
数组的访问
单个元素的访问:
element <- array1[2, 3, 1]
选择子数组:
sub_array <- array1[,,2]
数组的维度操作
dim()函数:获取或设置数组的维度。
dim(array1) # 获取数组的维度
dim(array1) <- c(9, 2) # 修改数组的维度
dimnames()函数:获取或设置数组的维度名称。
dimnames(array_named) # 获取维度名称
dimnames(array1) <- list(c("A", "B", "C"), c("X", "Y", "Z"), c("M1", "M2")) # 设置维度名称
数组的常用函数
apply()函数:apply()函数可以沿数组的任一维度应用函数(如求和、平均值等):
apply(X, MARGIN, FUN, ...)
# 创建一个3x3x2的数组
array1 <- array(1:18, dim = c(3, 3, 2))# 沿第一个维度求和
sum_result <- apply(array1, 1, sum)
print(sum_result)# 沿第二个维度计算平均值
mean_result <- apply(array1, 2, mean)
print(mean_result)
2.4 数据框
数据框是一种用于存储表格数据的结构,它的每一列可以包含不同的数据类型(如数值、字符、因子等)。
df <- data.frame(Name = c("Alice", "Bob", "Charlie"),Age = c(25, 30, 35),Salary = c(50000, 55000, 60000)
)
数据框操作
查看数据框结构
str(df)
'data.frame': 3 obs. of 3 variables:$ Name : chr "Alice" "Bob" "Charlie"$ Age : num 25 30 35$ Salary: num 50000 55000 60000
访问数据框中的列
df$Name # 访问 Name 列, 返回一个向量
df[["Name"]] # 访问 Name 列, 返回一个向量
df["Name"] # 访问 Name 列, 返回一个数据框
df[1] # 访问第 1 列,结果是一个数据框
子集操作
df[1:2, ] # 选择前两行
df[, 1:2] # 选择前两列
df[df$Age > 28, ] # 筛选 Age 大于 28 的行
添加新列
df$Department <- c("HR", "IT", "Finance") # 使用 $ 符号
df["Experience"] <- c(2, 5, 7) # 使用 [] 操作符
删除列
df$Department <- NULL # 删除 Department 列
合并数据框
# 创建另一个数据框
df2 <- data.frame(Name = c("David", "Eva"),Age = c(28, 24),Salary = c(58000, 52000)
)# 按行合并
combined_df <- rbind(df, df2)# 按列合并
combined_df <- cbind(df, Experience = c(2, 5, 7, 3, 4))
数据框的常用函数
·head(df, n) 和 tail(df, n):查看前 n 行或后 n 行。
·dim(df):查看数据框的维度(行数和列数)。
·nrow(df) 和 ncol(df):分别返回行数和列数。
·summary(df):生成数据框的摘要统计信息。
·merge(df1, df2, by = "column_name"):按列合并两个数据框。
2.5 列表
列表是一种通用的数据结构,可以容纳不同类型的数据对象。列表是R中的一种非常灵活的数据类型,因为它可以包含多种类型的元素,包括向量、矩阵、数据框、甚至其他列表。
my_list <- list(1, "Hello", TRUE) # 创建一个简单的列表my_named_list <- list(Number = 1, Text = "Hello", Logical = TRUE) # 创建一个带有名称的列表nested_list <- list(list(1, 2), list("a", "b")) # 嵌套列表
列表的操作
my_list[[1]] # 访问第一个元素
my_list[1] # 返回一个列表,只包含第一个元素
my_named_list$Text # 访问名为 "Text" 的元素
nested_list[[1]][[2]] # 访问嵌套列表中的第二个元素my_list[[1]] <- 100 # 修改元素
my_list[[4]] <- NULL # 删除元素
列表的常用函数
length(my_list) # 来获取列表的长度
combined_list <- c(my_list, my_named_list)v # 使用c()函数来合并两个或多个列表
is.list(my_list) # 判断一个对象是否是列表
列表和数据框都可以包含不同类型的对象,但列表和数据框的区别是列表是一维和数据框是二维。除此之外,数据框要求每列的长度必须一致(即数据框的行数相同),但列表并不要求每个元素的长度一致。
相关文章:
【R语言速通】1.数据类型
文章目录 0. 变量名1.基本数据类型1.1 数值型1.2 整型1.3 复数型1.4 逻辑型1.5 字符型 2.复合数据类型2.1 向量向量操作向量的常用函数 2.2 矩阵矩阵操作矩阵的常用函数 2.3 数组数组的操作数据的运算数组的访问数组的维度操作 数组的常用函数 2.4 数据框数据框操作数据框的常用…...
【C++设计模式】(三)创建型模式:单例模式
文章目录 (三)创建型模式:单例模式饿汉式懒汉式饿汉式 v.s. 懒汉式 (三)创建型模式:单例模式 单例模式在于确保一个类只有一个实例,并提供一个全局访问点来访问该实例。在某些情况下࿰…...
基于Android Studio的行程记录APK开发指南(三)---界面设计及两种方法获取用户位置
前言 本系列教程我们来看看如何使用Android Studio去开发一个APK用于用户的实时行程记录 第一期:基于Android Studio的用户行程记录APK开发指南(一):项目基础配置与速通Kotlin-CSDN博客第二期:基于Android Studio的行程记录APK开发指南(二):…...
大厂趋势:低代码不等于低能力,赋能高效开发新纪元
大厂趋势:低代码不等于低能力,赋能高效开发新纪元 在数字化转型的浪潮中,科技巨头(大厂)作为行业的引领者,不断探索和创新,以应对日益复杂多变的市场需求和技术挑战。其中,“低代码…...
CentOS全面停服,国产化提速,央国企信创即时通讯/协同门户如何选型?
01. CentOS停服带来安全新风险, 国产操作系统迎来新的发展机遇 2024年6月30日,CentOS 7版本全面停服,于2014年发布的开源类服务器操作系统——CentOS全系列版本生命周期画上了句号。国内大量基于CentOS开发和适配的服务器及平台,…...
如何确定Kubernetes是在采用哪种方式进行部署的?
这里写目录标题 1. 查看 Kubernetes 安装方式的常见文件和工具2. 检查 Kubernetes 的节点信息3. 检查 Kubernetes API 服务器的版本信息4. 检查系统服务和容器5. 查看安装文档或管理员笔记为什么可以确定是 kubeadm 部署?下一步确认 如果存在多个master节点…...
【PostgreSQL】地理空间数据的数据类型定义、索引优化、查询优化策略
PostgreSQL 是开源关系型数据库,对于地理空间数据的处理提供了很好的支持。在处理地理空间数据时,优化索引和查询的性能至关重要,因为地理空间操作通常涉及大量的数据计算和复杂的几何形状比较。 一、地理空间数据类型 注意geometry和geogra…...
RocketMQ广播消费消息
1、 基础概念 RocketMQ 支持两种消息模式:集群消费( Clustering )和广播消费( Broadcasting )。 集群消费模式(Cluster): 在集群消费模式下,同一个消费者组(…...
C#基础(2)枚举
前言 我们其实在前面已经了解过枚举到底有什么作用,但是那毕竟是概念性的语言,理解起来很抽象,今天我们会具体来讲一讲枚举,并谈一谈它的应用。 希望你能从今天的C#基础中有所收获。 基本概念 1.枚举:是一个比较特…...
Linux之MySQL日志
前言 数据库就像一个庞大的图书馆,而日志则是记录这个图书馆内每一本书的目录。正如在图书馆中找到特定书籍一样,数据库日志帮助我们追溯数据的变更、定位问题和还原状态。 在MySQL中,日志是非常重要的一个组成部分,它记录了数据…...
Redis集群模式—主从集群、哨兵集群、分片集群
主从集群 主从模式中,包括一个主节点(Master)和一个或多个从节点(Slave)。主节点负责处理所有写操作和读操作,而从节点则复制主节点的数据,并且只能处理读操作。当主节点发生故障时,…...
并发工具类(二):CyclicBarrier
1、CyclicBarrier 介绍 从字面上看 CyclicBarrier 就是 一个循环屏障,它也是一个同步助手工具,它允许多个线程 在执行完相应的操作后彼此等待共同到达一个屏障点。 CyclicBarrier可以被循环使用,当屏障点值变为0之后,可以在接下来…...
Spring Cloud全解析:负载均衡之Ribbon简介
Ribbon简介 Ribbon是一种客户端的软件负载均衡算法,将Netflix的中间层服务连接在一起,提供了一系列完善的配置如连接超时、重试等,Ribbon会自动的帮助基于某种规则(如简单轮询、随机连接等)去连接那些机器,也可以自定义的负载均衡…...
Kettle安装与使用指南
1. 介绍 什么是Kettle? Kettle,全称Pentaho Data Integration (PDI),是Pentaho BI套件的一部分。它提供了一个可视化的ETL工具,允许用户通过图形界面设计复杂的数据集成流程。Kettle支持多种数据源,包括关系型数据库…...
教育行业解决方案:智能PPT在教育行业的创新应用
在信息化时代,教育行业面临着巨大的变革。随着人工智能技术的不断发展,传统教学方式正在被重新定义。彩漩科技作为 AI 技术的先行者,推出了歌者 PPT &彩漩 PPT,为教师、学生和家长提供了一种全新的教育体验,实现了…...
Matlab程序练习
Part1 1.求 [100,999] 之间能被 21整除的数的个数。 程序: 主文件:main.m clear; start_num 100; end_num 999; div_num 21; res div(start_num,end_num,div_num); fprintf("[%d,%d]之间能被%d整除的数的个数为%d个\n",start_num,end_…...
cesium可不可以改变影像底图颜色,如何给地球底图影像添加一层滤镜蒙版?
废话:你的球是不是很丑?是不是没有科技感?是不是没有好看的影像? 因果: 因:客户问,底图可不可以改变颜色,想让球更漂亮一些。 答:可以改变影像饱和度,透明度…...
MyBatis-MappedStatement什么时候生成?QueryWrapper如何做到动态生成了SQL?
通过XML配置的MappedStatement 这部分MappedStatement主要是由MybatisXMLMapperBuilder进行解析,核心逻辑如下: 通过注解配置的MappedStatement 核心逻辑就在这个里面了: 继承BaseMapper的MappedStatement 我们看看这个类,里…...
Netty系列-2 NioServerSocketChannel和NioSocketChannel介绍
背景 本文介绍Netty的通道组件NioServerSocketChannel和NioSocketChannel,从源码的角度介绍其实现原理。 1.NioServerSocketChannel Netty本质是对NIO的封装和增强,因此Netty框架中必然包含了对于ServerSocketChannel的构建、配置以及向选择器注册&am…...
智能客服的四大优势,提升企业服务效率
在这个信息化快速发展的时代,客户服务的重要性越来越凸显。传统的客服方式已经无法满足企业日益增长的服务需求,于是智能客服服务应运而生。智能客服服务不仅改变了企业与客户的互动方式,还提高了服务效率和客户满意度。本文将深入探讨智能客…...
【JavaEE】-- HTTP
1. HTTP是什么? HTTP(全称为"超文本传输协议")是一种应用非常广泛的应用层协议,HTTP是基于TCP协议的一种应用层协议。 应用层协议:是计算机网络协议栈中最高层的协议,它定义了运行在不同主机上…...
shell脚本--常见案例
1、自动备份文件或目录 2、批量重命名文件 3、查找并删除指定名称的文件: 4、批量删除文件 5、查找并替换文件内容 6、批量创建文件 7、创建文件夹并移动文件 8、在文件夹中查找文件...
visual studio 2022更改主题为深色
visual studio 2022更改主题为深色 点击visual studio 上方的 工具-> 选项 在选项窗口中,选择 环境 -> 常规 ,将其中的颜色主题改成深色 点击确定,更改完成...
YSYX学习记录(八)
C语言,练习0: 先创建一个文件夹,我用的是物理机: 安装build-essential 练习1: 我注释掉了 #include <stdio.h> 出现下面错误 在你的文本编辑器中打开ex1文件,随机修改或删除一部分,之后…...
从深圳崛起的“机器之眼”:赴港乐动机器人的万亿赛道赶考路
进入2025年以来,尽管围绕人形机器人、具身智能等机器人赛道的质疑声不断,但全球市场热度依然高涨,入局者持续增加。 以国内市场为例,天眼查专业版数据显示,截至5月底,我国现存在业、存续状态的机器人相关企…...
智能仓储的未来:自动化、AI与数据分析如何重塑物流中心
当仓库学会“思考”,物流的终极形态正在诞生 想象这样的场景: 凌晨3点,某物流中心灯火通明却空无一人。AGV机器人集群根据实时订单动态规划路径;AI视觉系统在0.1秒内扫描包裹信息;数字孪生平台正模拟次日峰值流量压力…...
C++ Visual Studio 2017厂商给的源码没有.sln文件 易兆微芯片下载工具加开机动画下载。
1.先用Visual Studio 2017打开Yichip YC31xx loader.vcxproj,再用Visual Studio 2022打开。再保侟就有.sln文件了。 易兆微芯片下载工具加开机动画下载 ExtraDownloadFile1Info.\logo.bin|0|0|10D2000|0 MFC应用兼容CMD 在BOOL CYichipYC31xxloaderDlg::OnIni…...
Linux --进程控制
本文从以下五个方面来初步认识进程控制: 目录 进程创建 进程终止 进程等待 进程替换 模拟实现一个微型shell 进程创建 在Linux系统中我们可以在一个进程使用系统调用fork()来创建子进程,创建出来的进程就是子进程,原来的进程为父进程。…...
智能AI电话机器人系统的识别能力现状与发展水平
一、引言 随着人工智能技术的飞速发展,AI电话机器人系统已经从简单的自动应答工具演变为具备复杂交互能力的智能助手。这类系统结合了语音识别、自然语言处理、情感计算和机器学习等多项前沿技术,在客户服务、营销推广、信息查询等领域发挥着越来越重要…...
省略号和可变参数模板
本文主要介绍如何展开可变参数的参数包 1.C语言的va_list展开可变参数 #include <iostream> #include <cstdarg>void printNumbers(int count, ...) {// 声明va_list类型的变量va_list args;// 使用va_start将可变参数写入变量argsva_start(args, count);for (in…...
