当前位置：首页 > news >正文

【R语言】获取数据

news 2026/5/12 15:09:52

R语言自带2种数据存储格式：*.RData和*.rds。

这两者的区别是：前者既可以存储数据，也可以存储当前工作空间中的所有变量，属于非标准化存储；后者仅用于存储单个R对象，且存储时可以创建标准化档案，属于标准化存储。

load()函数：读取*.RData格式的数据；

readRDS()函数：读取*.rds格式的数据。

一、读取文本数据

R语言使用read.table()函数读取文本文档txt数据。

read.table()函数的5个参数：

file：需要导入的文本数据文件路径和名称，可以是txt、dat、csv等
header：导入时是否带有列标题，默认为TRUE
sep：列与列之间的文本分隔符
stringsAsFactor：导入数据时是否将字符串数据转为因子，默认为TRUE
fileEncoding：文本数据的文件编码，默认设置为UTF-8

R语言的base包中还有read.csv()，read.csv2()，read.delim()，read.delim2()等函数。

以下为示例：

data <- read.table(file = "D:/Application/21.R语言/test.txt", header=T, sep=",",stringsAsFactor=F,fileEncoding="UTF-8")
head(data)

二、读取Excel数据

1、使用openxlsx包读取

openxlsx包主要通过getSheetNames()函数和read.xlsx()函数实现对Excel数据的读取。

# 先检查是否已安装了openxlsx包，如果没有，则先安装
if (!require("openxlsx")) {install.packages("openxlsx")
}
data1 <- openxlsx::read.xlsx(xlsxFile = "D:/Application/21.R语言/test.xlsx", sheet=1)
head(data1)

2、使用xlsx包读取

xlsx包通过read.xlsx()函数读取Excel数据的。

# 先检查是否已安装了xlsx包，如果没有，则先安装
if (!require("openxlsx")) {install.packages("openxlsx")
}
data1 <- xlsx::read.xlsx(File = "D:/Application/21.R语言/test.xlsx", sheetIndex=1, sheetName=NULL)
head(data1)

需要安装java，否则会报错。

3、使用readxl包读取

readxl包通过使用read_excel()函数读取Excel数据。

7个参数：

path：字符型，Excel文件所在的路径和名称；
sheet：字符型或整数型，需要读取的工作簿既可以是工作簿名称（字符串），也可以是工作簿的位置序号（正整数）；
range：字符型，读取指定区域的数据，如：B4:D88表示读取B4到D88的数据；
col_names：逻辑型，判断是否使用第一行做为列的名称。
col_type：字符向量或NULL，读取数据每一列的类型，包含skip（忽略），guess（基于被读取的Excel文件本身的单元格类型）、logical（逻辑型）、numeric（数值型）、date（日期型）、text（字符串型）、list（列表项）等；
na：字符串，被读取的Excel文件对缺失值的约定。
trim_ws：逻辑型，判断是否清楚数据末尾的空格。

# 先检查是否已安装了readxl包，如果没有，则先安装
if (!require("readxl")) {install.packages("readxl")
}
data1 <- readxl::read_excel(path = "D:/Application/21.R语言/test.xlsx", sheet=1, range=NULL, col_names=T, col_type=NULL, na="", trim_ws=T)
head(data1)

三、读取数据库数据

暂无

四、读取其它统计工具的数据

1、读取SPSS软件数据

SPSS软件默认数据保存格式为*.sav，foreign包中的read.spss()函数和haven包中的read.sav()函数或read_spss()函数可读取此类数据。

以foreign包中自带的electric.sav数据集为示例：

read.spss()函数的4个关键参数：

file：字符型，需要读取的*.sav文件路径；
use.value.labels：逻辑型，在读取数据时判断是否将变量的标签值转换为R语言因子格式数据，如果变量中出现不满足标签值的数据，将强制转换为NA。
to.data.frame：逻辑型，判断是否将数据转换为数据框，默认值为FALSE，即转换为列表。
use.missings：逻辑型，判断是否将原有数据中定义的缺失值转换为NA，建议设置为TRUE。

library("foreign")
file <- system.file("files", "electric.sav", package="foreign")
data <- foreign::read.spss(file=file, use.value.labels=T, to.data.frame=T, use.missings=T)
head(data)
dim(data)
str(data)

以haven包读取electric.sav数据集：

read_sav()函数的参数：

file：字符型，需要读取的*.sav文件路径与名称；
encoding：字符型，数据文件的字符编码，一般默认为NULL，即使用与原数据文件相同的编码方式；
user_n：逻辑型，判断是否将原有数据中定义的缺失值转换为NA。

library("haven")
file <- system.file("files", "electric.sav", package="foreign")
data <- haven::read_sav(file = file, encoding=NULL, user_na=T)
head(data)
dim(data)
str(data)

2、读取SAS软件数据

SAS软件数据集存储于逻辑库中，默认数据保存格式为*.sas7bdat。

通过foreign包的read.ssd()函数和haven包的read_sas()函数读取。

read.ssd()函数读取SAS数据集的前提是本地要安装SAS软件。

read.ssd()函数的参数：

libname：字符型，逻辑库名称，相当于SAS数据集存储的文件夹名称。
sectionnames：字符型，数据集名称，注意，只需要给出数据名称，不需要添加文件后缀。
sascmd：字符型，SAS软件可执行程序安装的路径。

data <- foreign::read.ssd(libname = system.file("examples", package="haven"),sectionnames="iris", sascmd = "D:/Program Fils/SASHome/SASFoundation/9.4/sas.exe")
head(data)
dim(data)
str(data)

【R语言】获取数据

R语言自带2种数据存储格式：*.RData和*.rds。这两者的区别是：前者既可以存储数据，也可以存储当前工作空间中的所有变量，属于非标准化存储；后者仅用于存储单个R对象，且存储时可以创建标准化档案&#xff0c…...

编程日记 2025/2/5 13:37:00

Java BIO详解

一、简介 1.1 BIO概述 BIO（Blocking I/O），即同步阻塞IO（传统IO）。 BIO 全称是 Blocking IO，同步阻塞式IO，是JDK1.4之前的传统IO模型，就是传统的 java.io 包下面的代码实现。服务…...

编程日记 2025/2/5 13:35:59

统计满足条件的4位数（信息学奥赛一本通-1077）

【题目描述】给定若干个四位数，求出其中满足以下条件的数的个数：个位数上的数字减去千位数上的数字，再减去百位数上的数字，再减去十位数上的数字的结果大于零。【输入】输入为两行，第一行为四位数的个数n&#xff0…...

编程日记 2025/2/5 13:33:55

北京门头沟区房屋轮廓shp的arcgis数据建筑物轮廓无偏移坐标测评

在IT行业中，地理信息系统（GIS）是用于处理、分析和展示地理空间数据的重要工具，而ArcGIS则是GIS领域中的一款知名软件。本文将详细解析标题和描述中提及的知识点，并结合“门头沟区建筑物数据”这一标签，深入…...

编程日记 2025/2/5 13:27:48

Spring 面试题【每日20道】【其三】

1、Spring 中的 Profile 注解的作用是什么？ 中等 Profile 注解在Spring框架中用于根据不同的环境配置文件（profiles）来激活或忽略某些Bean的注册。它允许开发者定义逻辑以区分不同环境下的bean定义，例如开发、测试和生产环境。 …...

编程日记 2025/2/5 13:26:47

FFmpeg(7.1版本)在Ubuntu18.04上的编译

一、从官网上下载FFmpeg源码官网地址：Download FFmpeg 点击Download Source Code 下载源码到本地电脑上二、解压包 tar -xvf ffmpeg-7.1.tar.xz 三、配置configure 1.准备工作安装编译支持的软件 ① sudo apt-get install nasm //常用的汇编器，用于编译某些需要汇编…...

编程日记 2025/2/5 13:25:46

Apache Hudi数据湖技术应用在网络打车系统中的系统架构设计、软硬件配置、软件技术栈、具体实现流程和关键代码

网络打车系统利用Hudi数据湖技术成功地解决了其大规模数据处理和分析的难题，提高了数据处理效率和准确性，为公司的业务发展提供了有力的支持。 Apache Hudi数据湖技术的一个典型应用案例是网络打车系统的数据处理场景，具体如下： 大…...

编程日记 2025/2/5 13:24:44

安全策略配置

需求: 1、VLAN 2属于办公区;VLAN 3属于生产区 2、办公区PC在工作日时间(周一至周五，早8到晚6)可以正常访问0A Server，其他时间不允许 3、办公区PC可以在任意时刻访问web server 4、生产区PC可以在任意时刻访问0A Server，但是不能访问Web serv…...

编程日记 2025/2/5 13:22:40

c++ stl 遍历算法和查找算法

概述： 算法主要由头文件<algorithm> <functional> <numeric> 提供 <algorithm> 是所有 STL 头文件中最大的一个，提供了超过 90 个支持各种各样算法的函数，包括排序、合并、搜索、去重、分解、遍历、数值交换、拷贝和…...

编程日记 2025/2/5 13:20:37

【Envi遥感图像处理】008：波段（批量）分离与波段合成

文章目录一、波段分离提取1. 提取单个波段2. 批量提取单个波段二、波段合成相关阅读：【ArcGIS微课1000例】0058：波段合成(CompositeBands)工具的使用一、波段分离提取 1. 提取单个波段...

编程日记 2025/2/5 13:15:32

线程创建与管理 - 创建线程、线程同步（C++）

前言在现代软件开发中，线程的创建和管理是并发编程的核心内容之一。通过合理地创建和管理线程，可以有效提高程序的响应速度和资源利用率。本文将详细讲解如何在C中创建线程，并探讨几种常见的线程同步机制。我们假设读者具备一定的C基础&…...

编程日记 2025/2/5 13:11:28

【C语言篇】“三子棋”

一、游戏介绍三子棋，英文名为 Tic - Tac - Toe，是一款简单而经典的棋类游戏。游戏在一个 33 的棋盘上进行，两名玩家轮流在棋盘的空位上放置自己的棋子（通常用 * 和 # 表示），率先在横、竖或斜方向上连成三个…...

编程日记 2025/2/5 13:07:23

安培定律应用于 BH 曲线上的工作点

在本篇博文中，我将展示如何应用安培定律来确定磁芯包裹的导体必须承载多少电流才能从 BH 值工作点获得 B 值，该工作点对应于磁芯材料中的最大 B 值。我在 BH 曲线上使用两个工作点，一个在线性区域，另一个在饱和区域。安培定律 H…...

编程日记 2025/2/5 13:06:21

深度求索DeepSeek横空出世

真正的强者从来不是无所不能，而是尽我所能。多少有关输赢胜负的缠斗，都是直面本心的搏击。所有令人骄傲振奋的突破和成就，看似云淡风轻寥寥数语，背后都是数不尽的焚膏继晷、汗流浃背。每一次何去何从的困惑，都可能通向…...

编程日记 2025/2/5 13:04:18

【CSS】什么是响应式设计？响应式设计的基本原理，怎么做

在当今多设备、多屏幕尺寸的时代，网页设计面临着前所未有的挑战。传统的固定布局已无法满足用户在不同设备上浏览网页的需求，响应式设计（Responsive Web Design）应运而生，成为网页设计的趋势和标准。本文将深入探讨响应…...

编程日记 2025/2/5 13:02:16

后盾人JS--继承

继承是原型的继承 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title> </hea…...

编程日记 2025/2/5 12:59:12

提升开发效率：IDE使用技巧与插件推荐

在软件开发过程中，选择一个合适的集成开发环境（IDE）并掌握其使用技巧，可以显著提高开发效率。本文将分享一些常用的IDE使用技巧，并推荐几款实用的插件，帮助开发者更好地利用IDE进行开发。一、IDE使用技巧…...

编程日记 2025/2/5 12:48:57

开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势（一）

一、前言在当今人工智能技术迅猛发展的时代，各类人工智能模型如雨后春笋般不断涌现，其性能的优劣直接影响着应用的广度与深度。从自然语言处理到计算机视觉，从智能安防到医疗诊断，AI 模型广泛应用于各个领域，人们对其准确性、稳定性和高效性的期望也与日俱增。在此背景下…...

编程日记 2025/2/5 12:46:53

小书包：让阅读更美的二次开发之作

小书包是在一款知名阅读软件的基础上进行二次开发的产品。在保留原有软件的基本功能和用户体验的同时，对其界面和视觉效果进行了精心美化，让阅读体验更加舒适和愉悦。内置了171条书源，虽然数量不算多，但都是作者精挑细选出来的&a…...

编程日记 2025/2/5 12:43:48

MySQL 插入数据指南

MySQL 插入数据指南引言 MySQL 是一款广泛使用的开源关系数据库管理系统，被广泛应用于各种规模的组织中。在数据库管理中，数据的插入是基础操作之一。本文将详细介绍如何在 MySQL 中插入数据，包括插入单条记录和多条记录，以及一…...

编程日记 2025/2/5 12:41:46

解决 Claude Code 频繁封号问题之转向 Taotoken 稳定服务

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度解决 Claude Code 频繁封号问题之转向 Taotoken 稳定服务对于依赖 Claude Code 进行开发的工程师而言，账号访问权限的…...

编程新知 2026/5/12 15:00:03

FILCO架构：动态可重构DNN加速器设计解析

1. FILCO架构设计背景与核心挑战深度神经网络(DNN)加速器设计正面临一个根本性矛盾：专用架构在特定负载下能达到峰值效率，但实际应用中工作负载的多样性日益增长。以自动驾驶系统为例，单个任务流程可能同时包含MLP分类器、Transformer视觉模型…...

编程新知 2026/5/12 14:53:48

如何通过命名规范降低代码维护成本：7个命名技巧提升长期项目质量

如何通过命名规范降低代码维护成本：7个命名技巧提升长期项目质量【免费下载链接】naming-cheatsheet Comprehensive language-agnostic guidelines on variables naming. Home of the A/HC/LC pattern. 项目地址: https://gitcode.com/gh_mirrors/na/naming-chea…...

编程新知 2026/5/12 11:50:52

终极Windows激活解决方案：3分钟永久激活Windows和Office的完整指南

终极Windows激活解决方案：3分钟永久激活Windows和Office的完整指南【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 你是否曾经遇到过这样的场景：新安装的Windows系统弹出…...

编程新知 2026/5/12 11:33:06

小熊猫Dev-C++：5个理由让你爱上这款轻量级C++开发工具

小熊猫Dev-C：5个理由让你爱上这款轻量级C开发工具【免费下载链接】Dev-CPP A greatly improved Dev-Cpp 项目地址: https://gitcode.com/gh_mirrors/dev/Dev-CPP 在C编程的世界里，寻找一个既功能强大又简单易用的开发环境常常让初学者望而却步。…...

编程新知 2026/5/12 11:30:12

AI工作流引擎：基于DAG与智能体的自动化任务编排实践

1. 项目概述：当AI遇上工作流，一场效率革命的开端最近在GitHub上看到一个挺有意思的项目，叫 DahnM20/ai-flow 。光看名字，你可能会觉得这又是一个“AI自动化”的玩具，但仔细研究其源码和设计理念后，我发现…...

编程新知 2026/5/12 11:06:30

3分钟快速搞定Windows苹果设备驱动安装：Apple-Mobile-Drivers-Installer终极指南

3分钟快速搞定Windows苹果设备驱动安装：Apple-Mobile-Drivers-Installer终极指南【免费下载链接】Apple-Mobile-Drivers-Installer Powershell script to easily install Apple USB and Mobile Device Ethernet (USB Tethering) drivers on Windows! 项目地址: h…...

编程新知 2026/5/12 10:58:56

反AI招聘平台hire-humans：重塑以人为本的招聘体验

1. 项目概述：当AI遇见“真人”招聘最近在GitHub上看到一个挺有意思的项目，叫“hire-humans”。光看名字，你可能会觉得这是个普通的招聘网站模板或者人力资源工具。但点进去仔细琢磨，你会发现它的内核远不止于此。这个项目本质上是…...

编程新知 2026/5/12 9:53:07

从灾难电影到现实防疫：技术视角下的系统脆弱性与韧性构建

1. 从科幻到现实：流行病史与灾难电影的预言性对话作为一名长期关注科技与社会交叉领域的写作者，我发现自己近年来越发沉迷于一种特殊的电影类型——灾难片，尤其是那些以病毒大流行为主题的影片。这并非单纯的娱乐消遣，而更像是一种…...

编程新知 2026/5/12 9:53:06

Nigate：让Mac与Windows硬盘和谐共处的开源桥梁

Nigate：让Mac与Windows硬盘和谐共处的开源桥梁【免费下载链接】Free-NTFS-for-Mac Nigate: An open-source NTFS utility for Mac. It supports all Mac models (Intel and Apple Silicon), providing full read-write access, mounting, and management for NTFS …...

编程新知 2026/5/12 9:51:05