当前位置: 首页 > news >正文

如何用R语言ggplot2画高水平期刊散点图

文章目录

  • 前言
  • 一、数据集
  • 二、ggplot2画图
    • 1、全部代码
    • 2、细节拆分
      • 1)导包
      • 2)创建图形对象
      • 3)主题设置
      • 4)轴设置
      • 5)图例设置
      • 6)散点颜色
      • 7)保存图片


前言

例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。


一、数据集

数据下载链接见文章顶部

处理前的数据:

在这里插入图片描述

library(readxl)
library(reshape2) # reshape2 包是 R 语言中的一个数据处理包,主要用于数据重塑(reshaping),提供了代码所需的 melt 函数。data = read_excel("fig1_datasets.xlsx", sheet = "Sheet1")
data_melt = melt(data, id.vars = c("date"), variable.name = "fruit", value.name = "production")
data_melt = data_melt[data_melt$production != 0,]
data_melt$size = log(data_melt$production) # 构造 size 列用于表示散点大小,log 函数用于减少最大点和最小点的大小差异。

处理后的数据:
在这里插入图片描述


二、ggplot2画图

1、全部代码

library(ggplot2)
library(scales)pic =ggplot(data_melt, aes(x = date, y = production, color = fruit, size = size)) +geom_point() +# 主题设置theme_bw() + theme(panel.grid.major = element_line(linetype = 5)) +# 轴设置xlab("") +ylab("Production") +theme(axis.text = element_text(size = 19)) + theme(axis.title = element_text(size = 22)) +scale_x_datetime(breaks = breaks_pretty(n = 8))+scale_y_log10(breaks = breaks_log(n = 10)) +# 图例设置guides(size = 'none') +guides(color = guide_legend(override.aes = list(size = 6))) +theme(legend.title = element_blank()) +theme(legend.text = element_text(size = 14, face = "italic")) +theme(legend.position = c(0.073, 0.765)) +theme(legend.background = element_rect(fill = NA, colour = NA)) +# 散点颜色scale_color_manual(values = c('#3ba272', '#91cc75', '#ea7ccc', '#9a60b4', '#ee6666', '#73c0de', '#fac858', '#5470C6'))jpeg(filename = "test1.png", width = 7000, height = 3000, res = 600, quality = 100)
pic
dev.off()

2、细节拆分

1)导包

library(ggplot2)
library(scales)

ggplot2 中已经提供一些 scale 相关函数用于调整绘图中各种变量的比例尺。然而,还有一个独立的 R 包叫做 scales ,它提供了更多关于比例尺的函数和工具。本案例代码中的 breaks_pretty 函数由其提供。

2)创建图形对象

pic =ggplot(data_melt, aes(x = date, y = production, color = fruit, size = size)) +geom_point()
  • 设置 x 轴为日期,y 轴为产量,按 fruit 列的水果类型着色,散点大小为 size 列。
  • geom_point 指定画散点图。

3)主题设置

theme_bw() + 
theme(panel.grid.major = element_line(linetype = 5))
  • theme_bw 指定黑白主题。
  • 设置主网格线(坐标轴上的刻度位置对应的网格线为主网格线)为5号线段类型。

4)轴设置

xlab("") +
ylab("Production") +
theme(axis.text = element_text(size = 19)) + 
theme(axis.title = element_text(size = 22)) +
scale_x_datetime(breaks = breaks_pretty(n = 8))+
scale_y_log10(breaks = breaks_log(n = 10))
  • xlab 设置 x 轴标题,ylab 设置 y 轴标题。
  • 设置轴刻度字号19,轴标题字号22。
  • scale_x_datetime()函数用于调整 x 轴上日期时间型变量的比例尺,其中breaks参数用于指定刻度的位置。
    在这个特定的例子中,breaks_pretty(n = 8)是一个函数调用,它会生成相对于输入数据的合适的刻度位置。参数 n 指定了希望返回的刻度数量。
    因此,scale_x_datetime(breaks = breaks_pretty(n = 8)) 的作用是设置 x 轴上日期时间型变量的刻度位置为相对于数据合适的 8 个刻度位置。这样做可以确保刻度位置不会过于拥挤或稀疏,使得图形更易读。
  • scale_y_log10() 函数用于对 y 轴上的连续型变量进行对数变换,并且 breaks 参数用于指定刻度的位置。
    在这个特定的例子中,breaks_log(n = 10) 是一个函数调用,参数 n 指定了希望返回的刻度数量。scale_y_log10(breaks = breaks_log(n = 10)) 的作用是将 y 轴原本的均匀刻度改为对数刻度,并且使其返回的刻度数量为 10。这样做可以确保对数刻度的刻度位置合适,并且数量适当,以便更好地展示数据。

5)图例设置

guides(size = 'none') +
guides(color = guide_legend(override.aes = list(size = 6))) +
theme(legend.title = element_blank()) +
theme(legend.text = element_text(size = 14, face = "italic")) +
theme(legend.position = c(0.073, 0.765)) +
theme(legend.background = element_rect(fill = NA, colour = NA)) 
  • guides(size = ‘none’) 删除了 size 图例。这里的参数 size 指的是大小美学映射,而不是列名里的 “size”。
  • guides(color = guide_legend(override.aes = list(size = 6))) 将图例中的散点大小设为6。
  • 设置图例标题为空。
  • 设置图例字体为14号斜体。
  • 设置图例位置(x, y)为(0.073, 0.765)。
  • 设置图例背景填充颜色、边框颜色为无,防止遮挡散点。

6)散点颜色

scale_color_manual(values = c('#3ba272', '#91cc75', '#ea7ccc', '#9a60b4', '#ee6666', '#73c0de', '#fac858', '#5470C6'))

7)保存图片

jpeg(filename = "test1.png", width = 7000, height = 3000, res = 600, quality = 100)
pic
dev.off()
  • jpeg 函数打开了一个JPEG设备,设定了图片的保存路径为 “test1.png”,图片的宽度为7000像素,高度为3000像素,分辨率为600 dpi,图片质量为100%。
  • pic是之前生成的图形对象。
  • dev.off()关闭了之前打开的图形设备,保存了图片到指定路径。这是在完成图片保存后必须执行的步骤,以确保保存的图片被正确地输出。

相关文章:

如何用R语言ggplot2画高水平期刊散点图

文章目录 前言一、数据集二、ggplot2画图1、全部代码2、细节拆分1)导包2)创建图形对象3)主题设置4)轴设置5)图例设置6)散点颜色7)保存图片 前言 一、数据集 数据下载链接见文章顶部 处理前的数据…...

Python基于 Jupyter Notebook 的图形可视化工具库之ipysigma使用详解

概要 在数据科学和网络分析中,图(Graph)结构是一种常用的数据结构,用于表示实体及其关系。为了方便图数据的可视化和交互操作,ipysigma 提供了一个基于 Jupyter Notebook 的图形可视化工具。通过 ipysigma,用户可以在 Jupyter Notebook 中创建、编辑和展示图结构,方便进…...

四叉树和KD树

1. 简介 四叉树和KD树都是用于空间数据索引和检索的树状数据结构。它们通过将空间递归地划分为更小的区域,并存储每个区域内的点,来实现快速搜索和范围查询。 2. 四叉树 2.1 定义 四叉树是一种树状数据结构,它将二维空间递归地划分为四个…...

C语言中结构体使用.与->访问成员变量的区别

文章目录 前言点运算符(.)箭头运算符(->)总结 前言 在C语言中,. 和 -> 都是用来访问结构体成员的运算符,但它们的使用场景和含义有所不同。 提示:以下是本篇文章正文内容,下面…...

计算机二级Access选择题考点

在Access中,若要使用一个字段保存多个图像、图表、文档等文件,应该设置的数据类型是附件。在“销售表"中有字段:单价、数量、折扣和金额。其中,金额单价x数量x折扣,在建表时应将字段"金额"的数据类型定义为计算。若…...

人工智能历史与现状

1 人工智能历史与现状 1.1 人工智能的概念和起源 1.1.1 人工智能的概念 人工智能 (Artificial Intelligence ,AI)是一门研究如何使计算机 能够模拟人类智能行为的科学和技术,目标在于开发能够感知、理解、 学习、推理、决策和解决问题的智能机器。人工智能的概念主要包含 以…...

【git使用一】windows下git下载、安装和卸载

目录 (1)下载安装包 (2)安装git (3)安装验证 (4)卸载git (1)下载安装包 官网下载地址:Git 国内镜像下载地址:CNPM Binaries Mir…...

JVM 类加载器的工作原理

JVM 类加载器的工作原理 类加载器(ClassLoader)是一个用于加载类文件的子系统,负责将字节码文件(.class 文件)加载到 JVM 中。Java 类加载器允许 Java 应用程序在运行时动态地加载、链接和初始化类。 2. 类加载器的工…...

ARM Cortex-M4 CPU指令大全:作用、原理与实例

引言 在计算机系统中,CPU(中央处理器)是执行各种指令的核心部件。ARM Cortex-M4是广泛应用于嵌入式系统中的一款处理器,其指令集架构(ISA)基于ARMv7-M。本文将介绍ARM Cortex-M4处理器中的常见指令&#x…...

Mysql学习(九)——存储引擎

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 七、存储引擎7.1 MySQL体系结构7.2 存储引擎简介7.3 存储引擎特点7.4 存储引擎选择7.5 总结 七、存储引擎 7.1 MySQL体系结构 连接层:最上层是一些客户…...

TFT屏幕波形显示

REVIEW 关于TFT显示屏,之前已经做过彩条显示: TFT显示屏驱动_tft驱动-CSDN博客 关于ROM IP核,以及coe文件生成: FPGA寄存器 Vivado IP核_fpga寄存器资源-CSDN博客 1. TFT屏幕ROM显示正弦波 ①生成coe文件 %% sin-cos wave dat…...

服务器无法远程桌面连接不上的问题排查与解决方案

一、问题概述 当尝试使用远程桌面协议(RDP)连接至服务器时,如果连接失败,这通常意味着存在一些配置问题、网络问题或服务器本身的问题。此类问题对于管理员而言,需要系统地进行排查和解决。 二、排查步骤 1. 检查网…...

JAVA面试题整理——内存溢出与内存泄露的区别与联系

内存溢出与内存泄露的区别与联系 在前面jvm学习整理的时候其实用过一个简单的例子了解过内存溢出,在jvm内存模型章节下,大家有兴趣的可以去看看:JVM初学 GC_knowwait的博客-CSDN博客 内存溢出 内存溢出(out of memory&#xff09…...

L50--- 104. 二叉树的最大深度(深搜)---Java版

1.题目描述 二叉树的 最大深度 是指从根节点到最远叶子节点的最长路径上的节点数。 2.思路 这个二叉树的结构如下: 根节点 1 左子节点 2 右子节点 3 左子节点 4 计算过程 从根节点 1 开始计算: 计算左子树的最大深度: 根节点 2&#xf…...

Linux 中 “ 磁盘、进程和内存 ” 的管理

在linux虚拟机中也有磁盘、进程、内存的存在。第一步了解一下磁盘 一、磁盘管理 (1.1)磁盘了解 track( 磁道 ) :就是磁盘上的同心圆,从外向里,依次排序1号,2号磁盘........等等。…...

test_pipeline

test_pipeline 是一个测试管道(test pipeline)的定义。 在计算机视觉任务中,通常需要对输入图像进行一系列的预处理操作,以便将其适配到模型的输入要求或提高模型的性能。测试管道就是用于定义这些预处理操作的一系列步骤。 在给…...

使用甲骨文云arm服务器安装宝塔时nginx无法卸载

使用甲骨文云arm服务器安装宝塔 其他环境都能安装上 唯独nginx安装完不运行 卸载了几次以后还无法卸载了. 修复 重启都不行. 差点就重建主机了. 最后靠下面的命令 就卸载掉了 然后重装就把nginx安装好了 mv /www/server/nginx/sbin/nginx /tmp/nginx_back mv /etc/in…...

C++青少年简明教程:C++的指针入门

C青少年简明教程:C的指针入门 说到指针,就不可能脱离开内存。了解C的指针对于初学者来说可能有些复杂,我们可以试着以一种简单、形象且易于理解的方式来解释: 首先,我们可以将计算机内存想象成一个巨大的有许多格子的…...

Apache Doris 基础 -- 数据表设计(分层存储)

1、应用场景 未来一个重要的用例是类似于ES日志存储,其中日志场景中的数据是根据日期分割的。许多数据都是查询不频繁的冷数据,因此需要降低此类数据的存储成本。考虑到节约成本: 来自不同厂商的常规云磁盘的定价比对象存储更昂贵。Doris 集群实际在线…...

使用Spring Boot设计一套BI系统

商业智能(Business Intelligence,简称BI)系统是一种将数据转化为可操作信息,帮助企业进行决策支持的技术与工具的集合。随着大数据时代的到来,BI系统在企业中的应用变得越来越广泛。本文旨在探讨如何使用Spring Boot框…...

跨链模式:多链互操作架构与性能扩展方案

跨链模式:多链互操作架构与性能扩展方案 ——构建下一代区块链互联网的技术基石 一、跨链架构的核心范式演进 1. 分层协议栈:模块化解耦设计 现代跨链系统采用分层协议栈实现灵活扩展(H2Cross架构): 适配层&#xf…...

3403. 从盒子中找出字典序最大的字符串 I

3403. 从盒子中找出字典序最大的字符串 I 题目链接:3403. 从盒子中找出字典序最大的字符串 I 代码如下: class Solution { public:string answerString(string word, int numFriends) {if (numFriends 1) {return word;}string res;for (int i 0;i &…...

爬虫基础学习day2

# 爬虫设计领域 工商:企查查、天眼查短视频:抖音、快手、西瓜 ---> 飞瓜电商:京东、淘宝、聚美优品、亚马逊 ---> 分析店铺经营决策标题、排名航空:抓取所有航空公司价格 ---> 去哪儿自媒体:采集自媒体数据进…...

vue3+vite项目中使用.env文件环境变量方法

vue3vite项目中使用.env文件环境变量方法 .env文件作用命名规则常用的配置项示例使用方法注意事项在vite.config.js文件中读取环境变量方法 .env文件作用 .env 文件用于定义环境变量,这些变量可以在项目中通过 import.meta.env 进行访问。Vite 会自动加载这些环境变…...

Rapidio门铃消息FIFO溢出机制

关于RapidIO门铃消息FIFO的溢出机制及其与中断抖动的关系,以下是深入解析: 门铃FIFO溢出的本质 在RapidIO系统中,门铃消息FIFO是硬件控制器内部的缓冲区,用于临时存储接收到的门铃消息(Doorbell Message)。…...

Java多线程实现之Thread类深度解析

Java多线程实现之Thread类深度解析 一、多线程基础概念1.1 什么是线程1.2 多线程的优势1.3 Java多线程模型 二、Thread类的基本结构与构造函数2.1 Thread类的继承关系2.2 构造函数 三、创建和启动线程3.1 继承Thread类创建线程3.2 实现Runnable接口创建线程 四、Thread类的核心…...

Web 架构之 CDN 加速原理与落地实践

文章目录 一、思维导图二、正文内容(一)CDN 基础概念1. 定义2. 组成部分 (二)CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 (三)CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 &#xf…...

python报错No module named ‘tensorflow.keras‘

是由于不同版本的tensorflow下的keras所在的路径不同,结合所安装的tensorflow的目录结构修改from语句即可。 原语句: from tensorflow.keras.layers import Conv1D, MaxPooling1D, LSTM, Dense 修改后: from tensorflow.python.keras.lay…...

安全突围:重塑内生安全体系:齐向东在2025年BCS大会的演讲

文章目录 前言第一部分:体系力量是突围之钥第一重困境是体系思想落地不畅。第二重困境是大小体系融合瓶颈。第三重困境是“小体系”运营梗阻。 第二部分:体系矛盾是突围之障一是数据孤岛的障碍。二是投入不足的障碍。三是新旧兼容难的障碍。 第三部分&am…...

深入浅出深度学习基础:从感知机到全连接神经网络的核心原理与应用

文章目录 前言一、感知机 (Perceptron)1.1 基础介绍1.1.1 感知机是什么?1.1.2 感知机的工作原理 1.2 感知机的简单应用:基本逻辑门1.2.1 逻辑与 (Logic AND)1.2.2 逻辑或 (Logic OR)1.2.3 逻辑与非 (Logic NAND) 1.3 感知机的实现1.3.1 简单实现 (基于阈…...