R语言部分题解
- 请论述大数据的四个特点
数据量大(Volume)、数据种类多(Variety)、数据价值密度低(Value)、数据增长速度快(Velocity)
- 为什么目前大数据被广泛使用
科技的进步、基础建设的改进、资料获取变轻松
-
计算1~10的平均数
mean(c(1,2,3,4,5,6,7,8,9,10)) -
3~15每隔3产生一组数字
seq(from=3,to=15,by=3) -
程序改错
3=a Library(”ggpolt2”) 105CGUIM<-”text” install.packages(ggplot2)a=3 Library(ggplot2) CGUIM105<-”text” Install.packages(“ggplot2”) -
(1)创建向量1~10
Vc <- c(1,2,3,4,5,6,7,8,9,10)(2)对向量所有元素加3
Vc <- Vc+3 -
新增一向量a,包含数字1到10
新增一向量b,包含数字1到20中所有偶数取出a向量的第4个元素
取出b向量的第5、6、7个元素
a<-c(1,2,3,4,5,6,7,8,9,10)b<- seq(from=2,to=20,by=2)a[4]b[5:7] -
新增一列表a,包含一数字向量、一字符串向量
向列表中添加新的数字向量b
删除列表a中的字符串向量a<-list(c(1,2,3),c("x","y")) b<-c(2,3) a[[3]]<-b a[[2]]<=null -
(1)查询数据集mtcars中的所有列名
(2)查询数据集mtcars中的所有行名与列名colnames(mtcars) dimnames(mtcars) -
(1)查询数据集islands的长度
(2)查询数据集mtcars的行数与列数length(islands) dim(mtcars) -
将“10”转化为数字、将11转化为字符
as.numeric("10")as.character(11) -
(1)将字符串hello world字母转化为大写
toupper("hello world")(2)提取字符串hello world中的hello
substr("Hello World", start=1,stop=5) -
(1)拼接字符串hello与字符串world
paste("hello","world")(2)将拼接好的字符串中的h和w替换为a
gsub("h|w","a","hello world") -
对数据集islands进行从大到小排序
sort(islands) -
nameDF<-data.frame(ID=c(1,2,3,4,5),Name=c(“张三”,“李四”,“王五”,“赵六”,“小七"))
scoreDF<-data.frame(ID=c(1,2,4),Score=c(60,90,50))将上述两个数据框进行结合,保留所有数据
merge(nameDF,scoreDF,by="ID") -
使用dplyr筛选nba2021数据集栏位名称为Name、ThreesMade、ThreesAttempted、FieldGoalsMade与FieldGoalsAttempted的五个栏位
library(SportsAnalytics)
NBA2021<-fetch_NBAPlayerStatistics(“20-21")library(dplyr) select(NBA2021,Name,hreesMade,ThreesAttempted,FieldGoalsMade,FieldGoalsAttempted)
- 注 下列中的FieldGoalsMade、FieldGoalsAttempted……均是数据中对应的列名
-
使用dplyr:
(1)查看NBA2021数据集中命中率大于60%并且出场次数大于30场的球员资料
(2)查看出场分钟数超过1000分钟并且队伍名称为“BOS”或“SAN”的球员资料(1) filter4<-filter(NBA2021,FieldGoalsMade/FieldGoalsAttempted>0.6 & GamesPlayed>30) (2) filter(NBA2021,Team %in% c("BOS","SAN") & TotalMinutesPlayed>1000) -
使用dplyr对NBA2021数据集新增新栏位命中率
mutate(NBA2021, 命中率=FieldGoalsMade/FieldGoalsAttempted) -
使用dplyr统计NBA2021数据集中的球员个数,球队个数
summarise(NBA2021, 球员个数=n(), 球队个数=n_distinct(Team)) -
使用dplyr计算NBA2021数据集中出场分钟数大于2500分钟的球员个数、平均投进的两分球数以及平均投出的两分球数
filter1 <- filter(NBA2021,TotalMinutesPlayed>2500) sum2 <- summarise(filter1,球员个数=n(),平均投进的两分球数=mean(FieldGoalsMade),平均出手数=mean(FieldGoalsAttempted)) -
使用dplyr对NBA2021数据集以出场分钟数以及出场次数对所有球员进行从大到小的排序
arrange(NBA2021,desc([出场分钟数列名]),desc([出场次数列名])) -
使用dplyr计算NBA2021数据集以Team和Position作为分组依据的球员数、平均投进的两分球数以及平均投出的两分球数,并依据平均投进的两分球数由大到小排序
dataout <- group_by(NBA2021,Team,Position)%>%summarise(球员数=n(),平均投进的两分球数=mean(FieldGoalsMade),平均出手数=mean(FieldGoalsAttempted))%>%arrange(desc(平均投进的两分球数))) -
使用data.table计算所有球员的平均出场数、平均犯规次数以及平均抄截次数
library(SportsAnalytics)
NBA2021<-fetch_NBAPlayerStatistics(“20-21")library(data.table) #导入data.table库 NBA2021DT<-data.table(NBA2021)#将data.frame类型转换为data.tableNBA2021DT[,.(平均出场数=mean(GamesPlayed),平均犯规数=mean(PersonalFouls),平均抢断数=mean(Steals))]#GamesPlayed、PersonalFouls、Steals均为对应列名 -
使用data.table计算所有出场数大于70的球员,平均投进几颗三分球与两分球
NBA2021DT[GamesPlayed>60,.(平均三分进球=mean(ThreesMade), 平均两分进球=mean(FieldGoalsMade))] -
使用data.table计算NBA各队的中锋球员数和他们的平均三分球出手次数
NBA2021DT[Position=="C",.(.N,平均三分出手次数=mean(ThreesAttempted)),by=Team] #第一个参数 Position=="C" 是筛选位置为中锋的球员 #第二个参数是控制输出什么的 .(.N,平均三分出手次数=mean(ThreesAttempted))中: #.N表示在第一个参数条件下的总数量 -
对鸢尾花数据集进行宽表转长表操作,保留鸢尾花类别列
#宽表转长表 melt(资料框[宽表],id.vars=需要保留的栏位)library(reshape2) iris2 <- melt(iris,id.vars="Species")#Species是鸢尾花类别列的列名 -
使用ggplot函数对上述数据进行绘图,横坐标为鸢尾花种类、y轴为value,以鸢尾花种类进行颜色区分,图形类别为点图
library(ggplot2) ggplot(iris2,aes(Species,value,color=Species))+ geom_point() -
使用ggplot函数对上述数据进行绘图,横坐标为鸢尾花种类、y轴为value,图形类别为点图,点颜色为黄色、大小为3、透明度50%、点的形状为17
ggplot(iris2,aes(Species,value))+geom_point(color="yellow",size=3,alpha=.50,shape=17) -
对钻石数据集进行不放回随机抽取5000个数据作为新的数据集、根据数据集绘制点图,x:克拉,y:价格,点的颜色以切割类型区分,点的形状为18。
dia <- diamonds[sample(nrow(diamonds), 1000), ] #diamonds是钻石数据集ggplot(dia,aes(carat,price),color=cut)+geom_point(shape=18) -
请论述下列代码含义
library(treemap) #导入TreeMap树图绘制库 data(GNI2014) #加载指定的GNI2014数据集#使用treemap函数绘制矩形树状图 treemap(GNI2014, #指定数据集index=c("continent", "iso3"), #指定分组的列 vSize="population",#指定面积大小的列vColor="GNI", #指定颜色深浅的列type="value", #指定颜色填充类型的列title = "数据",#给定的标题border.col = c("black","blue"),#设置边框的颜色分别为fontsize.labels = c(12,10),##设置标签字体大小border.lwds = c(4,2),#设置边框的线条的宽度align.labels = list(c("center","center"),c("left","top"))# #设置标签对齐的方式 )
相关文章:
R语言部分题解
请论述大数据的四个特点 数据量大(Volume)、数据种类多(Variety)、数据价值密度低(Value)、数据增长速度快(Velocity) 为什么目前大数据被广泛使用 科技的进步、基础建设的改进、资料获取变轻松 计算1~10的平均数 mean(c(1,2,3,4,5,6,7,8,9,10))3~15…...
水文监测场景的数据通信规约解析和落地实践
[小 迪 导 读]:江苏云上需要通过云平台接入水文设备来实现水文数据的采集、存储、显示、控制、报警及传输等综合功能。企业介绍江苏云上智联物联科技有限公司是专业从事物联网相关产品与解决方案服务的高科技公司,总部位于美丽的江苏无锡。公司遵循“智联…...
【数据结构】时间复杂度和空间复杂度
🌇个人主页:平凡的小苏 📚学习格言:别人可以拷贝我的模式,但不能拷贝我不断往前的激情 🛸C语言专栏:https://blog.csdn.net/vhhhbb/category_12174730.html 小苏希望大家能从这篇文章中收获到许…...
从发现SQL注入到ssh连接
前言: 某天,同事扔了一个教育站点过来,里面的url看起来像有SQL注入。正好最近手痒痒,就直接开始。 一、发现时间盲注和源码 后面发现他发的url是不存在SQL注入的,但是我在其他地方发现了SQL盲注。然后改站点本身也可…...
SAP ABAP
方法一: REPORT ZDCH_09_TEST2. ************************************************************************ * DATEN DEFINITION * *********************************************************************…...
C/C++每日一练(20230219)
目录 1. 用队列实现栈 2. 判断是否能组成三角形 3. 只出现一次的数字 II 附录 栈(Stack)和队列(Queue)的异同 1. 栈和队列的相同点 2. 栈和队列的不同点 1. 用队列实现栈 请你仅使用两个队列实现一个后入先出(…...
【NestJS】模块
脚手架中,可以执行 nest g mo XXX 创建模块。通过脚手架命令创建的模块,会自动被导入至根模块注册。 注意:项目中的模块都需要导入到根模块中注册一下才能被使用。 共享模块 nest g res boy、nest g res girl 如果希望在 girl 模块中使用 …...
隐私计算头条周刊(2.13-2.19)
开放隐私计算收录于合集#企业动态44个#周刊合辑44个#政策聚焦37个#隐私计算91个#行业研究36个开放隐私计算开放隐私计算OpenMPC是国内第一个且影响力最大的隐私计算开放社区。社区秉承开放共享的精神,专注于隐私计算行业的研究与布道。社区致力于隐私计算技术的传播…...
【STM32笔记】低功耗模式配置及避坑汇总
【STM32笔记】低功耗模式配置及配置汇总 文章总结:(后续更新以相关文章为准) 【STM32笔记】__WFI();进入不了休眠的可能原因 【STM32笔记】HAL库低功耗模式配置(ADC唤醒无法使用、低功耗模式无法烧录解决方案&#x…...
DFN: Dynamic Filter Networks-动态卷积网络
一、论文信息 论文名称:Dynamic Filter Networks 作者团队:NIPS2016 二、动机与创新 卷积层是通过将上一层的特征映射与一组过滤器进行卷积计算输出特征映射,滤波器是卷积层的唯一参数,通常用反向传播算法在训练中学习ÿ…...
面试官:你是怎样理解Fiber的
hello,这里是潇晨,今天我们来聊一聊Fiber。不知道大家面试的时候有没有遇到过和react Fiber相关的问题呢,这一类问题比较开放,但也是考察对react源码理解深度的问题,如果面试高级前端岗,恰巧你平时用的是re…...
【C++的OpenCV】第一课-opencv的介绍和安装(Linux环境下)
第一课-目录一、基本介绍1.1 官网1.2 git源码1.3 介绍二、OpenCV的相关部署工作2.1 Linux平台下部署OpenCV一、基本介绍 1.1 官网 opencv官网 注意:官网为英文版本,可以使用浏览器自带的翻译插件进行翻译,真心不推荐大家去看别人翻译的&am…...
k8s安装tekton,编写task
文章目录一、官方安装二、国内资源安装安装tekton安装dashboard安装CLI三、demo编写task.yaml编写taskRun.yaml使用tkn命令查看参考文章一、官方安装 地址:https://tekton.dev/docs/installation/pipelines/#installing-tekton-pipelines-on-kubernetes 注意&#…...
K_A12_014 基于STM32等单片机驱动S12SD紫外线传感器模块 串口与OLED0.96双显示
K_A12_014 基于STM32等单片机驱动S12SD紫外线传感器模块 串口与OLED0.96双显示一、资源说明二、基本参数参数引脚说明三、驱动说明IIC地址/采集通道选择/时序对应程序:数据对比:四、部分代码说明1、接线引脚定义1.1、STC89C52RCS12SD紫外线传感器模块1.2、STM32F103…...
还真不错,今天 Chatgpt 教会我如何开发一款小工具开发(Python 代码实现)
上次使用 Chatgpt 写爬虫,虽然写出来的代码很多需要修改后才能运行,但Chatgpt提供的思路和框架都是没问题。 这次让 Chatgpt 写一写GUI程序,也就是你常看到的桌面图形程序。 由于第一次测试,就来个简单点的,用Python…...
Boom 3D最新版本下载电脑音频增强应用工具
为了更好地感受音乐的魅力,Boom 3D 可以让你对音效进行个性化增强,并集成 3D 环绕立体声效果,可以让你在使用任何耳机时,都拥有纯正、优质的音乐体验。Boom 3D是一款充满神奇魅力的3D环绕音效升级版,BOOM 3D是一个全新…...
redis-如何保证数据库和缓存双写一致性?
前言 数据库和缓存(比如:redis)双写数据一致性问题,是一个跟开发语言无关的公共问题。尤其在高并发的场景下,这个问题变得更加严重。 我很负责的告诉大家,该问题无论在面试,还是工作中遇到的概率…...
系列二、核心概念运行流程
一、镜像&容器&仓库 1.1、镜像 定义:一个镜像代表着一个软件,例如:mysql镜像、redis镜像、nginx镜像。 特点:只读 1.2、容器 定义:基于某个镜像运行一次就会生成一个程序实例,一个程序实例称之为一…...
恢复 iPhone 和 iPad 数据的 10 种简单工具
它发生了.. 有时您需要从您的手机或平板设备恢复重要数据。 许多人已经开始将重要文件存储在手机上,因为他们几乎可以在任何情况下随时随地轻松访问数据。 从技术上讲,您会在几分之一秒内丢失所有存储的信息、照片、视频、音乐、文档等。因此ÿ…...
经理与员工工资关系-课后程序(JAVA基础案例教程-黑马程序员编著-第四章-课后作业)
【案例4-6】经理与员工工资案例(利用多态实现) 欢迎点赞关注收藏 【案例介绍】 案例描述 某公司的人员分为员工和经理两种,但经理也属于员工中的一种,公司的人员都有自己的姓名和地址,员工和经理都有自己的工号、工…...
装饰模式(Decorator Pattern)重构java邮件发奖系统实战
前言 现在我们有个如下的需求,设计一个邮件发奖的小系统, 需求 1.数据验证 → 2. 敏感信息加密 → 3. 日志记录 → 4. 实际发送邮件 装饰器模式(Decorator Pattern)允许向一个现有的对象添加新的功能,同时又不改变其…...
SciencePlots——绘制论文中的图片
文章目录 安装一、风格二、1 资源 安装 # 安装最新版 pip install githttps://github.com/garrettj403/SciencePlots.git# 安装稳定版 pip install SciencePlots一、风格 简单好用的深度学习论文绘图专用工具包–Science Plot 二、 1 资源 论文绘图神器来了:一行…...
1688商品列表API与其他数据源的对接思路
将1688商品列表API与其他数据源对接时,需结合业务场景设计数据流转链路,重点关注数据格式兼容性、接口调用频率控制及数据一致性维护。以下是具体对接思路及关键技术点: 一、核心对接场景与目标 商品数据同步 场景:将1688商品信息…...
服务器硬防的应用场景都有哪些?
服务器硬防是指一种通过硬件设备层面的安全措施来防御服务器系统受到网络攻击的方式,避免服务器受到各种恶意攻击和网络威胁,那么,服务器硬防通常都会应用在哪些场景当中呢? 硬防服务器中一般会配备入侵检测系统和预防系统&#x…...
Nginx server_name 配置说明
Nginx 是一个高性能的反向代理和负载均衡服务器,其核心配置之一是 server 块中的 server_name 指令。server_name 决定了 Nginx 如何根据客户端请求的 Host 头匹配对应的虚拟主机(Virtual Host)。 1. 简介 Nginx 使用 server_name 指令来确定…...
C# 类和继承(抽象类)
抽象类 抽象类是指设计为被继承的类。抽象类只能被用作其他类的基类。 不能创建抽象类的实例。抽象类使用abstract修饰符声明。 抽象类可以包含抽象成员或普通的非抽象成员。抽象类的成员可以是抽象成员和普通带 实现的成员的任意组合。抽象类自己可以派生自另一个抽象类。例…...
ABAP设计模式之---“简单设计原则(Simple Design)”
“Simple Design”(简单设计)是软件开发中的一个重要理念,倡导以最简单的方式实现软件功能,以确保代码清晰易懂、易维护,并在项目需求变化时能够快速适应。 其核心目标是避免复杂和过度设计,遵循“让事情保…...
springboot整合VUE之在线教育管理系统简介
可以学习到的技能 学会常用技术栈的使用 独立开发项目 学会前端的开发流程 学会后端的开发流程 学会数据库的设计 学会前后端接口调用方式 学会多模块之间的关联 学会数据的处理 适用人群 在校学生,小白用户,想学习知识的 有点基础,想要通过项…...
SQL慢可能是触发了ring buffer
简介 最近在进行 postgresql 性能排查的时候,发现 PG 在某一个时间并行执行的 SQL 变得特别慢。最后通过监控监观察到并行发起得时间 buffers_alloc 就急速上升,且低水位伴随在整个慢 SQL,一直是 buferIO 的等待事件,此时也没有其他会话的争抢。SQL 虽然不是高效 SQL ,但…...
Selenium常用函数介绍
目录 一,元素定位 1.1 cssSeector 1.2 xpath 二,操作测试对象 三,窗口 3.1 案例 3.2 窗口切换 3.3 窗口大小 3.4 屏幕截图 3.5 关闭窗口 四,弹窗 五,等待 六,导航 七,文件上传 …...
