R语言部分题解
- 请论述大数据的四个特点
数据量大(Volume)、数据种类多(Variety)、数据价值密度低(Value)、数据增长速度快(Velocity)
- 为什么目前大数据被广泛使用
科技的进步、基础建设的改进、资料获取变轻松
-
计算1~10的平均数
mean(c(1,2,3,4,5,6,7,8,9,10)) -
3~15每隔3产生一组数字
seq(from=3,to=15,by=3) -
程序改错
3=a Library(”ggpolt2”) 105CGUIM<-”text” install.packages(ggplot2)a=3 Library(ggplot2) CGUIM105<-”text” Install.packages(“ggplot2”) -
(1)创建向量1~10
Vc <- c(1,2,3,4,5,6,7,8,9,10)(2)对向量所有元素加3
Vc <- Vc+3 -
新增一向量a,包含数字1到10
新增一向量b,包含数字1到20中所有偶数取出a向量的第4个元素
取出b向量的第5、6、7个元素
a<-c(1,2,3,4,5,6,7,8,9,10)b<- seq(from=2,to=20,by=2)a[4]b[5:7] -
新增一列表a,包含一数字向量、一字符串向量
向列表中添加新的数字向量b
删除列表a中的字符串向量a<-list(c(1,2,3),c("x","y")) b<-c(2,3) a[[3]]<-b a[[2]]<=null -
(1)查询数据集mtcars中的所有列名
(2)查询数据集mtcars中的所有行名与列名colnames(mtcars) dimnames(mtcars) -
(1)查询数据集islands的长度
(2)查询数据集mtcars的行数与列数length(islands) dim(mtcars) -
将“10”转化为数字、将11转化为字符
as.numeric("10")as.character(11) -
(1)将字符串hello world字母转化为大写
toupper("hello world")(2)提取字符串hello world中的hello
substr("Hello World", start=1,stop=5) -
(1)拼接字符串hello与字符串world
paste("hello","world")(2)将拼接好的字符串中的h和w替换为a
gsub("h|w","a","hello world") -
对数据集islands进行从大到小排序
sort(islands) -
nameDF<-data.frame(ID=c(1,2,3,4,5),Name=c(“张三”,“李四”,“王五”,“赵六”,“小七"))
scoreDF<-data.frame(ID=c(1,2,4),Score=c(60,90,50))将上述两个数据框进行结合,保留所有数据
merge(nameDF,scoreDF,by="ID") -
使用dplyr筛选nba2021数据集栏位名称为Name、ThreesMade、ThreesAttempted、FieldGoalsMade与FieldGoalsAttempted的五个栏位
library(SportsAnalytics)
NBA2021<-fetch_NBAPlayerStatistics(“20-21")library(dplyr) select(NBA2021,Name,hreesMade,ThreesAttempted,FieldGoalsMade,FieldGoalsAttempted)
- 注 下列中的FieldGoalsMade、FieldGoalsAttempted……均是数据中对应的列名
-
使用dplyr:
(1)查看NBA2021数据集中命中率大于60%并且出场次数大于30场的球员资料
(2)查看出场分钟数超过1000分钟并且队伍名称为“BOS”或“SAN”的球员资料(1) filter4<-filter(NBA2021,FieldGoalsMade/FieldGoalsAttempted>0.6 & GamesPlayed>30) (2) filter(NBA2021,Team %in% c("BOS","SAN") & TotalMinutesPlayed>1000) -
使用dplyr对NBA2021数据集新增新栏位命中率
mutate(NBA2021, 命中率=FieldGoalsMade/FieldGoalsAttempted) -
使用dplyr统计NBA2021数据集中的球员个数,球队个数
summarise(NBA2021, 球员个数=n(), 球队个数=n_distinct(Team)) -
使用dplyr计算NBA2021数据集中出场分钟数大于2500分钟的球员个数、平均投进的两分球数以及平均投出的两分球数
filter1 <- filter(NBA2021,TotalMinutesPlayed>2500) sum2 <- summarise(filter1,球员个数=n(),平均投进的两分球数=mean(FieldGoalsMade),平均出手数=mean(FieldGoalsAttempted)) -
使用dplyr对NBA2021数据集以出场分钟数以及出场次数对所有球员进行从大到小的排序
arrange(NBA2021,desc([出场分钟数列名]),desc([出场次数列名])) -
使用dplyr计算NBA2021数据集以Team和Position作为分组依据的球员数、平均投进的两分球数以及平均投出的两分球数,并依据平均投进的两分球数由大到小排序
dataout <- group_by(NBA2021,Team,Position)%>%summarise(球员数=n(),平均投进的两分球数=mean(FieldGoalsMade),平均出手数=mean(FieldGoalsAttempted))%>%arrange(desc(平均投进的两分球数))) -
使用data.table计算所有球员的平均出场数、平均犯规次数以及平均抄截次数
library(SportsAnalytics)
NBA2021<-fetch_NBAPlayerStatistics(“20-21")library(data.table) #导入data.table库 NBA2021DT<-data.table(NBA2021)#将data.frame类型转换为data.tableNBA2021DT[,.(平均出场数=mean(GamesPlayed),平均犯规数=mean(PersonalFouls),平均抢断数=mean(Steals))]#GamesPlayed、PersonalFouls、Steals均为对应列名 -
使用data.table计算所有出场数大于70的球员,平均投进几颗三分球与两分球
NBA2021DT[GamesPlayed>60,.(平均三分进球=mean(ThreesMade), 平均两分进球=mean(FieldGoalsMade))] -
使用data.table计算NBA各队的中锋球员数和他们的平均三分球出手次数
NBA2021DT[Position=="C",.(.N,平均三分出手次数=mean(ThreesAttempted)),by=Team] #第一个参数 Position=="C" 是筛选位置为中锋的球员 #第二个参数是控制输出什么的 .(.N,平均三分出手次数=mean(ThreesAttempted))中: #.N表示在第一个参数条件下的总数量 -
对鸢尾花数据集进行宽表转长表操作,保留鸢尾花类别列
#宽表转长表 melt(资料框[宽表],id.vars=需要保留的栏位)library(reshape2) iris2 <- melt(iris,id.vars="Species")#Species是鸢尾花类别列的列名 -
使用ggplot函数对上述数据进行绘图,横坐标为鸢尾花种类、y轴为value,以鸢尾花种类进行颜色区分,图形类别为点图
library(ggplot2) ggplot(iris2,aes(Species,value,color=Species))+ geom_point() -
使用ggplot函数对上述数据进行绘图,横坐标为鸢尾花种类、y轴为value,图形类别为点图,点颜色为黄色、大小为3、透明度50%、点的形状为17
ggplot(iris2,aes(Species,value))+geom_point(color="yellow",size=3,alpha=.50,shape=17) -
对钻石数据集进行不放回随机抽取5000个数据作为新的数据集、根据数据集绘制点图,x:克拉,y:价格,点的颜色以切割类型区分,点的形状为18。
dia <- diamonds[sample(nrow(diamonds), 1000), ] #diamonds是钻石数据集ggplot(dia,aes(carat,price),color=cut)+geom_point(shape=18) -
请论述下列代码含义
library(treemap) #导入TreeMap树图绘制库 data(GNI2014) #加载指定的GNI2014数据集#使用treemap函数绘制矩形树状图 treemap(GNI2014, #指定数据集index=c("continent", "iso3"), #指定分组的列 vSize="population",#指定面积大小的列vColor="GNI", #指定颜色深浅的列type="value", #指定颜色填充类型的列title = "数据",#给定的标题border.col = c("black","blue"),#设置边框的颜色分别为fontsize.labels = c(12,10),##设置标签字体大小border.lwds = c(4,2),#设置边框的线条的宽度align.labels = list(c("center","center"),c("left","top"))# #设置标签对齐的方式 )
相关文章:
R语言部分题解
请论述大数据的四个特点 数据量大(Volume)、数据种类多(Variety)、数据价值密度低(Value)、数据增长速度快(Velocity) 为什么目前大数据被广泛使用 科技的进步、基础建设的改进、资料获取变轻松 计算1~10的平均数 mean(c(1,2,3,4,5,6,7,8,9,10))3~15…...
水文监测场景的数据通信规约解析和落地实践
[小 迪 导 读]:江苏云上需要通过云平台接入水文设备来实现水文数据的采集、存储、显示、控制、报警及传输等综合功能。企业介绍江苏云上智联物联科技有限公司是专业从事物联网相关产品与解决方案服务的高科技公司,总部位于美丽的江苏无锡。公司遵循“智联…...
【数据结构】时间复杂度和空间复杂度
🌇个人主页:平凡的小苏 📚学习格言:别人可以拷贝我的模式,但不能拷贝我不断往前的激情 🛸C语言专栏:https://blog.csdn.net/vhhhbb/category_12174730.html 小苏希望大家能从这篇文章中收获到许…...
从发现SQL注入到ssh连接
前言: 某天,同事扔了一个教育站点过来,里面的url看起来像有SQL注入。正好最近手痒痒,就直接开始。 一、发现时间盲注和源码 后面发现他发的url是不存在SQL注入的,但是我在其他地方发现了SQL盲注。然后改站点本身也可…...
SAP ABAP
方法一: REPORT ZDCH_09_TEST2. ************************************************************************ * DATEN DEFINITION * *********************************************************************…...
C/C++每日一练(20230219)
目录 1. 用队列实现栈 2. 判断是否能组成三角形 3. 只出现一次的数字 II 附录 栈(Stack)和队列(Queue)的异同 1. 栈和队列的相同点 2. 栈和队列的不同点 1. 用队列实现栈 请你仅使用两个队列实现一个后入先出(…...
【NestJS】模块
脚手架中,可以执行 nest g mo XXX 创建模块。通过脚手架命令创建的模块,会自动被导入至根模块注册。 注意:项目中的模块都需要导入到根模块中注册一下才能被使用。 共享模块 nest g res boy、nest g res girl 如果希望在 girl 模块中使用 …...
隐私计算头条周刊(2.13-2.19)
开放隐私计算收录于合集#企业动态44个#周刊合辑44个#政策聚焦37个#隐私计算91个#行业研究36个开放隐私计算开放隐私计算OpenMPC是国内第一个且影响力最大的隐私计算开放社区。社区秉承开放共享的精神,专注于隐私计算行业的研究与布道。社区致力于隐私计算技术的传播…...
【STM32笔记】低功耗模式配置及避坑汇总
【STM32笔记】低功耗模式配置及配置汇总 文章总结:(后续更新以相关文章为准) 【STM32笔记】__WFI();进入不了休眠的可能原因 【STM32笔记】HAL库低功耗模式配置(ADC唤醒无法使用、低功耗模式无法烧录解决方案&#x…...
DFN: Dynamic Filter Networks-动态卷积网络
一、论文信息 论文名称:Dynamic Filter Networks 作者团队:NIPS2016 二、动机与创新 卷积层是通过将上一层的特征映射与一组过滤器进行卷积计算输出特征映射,滤波器是卷积层的唯一参数,通常用反向传播算法在训练中学习ÿ…...
面试官:你是怎样理解Fiber的
hello,这里是潇晨,今天我们来聊一聊Fiber。不知道大家面试的时候有没有遇到过和react Fiber相关的问题呢,这一类问题比较开放,但也是考察对react源码理解深度的问题,如果面试高级前端岗,恰巧你平时用的是re…...
【C++的OpenCV】第一课-opencv的介绍和安装(Linux环境下)
第一课-目录一、基本介绍1.1 官网1.2 git源码1.3 介绍二、OpenCV的相关部署工作2.1 Linux平台下部署OpenCV一、基本介绍 1.1 官网 opencv官网 注意:官网为英文版本,可以使用浏览器自带的翻译插件进行翻译,真心不推荐大家去看别人翻译的&am…...
k8s安装tekton,编写task
文章目录一、官方安装二、国内资源安装安装tekton安装dashboard安装CLI三、demo编写task.yaml编写taskRun.yaml使用tkn命令查看参考文章一、官方安装 地址:https://tekton.dev/docs/installation/pipelines/#installing-tekton-pipelines-on-kubernetes 注意&#…...
K_A12_014 基于STM32等单片机驱动S12SD紫外线传感器模块 串口与OLED0.96双显示
K_A12_014 基于STM32等单片机驱动S12SD紫外线传感器模块 串口与OLED0.96双显示一、资源说明二、基本参数参数引脚说明三、驱动说明IIC地址/采集通道选择/时序对应程序:数据对比:四、部分代码说明1、接线引脚定义1.1、STC89C52RCS12SD紫外线传感器模块1.2、STM32F103…...
还真不错,今天 Chatgpt 教会我如何开发一款小工具开发(Python 代码实现)
上次使用 Chatgpt 写爬虫,虽然写出来的代码很多需要修改后才能运行,但Chatgpt提供的思路和框架都是没问题。 这次让 Chatgpt 写一写GUI程序,也就是你常看到的桌面图形程序。 由于第一次测试,就来个简单点的,用Python…...
Boom 3D最新版本下载电脑音频增强应用工具
为了更好地感受音乐的魅力,Boom 3D 可以让你对音效进行个性化增强,并集成 3D 环绕立体声效果,可以让你在使用任何耳机时,都拥有纯正、优质的音乐体验。Boom 3D是一款充满神奇魅力的3D环绕音效升级版,BOOM 3D是一个全新…...
redis-如何保证数据库和缓存双写一致性?
前言 数据库和缓存(比如:redis)双写数据一致性问题,是一个跟开发语言无关的公共问题。尤其在高并发的场景下,这个问题变得更加严重。 我很负责的告诉大家,该问题无论在面试,还是工作中遇到的概率…...
系列二、核心概念运行流程
一、镜像&容器&仓库 1.1、镜像 定义:一个镜像代表着一个软件,例如:mysql镜像、redis镜像、nginx镜像。 特点:只读 1.2、容器 定义:基于某个镜像运行一次就会生成一个程序实例,一个程序实例称之为一…...
恢复 iPhone 和 iPad 数据的 10 种简单工具
它发生了.. 有时您需要从您的手机或平板设备恢复重要数据。 许多人已经开始将重要文件存储在手机上,因为他们几乎可以在任何情况下随时随地轻松访问数据。 从技术上讲,您会在几分之一秒内丢失所有存储的信息、照片、视频、音乐、文档等。因此ÿ…...
经理与员工工资关系-课后程序(JAVA基础案例教程-黑马程序员编著-第四章-课后作业)
【案例4-6】经理与员工工资案例(利用多态实现) 欢迎点赞关注收藏 【案例介绍】 案例描述 某公司的人员分为员工和经理两种,但经理也属于员工中的一种,公司的人员都有自己的姓名和地址,员工和经理都有自己的工号、工…...
RocketMQ延迟消息机制
两种延迟消息 RocketMQ中提供了两种延迟消息机制 指定固定的延迟级别 通过在Message中设定一个MessageDelayLevel参数,对应18个预设的延迟级别指定时间点的延迟级别 通过在Message中设定一个DeliverTimeMS指定一个Long类型表示的具体时间点。到了时间点后…...
大话软工笔记—需求分析概述
需求分析,就是要对需求调研收集到的资料信息逐个地进行拆分、研究,从大量的不确定“需求”中确定出哪些需求最终要转换为确定的“功能需求”。 需求分析的作用非常重要,后续设计的依据主要来自于需求分析的成果,包括: 项目的目的…...
Qt/C++开发监控GB28181系统/取流协议/同时支持udp/tcp被动/tcp主动
一、前言说明 在2011版本的gb28181协议中,拉取视频流只要求udp方式,从2016开始要求新增支持tcp被动和tcp主动两种方式,udp理论上会丢包的,所以实际使用过程可能会出现画面花屏的情况,而tcp肯定不丢包,起码…...
在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能
下面我将详细介绍如何使用HarmonyOS SDK在HarmonyOS 5中实现类似抖音的点赞功能,包括动画效果、数据同步和交互优化。 1. 基础点赞功能实现 1.1 创建数据模型 // VideoModel.ets export class VideoModel {id: string "";title: string ""…...
智慧工地云平台源码,基于微服务架构+Java+Spring Cloud +UniApp +MySql
智慧工地管理云平台系统,智慧工地全套源码,java版智慧工地源码,支持PC端、大屏端、移动端。 智慧工地聚焦建筑行业的市场需求,提供“平台网络终端”的整体解决方案,提供劳务管理、视频管理、智能监测、绿色施工、安全管…...
在 Nginx Stream 层“改写”MQTT ngx_stream_mqtt_filter_module
1、为什么要修改 CONNECT 报文? 多租户隔离:自动为接入设备追加租户前缀,后端按 ClientID 拆分队列。零代码鉴权:将入站用户名替换为 OAuth Access-Token,后端 Broker 统一校验。灰度发布:根据 IP/地理位写…...
Axios请求超时重发机制
Axios 超时重新请求实现方案 在 Axios 中实现超时重新请求可以通过以下几种方式: 1. 使用拦截器实现自动重试 import axios from axios;// 创建axios实例 const instance axios.create();// 设置超时时间 instance.defaults.timeout 5000;// 最大重试次数 cons…...
大数据学习(132)-HIve数据分析
🍋🍋大数据学习🍋🍋 🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言Ǵ…...
Aspose.PDF 限制绕过方案:Java 字节码技术实战分享(仅供学习)
Aspose.PDF 限制绕过方案:Java 字节码技术实战分享(仅供学习) 一、Aspose.PDF 简介二、说明(⚠️仅供学习与研究使用)三、技术流程总览四、准备工作1. 下载 Jar 包2. Maven 项目依赖配置 五、字节码修改实现代码&#…...
Docker 本地安装 mysql 数据库
Docker: Accelerated Container Application Development 下载对应操作系统版本的 docker ;并安装。 基础操作不再赘述。 打开 macOS 终端,开始 docker 安装mysql之旅 第一步 docker search mysql 》〉docker search mysql NAME DE…...
