Hive+Flume+Kafka章节测试六错题总结
题目2:
EXTERNAL关键字的作用?[多选]
A、EXTERNAL关键字可以让用户创建一个外部表
B、创建外部表时,可以不加EXTERNAL关键字
C、通过EXTERNAL创建的外部表只删除元数据,不删除数据
D、不加EXTERNAL的时候,默认创建内部表也叫管理表
【参考答案】: ACD
【您的答案】: ABC
external关键字可以让用户创建一个外部表,在建表的同时可以指定一个指向实际数据的路径(location),在删除表的时候,内部表的元数据和数据会被一起删除,而外部表只删除元数据,不删除数据。默认创建的表都是所谓的管理表,有时也被称为内部表。因为这种表,Hive会(或多或少地)控制着数据的生命周期。所以ACD选项是正确的,不加external是内部表,B选项错误。
题目3:
对as和like的描述正确的是?[多选]
A、as可以将查询结果添加到新创建的表中
B、like根据已经存在的表结构创建表
C、as针对数据,like针对结构
D、as和like的作用一样
【参考答案】: ABC
【您的答案】: BC
根据查询结果创建表(查询的结果会添加到新创建的表中)
- hive (default)>
create table if not exists student2 AS select id, name from student;
这个就是将查询结果添加到新创建的表中,所以A选项正确。
题目7:
聚合函数sum()over(…order by cu),中order by描述正确的是? [单选题]
A、只要开窗中如果使用order by ,有累加功能,默认等于UNBOUNDED PRECEDING and current row
B、在聚合函数后,开窗中如果使用order by ,有累加功能,默认等于UNBOUNDED PRECEDING and current row
C、在非聚合函数后,开窗中如果使用order by ,有累加功能,默认等于UNBOUNDED PRECEDING and current row
D、在聚合函数后,开窗中如果无论是否使用order by ,都具有累加功能,默认等于UNBOUNDED PRECEDING and current row
【参考答案】: B
【您的答案】: A
B、在聚合函数后,开窗中如果使用order by,有累加功能,默认等于UNBOUNDED PRECEDING and current row。
在使用聚合函数后,如果在开窗函数中使用ORDER BY子句,它会定义用于计算累积的顺序,通常是按照某个列的值排序。默认情况下,它等同于UNBOUNDED PRECEDING and current row,这意味着对当前行及其之前的所有行进行累加操作。这允许你在窗口中根据指定的排序顺序对聚合函数进行计算。
题目12:
下列关于减少topic的分区数的描述正确的是?[单选题]
A、可以减少,使用命令sub进行移除。
B、可以减少,使用命令alter进行修改。
C、不可以减少,因为是一旦创建就不能改变的。
D、不可以减少,被删除的分区数据难以处理。
【参考答案】: D
【您的答案】: C
D、不可以减少,被删除的分区数据难以处理。
分区数一旦创建后通常是不可以减少的。删除分区会导致删除数据,这些数据难以恢复,因此通常情况下,分区数的减少是不允许的。如果需要减少分区数,通常需要创建一个新的表或数据集来满足新的需求,并迁移数据到新表中,而不是修改现有的分区数。
题目13:
下列关于Exactly Once语义中描述错误的是?[单选题]
A、当ack=-1,可以保证数据不会丢失。
B、当ack=0,可以保证数据不会重复。
C、当ack=1,即可以保证数据不会重复,也可以保证数据不会丢失。
D、幂等性无法保证跨分区跨会话的Exactly Once。
【参考答案】: C
【您的答案】: B
C、当ack=1,只能保证数据不会丢失,但无法保证数据不会重复。A选项,当ack=-1时,默认数据是不会丢失的。B选项,当ack等于0时,数据只会发送一次,不需要等待回复确认,可以保证数据不会重复。D选项,如果生产者中途宕机,然后重新建立会话时,不能保证不同会话时PID是一样,这时候重新发送重复数据时无法保证幂等性。
C选项,只能保证数据不会丢失,不能保证数据不会重复的问题。
题目15:
下列关于kafka 造成数据丢失的场景描述正确的是?[多选题]
A、ack=0时,leader故障有可能丢失数据。
B、ack=1时,在follower同步成功之前leader故障,将会丢失数据。
C、ack=-1时,在follower同步完成后,broker发送ack之前,leader发生故障,可能会丢失数据。
D、ack=-1时,在follower同步完成前,broker发送ack之后,leader发生故障,可能会丢失数据。
【参考答案】: AB
【您的答案】: ABD
ack=-1时,不会丢数据,所以C, D 错误
题目17:
配置Metastore到MySql的说法正确的是? [单选题]
A、默认数据库derby容量太小
B、为了能够实现多窗口启动hive
C、为了使用JDBC的方式连接Hive
D、默认数据库也能实现hive多窗口启动
【参考答案】: B
【您的答案】: C
在某些情况下,为了支持多个Hive客户端同时连接到Hive Metastore,需要将Metastore配置为使用外部数据库,如MySQL。这是因为默认的Derby数据库通常只支持单个连接,这意味着只能有一个Hive客户端会话在同一时间连接到Hive Metastore。通过将Metastore配置为使用外部数据库,可以允许多个Hive客户端并发连接到Metastore,实现多窗口启动Hive。
题目21:
Hive中对Parquet格式描述正确的是?[多选]
A、Parquet文件是以二进制方式存储的,所以是不可以直接读取的
B、文件中包括该文件的数据和元数据,因此Parquet格式文件是自解析的。
C、可以把每一个行组由一个Mapper任务处理,增大任务执行并行度
D、在Parquet中,有三种类型的页:数据页、字典页和索引页
【参考答案】: ABCD
【您的答案】: BC
A选项:Parquet文件是以二进制方式存储的,所以是不可以直接读取的,从某个角度来说不是很准确,是可以读取和解析的,但解释为不可以直接读取也是正确的。
D选项:正确,就是这三种类型。
题目23:
Hive中对本地模式描述正确的是?[多选]
A、Hive可以通过本地模式在单台机器上处理所有的任务
B、对于小数据集,执行时间可以明显被缩短。
C、用户可以通过设置hive.exec.mode.local.auto的值为true,来让Hive在适当的时候自动启动这个优化,默认是false。
D、设置local mr的最大输入数据量,当输入数据量小于这个值时采用local mr的方式,默认为134217728,即128M
【参考答案】: ABCD
【您的答案】: ABD
C选项是正确的,存在该参数,在hive/conf/hive-default.xml.template文件中可以查看到该参数的默认情况,默认为false。
<property><name>hive.exec.mode.local.auto</name><value>false</value><description>Let Hive determine whether to run in local mode automatically</description></property>
题目24:
Hive中对推测执行描述正确的是?[多选]
A、为了避免,一个作业的多个任务之间运行速度不一致,一个慢的任务会拖慢作业的整体执行进度这种情况,Hadoop采用了推测执行(Speculative Execution)机制。
B、根据一定的法则推测出“拖后腿”的任务,并为这样的任务启动一个备份任务,让该任务与原始任务同时处理同一份数据,并最终选用最先成功运行完成任务的计算结果作为最终结果。
C、Hadoop的mapred-site.xml文件中进行配置,mapreduce.map.speculative默认是true
D、hive本身也提供了配置项来控制reduce-side的推测执行:hive.mapred.reduce.tasks.speculative.execution默认是true
【参考答案】: ABCD
【您的答案】: ACD
C 选项,在mapred-default.xml文件总找到了该参数,默认确实为true。
<property><name>mapreduce.map.speculative</name><value>true</value><description>If true, then multiple instances of some map tasksmay be executed in parallel.</description>
</property>
D选项, 在hive/conf/hive-default.xml.template文件中确实存在配置项来控制推测执行,正确。
<property><name>hive.mapred.reduce.tasks.speculative.execution</name><value>true</value><description>Whether speculative execution for reducers should be turned on. </description></property>
题目25:
Hive中对动态分区描述正确的是?[多选]
A、对分区表Insert数据时候,hive自动会根据分区字段的值,将数据插入到相应的分区中,但需要进行相应的配置。
B、开启动态分区功能(默认true,开启)hive.exec.dynamic.partition=true
C、在所有执行MR的节点上,最大一共可以创建多少个动态分区。默认1000
D、整个MR Job中,最大可以创建多少个HDFS文件。默认100000
【参考答案】: ABCD
【您的答案】: ACD
B选项,在hive/conf/hive-default.xml.template文件中可以确定动态分区功能默认是开启的。
<property><name>hive.exec.dynamic.partition</name><value>true</value><description>Whether or not to allow dynamic partitions in DML/DDL.</description></property>
题目26:
Hive中对内外表描述正确的是?[多选]
A、可以通过desc formatted table 来查询表的类型
B、修改内部表xxx为外部表alter table xxx set tblproperties(‘EXTERNAL’=‘TRUE’);
C、修改外部表xxx为内部表alter table xxx set tblproperties(‘EXTERNAL’=‘FALSE’);
D、(‘EXTERNAL’=‘TRUE’)和(‘EXTERNAL’=‘FALSE’)为固定写法,区分大小写
【参考答案】: ABCD
【您的答案】: AD
A、可以通过 desc formatted table 来查询表的类型。这是正确的,可以使用此命令来查看表的详细信息,包括表的类型(内部表或外部表)。
B、修改内部表为外部表的语法是使用以下命令:
ALTER TABLE xxx
SET TBLPROPERTIES('EXTERNAL'='TRUE');
这个命令是正确的,它将内部表修改为外部表。
C、修改外部表为内部表的语法是使用以下命令:
ALTER TABLE xxx
SET TBLPROPERTIES('EXTERNAL'='FALSE');
这个命令是正确的,它将外部表修改为内部表。
D、('EXTERNAL'='TRUE') 和 ('EXTERNAL'='FALSE') 是用于设置表属性的键值对,它们不是固定写法,而是用来指示表的类型的。这些键值对的大小写是敏感的,所以区分大小写是正确的。
所以正确的选项是 A、B、C 和 D。
相关文章:
Hive+Flume+Kafka章节测试六错题总结
题目2: EXTERNAL关键字的作用?[多选] A、EXTERNAL关键字可以让用户创建一个外部表 B、创建外部表时,可以不加EXTERNAL关键字 C、通过EXTERNAL创建的外部表只删除元数据,不删除数据 D、不加EXTERNAL的时候,默认创建内…...
【随笔】论多线程CPU离线渲染器的实现:A CPU BASED OFFLINE RENDERING ENGINE
前言 小熊挺喜欢玩游戏的,对于游戏画面有所追求,记得高中第一次玩战地的时候,惊叹于画面细腻的表现,并且还能开坦克车,这样的事情深深吸引了我。我是一个画面党,为了追求更好的画质表现我开始研究设置面板…...
多输入多输出 | MATLAB实现CNN-GRU-Attention卷积神经网络-门控循环单元结合SE注意力机制的多输入多输出预测
多输入多输出 | MATLAB实现CNN-GRU-Attention卷积神经网络-门控循环单元结合SE注意力机制的多输入多输出预测 目录 多输入多输出 | MATLAB实现CNN-GRU-Attention卷积神经网络-门控循环单元结合SE注意力机制的多输入多输出预测预测效果基本介绍程序设计往期精彩参考资料 预测效果…...
Ubuntu:Arduino IDE 开发环境配置【保姆级】
物联网开发学习笔记——目录索引 本章主要介绍在Ubuntu系统搭建Arduino IDE 开发环境,windows系统请移步:Windows:Arduino IDE 开发环境配置【保姆级】 参考官网:Arduino - Home 有关更多详细信息,请参阅 Arduino I…...
Kafka 开启SASL/SCRAM认证 及 ACL授权(三)验证
Kafka 开启SASL/SCRAM认证 及 ACL授权(三)验证。 官网地址:https://kafka.apache.org/ 本文说明如何做client验证ACL是否生效,我们之前开启了无acl信息不允许访问的配置。涉及的client有以下几个场景:shell脚本、python脚本、java应用、flink流。 kafka shell script验证…...
Pycharm 2023 设置远程调试
pycharm 版本 : 2023.2.1 整体流程参考:https://blog.csdn.net/xuanhaolaile/article/details/128293254 首先确定远程服务器上已经安装好 requirements.txt 中所需的依赖包。 1、SSH Configurations 添加远程服务器 2、Python Interpreter 注意&…...
asp.net core在其他程序集获取HttpContext
首先在Program.cs中,注册 builder.Services.AddHttpContextAccessor();Program.cs完整代码: using Microsoft.AspNetCore.Mvc.Filters; using Microsoft.CodeAnalysis.CSharp.Syntax; using System.Text.Encodings.Web; using System.Text.Unicode; us…...
UWB NI框架嵌入式实现——Qorvo示例
在Qorvo提供的DW3000示例代码中,实现了与Apple的NI框架的互通的示例,本文中针对其示例程序进行简要的分析。测试中使用Qorvo提供的模块,该模块为nRF52833DW3000的架构。 1. Qorvo相关库文件 Qorvo在提供示例时,仅提供了相关的库文…...
Linux OS源的问题记录
场景 安装了一台Linux虚拟机充当服务器,准备搭建一个elk环境,我使用命令安装docker的时候,报错提示 YumRepo Error: All mirror URLs are not using ftp, http[s] or file.Eg. Invalid release/repo/arch combination/ removing mirrorlist…...
数据库:Hive转Presto(五)
此篇将所有代码都补充完了,之前发现有的代码写错了,以这篇为准,以下为完整代码,如果发现我有什么考虑不周的地方,可以评论提建议,感谢。代码是想哪写哪,可能比较繁琐,还需要优化。 …...
SQL中for xml path 的用法
1. 用法 是一种将查询结果转换为 XML 格式的方法。它可以将查询结果中的每一行转换为一个 XML 元素,并且可以指定元素的名称和属性。 2. 应用示例 有一张学生选修课程的表,如下图所示 希望整合成下图所示效果 --建表 if object_id(StudentInfo,u) is…...
【TensorFlow2 之014】在 TF 2.0 中实现 LeNet-5
一、说明 在这篇文章中,我们将展示如何在 TensorFlow 中实现像 \(LeNet-5\) 这样的基础卷积神经网络。LeNet-5 架构由 Yann LeCun 于 1998 年发明,是第一个卷积神经网络。 数据黑客变种rs 深度学习 机器学习 TensorFlow 2020 年 2 月 29 日 | 0 …...
【2023】redis-stream配合spring的data-redis详细使用(包括广播和组接收)
目录 一、简介1、介绍2、对比 二、整合spring的data-redis实现1、使用依赖2、配置类2.1、配置RedisTemplate bean2.2、异常类 3、实体类3.1、User3.2、Book 4、发送消息4.1、RedisStreamUtil工具类4.2、通过延时队列线程池模拟发送消息4.3、通过http主动发送消息 5、dz…...
飞书应用机器人文件上传
背景: 接上一篇 flask_apscheduler实现定时推送飞书消息,当检查出的异常结果比较多的时候,群里会有很多推送消息,一条条检查工作量会比较大,且容易出现遗漏。 现在需要将定时任务执行的结果记录到文件,…...
高版本Mac系统如何打开低版本的Xcode
这里写目录标题 前言解决方案 前言 大家偶尔也碰见过更新Mac系统后经常发现低版本的Xcode用不了的情况吧.基本每年大版本更新之后都可以在各个开发群里碰见问这个问题的. 解决方案 打开访达->应用程序->选中打不开的那个版本的Xcode并且右键显示包内容->Contents-…...
测试H5需要注意的交互测试用例点
H5(HTML5)是一种用于构建网页的标准,可以实现丰富的交互和功能。测试H5交互通常涉及到验证网页在各种情况下的行为,包括用户输入、按钮点击、页面加载等等。以下是一些可能的H5交互测试用例: 页面加载: 验…...
1014蓝桥算法双周赛,学习算法技巧,助力蓝桥杯
家人们,我来免费给大家送福利了!!! 【1014蓝桥算法双周赛 】 背景 蓝桥杯全国软件和信息技术专业人才大赛是由工业和信息化部人才交流中心举办的全国性IT学科赛事。参赛高校超过1200余所,累计参赛人数超过40万人。该…...
C语言之通讯录的实现篇
目录 test.c 主菜单menu 创建通讯录con 初始化通讯录InitContact 增加个人信息AddContact 展示个人信息ShowContact 删除个人信息DelContact 查找个人信息SearchContact 修改个人信息ModifyContact test.c总代码 contact.h 头文件包含 PeoInfo_个人信息的设置声…...
如何降低海康、大华等网络摄像头调用的高延迟问题(二)
目录 1.RTSP介绍 2.解决办法1 3.解决办法2 1.RTSP介绍 RTSP(Real-time Streaming Protocol)是一种用于实时流媒体传输的网络协议。它被设计用于在服务器和客户端之间传输音频、视频以及其他流媒体数据。 RTSP协议允许客户端通过与服务器建立RTSP会话…...
centos清理日志和缓存
今天使用redmine修改密码,修改报错,再去试试创建用户,创建用户的页面直接报错显示不出来。然后看了一下服务器,发现服务器磁盘空间全部占满了。 CentOS系统也会在使用很长一段时间后出现硬盘空间开始不够的情况,而这并…...
日语学习-日语知识点小记-构建基础-JLPT-N4阶段(33):にする
日语学习-日语知识点小记-构建基础-JLPT-N4阶段(33):にする 1、前言(1)情况说明(2)工程师的信仰2、知识点(1) にする1,接续:名词+にする2,接续:疑问词+にする3,(A)は(B)にする。(2)復習:(1)复习句子(2)ために & ように(3)そう(4)にする3、…...
电脑插入多块移动硬盘后经常出现卡顿和蓝屏
当电脑在插入多块移动硬盘后频繁出现卡顿和蓝屏问题时,可能涉及硬件资源冲突、驱动兼容性、供电不足或系统设置等多方面原因。以下是逐步排查和解决方案: 1. 检查电源供电问题 问题原因:多块移动硬盘同时运行可能导致USB接口供电不足&#x…...
HTML前端开发:JavaScript 常用事件详解
作为前端开发的核心,JavaScript 事件是用户与网页交互的基础。以下是常见事件的详细说明和用法示例: 1. onclick - 点击事件 当元素被单击时触发(左键点击) button.onclick function() {alert("按钮被点击了!&…...
Caliper 配置文件解析:config.yaml
Caliper 是一个区块链性能基准测试工具,用于评估不同区块链平台的性能。下面我将详细解释你提供的 fisco-bcos.json 文件结构,并说明它与 config.yaml 文件的关系。 fisco-bcos.json 文件解析 这个文件是针对 FISCO-BCOS 区块链网络的 Caliper 配置文件,主要包含以下几个部…...
企业如何增强终端安全?
在数字化转型加速的今天,企业的业务运行越来越依赖于终端设备。从员工的笔记本电脑、智能手机,到工厂里的物联网设备、智能传感器,这些终端构成了企业与外部世界连接的 “神经末梢”。然而,随着远程办公的常态化和设备接入的爆炸式…...
Web 架构之 CDN 加速原理与落地实践
文章目录 一、思维导图二、正文内容(一)CDN 基础概念1. 定义2. 组成部分 (二)CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 (三)CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 …...
初学 pytest 记录
安装 pip install pytest用例可以是函数也可以是类中的方法 def test_func():print()class TestAdd: # def __init__(self): 在 pytest 中不可以使用__init__方法 # self.cc 12345 pytest.mark.api def test_str(self):res add(1, 2)assert res 12def test_int(self):r…...
【MATLAB代码】基于最大相关熵准则(MCC)的三维鲁棒卡尔曼滤波算法(MCC-KF),附源代码|订阅专栏后可直接查看
文章所述的代码实现了基于最大相关熵准则(MCC)的三维鲁棒卡尔曼滤波算法(MCC-KF),针对传感器观测数据中存在的脉冲型异常噪声问题,通过非线性加权机制提升滤波器的抗干扰能力。代码通过对比传统KF与MCC-KF在含异常值场景下的表现,验证了后者在状态估计鲁棒性方面的显著优…...
Git常用命令完全指南:从入门到精通
Git常用命令完全指南:从入门到精通 一、基础配置命令 1. 用户信息配置 # 设置全局用户名 git config --global user.name "你的名字"# 设置全局邮箱 git config --global user.email "你的邮箱example.com"# 查看所有配置 git config --list…...
Ubuntu Cursor升级成v1.0
0. 当前版本低 使用当前 Cursor v0.50时 GitHub Copilot Chat 打不开,快捷键也不好用,当看到 Cursor 升级后,还是蛮高兴的 1. 下载 Cursor 下载地址:https://www.cursor.com/cn/downloads 点击下载 Linux (x64) ,…...
