当前位置: 首页 > news >正文

Hive+Flume+Kafka章节测试六错题总结

题目2:

EXTERNAL关键字的作用?[多选]

A、EXTERNAL关键字可以让用户创建一个外部表
B、创建外部表时,可以不加EXTERNAL关键字
C、通过EXTERNAL创建的外部表只删除元数据,不删除数据
D、不加EXTERNAL的时候,默认创建内部表也叫管理表
【参考答案】: ACD
【您的答案】: ABC

external关键字可以让用户创建一个外部表,在建表的同时可以指定一个指向实际数据的路径(location),在删除表的时候,内部表的元数据和数据会被一起删除,而外部表只删除元数据,不删除数据。默认创建的表都是所谓的管理表,有时也被称为内部表。因为这种表,Hive会(或多或少地)控制着数据的生命周期。所以ACD选项是正确的,不加external是内部表,B选项错误。

题目3:

对as和like的描述正确的是?[多选]

A、as可以将查询结果添加到新创建的表中
B、like根据已经存在的表结构创建表
C、as针对数据,like针对结构
D、as和like的作用一样
【参考答案】: ABC
【您的答案】: BC

根据查询结果创建表(查询的结果会添加到新创建的表中)

  • hive (default)>create table if not exists student2 AS select id, name from student;

这个就是将查询结果添加到新创建的表中,所以A选项正确。

题目7:

聚合函数sum()over(…order by cu),中order by描述正确的是? [单选题]

A、只要开窗中如果使用order by ,有累加功能,默认等于UNBOUNDED PRECEDING and current row
B、在聚合函数后,开窗中如果使用order by ,有累加功能,默认等于UNBOUNDED PRECEDING and current row
C、在非聚合函数后,开窗中如果使用order by ,有累加功能,默认等于UNBOUNDED PRECEDING and current row
D、在聚合函数后,开窗中如果无论是否使用order by ,都具有累加功能,默认等于UNBOUNDED PRECEDING and current row
【参考答案】: B
【您的答案】: A

B、在聚合函数后,开窗中如果使用order by,有累加功能,默认等于UNBOUNDED PRECEDING and current row。

在使用聚合函数后,如果在开窗函数中使用ORDER BY子句,它会定义用于计算累积的顺序,通常是按照某个列的值排序。默认情况下,它等同于UNBOUNDED PRECEDING and current row,这意味着对当前行及其之前的所有行进行累加操作。这允许你在窗口中根据指定的排序顺序对聚合函数进行计算。

题目12:

下列关于减少topic的分区数的描述正确的是?[单选题]

A、可以减少,使用命令sub进行移除。
B、可以减少,使用命令alter进行修改。
C、不可以减少,因为是一旦创建就不能改变的。
D、不可以减少,被删除的分区数据难以处理。
【参考答案】: D
【您的答案】: C

D、不可以减少,被删除的分区数据难以处理。

分区数一旦创建后通常是不可以减少的。删除分区会导致删除数据,这些数据难以恢复,因此通常情况下,分区数的减少是不允许的。如果需要减少分区数,通常需要创建一个新的表或数据集来满足新的需求,并迁移数据到新表中,而不是修改现有的分区数。

题目13:

下列关于Exactly Once语义中描述错误的是?[单选题]

A、当ack=-1,可以保证数据不会丢失。
B、当ack=0,可以保证数据不会重复。
C、当ack=1,即可以保证数据不会重复,也可以保证数据不会丢失。
D、幂等性无法保证跨分区跨会话的Exactly Once。
【参考答案】: C
【您的答案】: B

C、当ack=1,只能保证数据不会丢失,但无法保证数据不会重复。A选项,当ack=-1时,默认数据是不会丢失的。B选项,当ack等于0时,数据只会发送一次,不需要等待回复确认,可以保证数据不会重复。D选项,如果生产者中途宕机,然后重新建立会话时,不能保证不同会话时PID是一样,这时候重新发送重复数据时无法保证幂等性。

C选项,只能保证数据不会丢失,不能保证数据不会重复的问题。

题目15:

下列关于kafka 造成数据丢失的场景描述正确的是?[多选题]

A、ack=0时,leader故障有可能丢失数据。
B、ack=1时,在follower同步成功之前leader故障,将会丢失数据。
C、ack=-1时,在follower同步完成后,broker发送ack之前,leader发生故障,可能会丢失数据。
D、ack=-1时,在follower同步完成前,broker发送ack之后,leader发生故障,可能会丢失数据。
【参考答案】: AB
【您的答案】: ABD

ack=-1时,不会丢数据,所以C, D 错误

题目17:

配置Metastore到MySql的说法正确的是? [单选题]

A、默认数据库derby容量太小
B、为了能够实现多窗口启动hive
C、为了使用JDBC的方式连接Hive
D、默认数据库也能实现hive多窗口启动
【参考答案】: B
【您的答案】: C

在某些情况下,为了支持多个Hive客户端同时连接到Hive Metastore,需要将Metastore配置为使用外部数据库,如MySQL。这是因为默认的Derby数据库通常只支持单个连接,这意味着只能有一个Hive客户端会话在同一时间连接到Hive Metastore。通过将Metastore配置为使用外部数据库,可以允许多个Hive客户端并发连接到Metastore,实现多窗口启动Hive。

题目21:

Hive中对Parquet格式描述正确的是?[多选]

A、Parquet文件是以二进制方式存储的,所以是不可以直接读取的
B、文件中包括该文件的数据和元数据,因此Parquet格式文件是自解析的。
C、可以把每一个行组由一个Mapper任务处理,增大任务执行并行度
D、在Parquet中,有三种类型的页:数据页、字典页和索引页
【参考答案】: ABCD
【您的答案】: BC

A选项:Parquet文件是以二进制方式存储的,所以是不可以直接读取的,从某个角度来说不是很准确,是可以读取和解析的,但解释为不可以直接读取也是正确的。

D选项:正确,就是这三种类型。

题目23:

Hive中对本地模式描述正确的是?[多选]

A、Hive可以通过本地模式在单台机器上处理所有的任务
B、对于小数据集,执行时间可以明显被缩短。
C、用户可以通过设置hive.exec.mode.local.auto的值为true,来让Hive在适当的时候自动启动这个优化,默认是false。
D、设置local mr的最大输入数据量,当输入数据量小于这个值时采用local mr的方式,默认为134217728,即128M
【参考答案】: ABCD
【您的答案】: ABD

C选项是正确的,存在该参数,在hive/conf/hive-default.xml.template文件中可以查看到该参数的默认情况,默认为false。

<property><name>hive.exec.mode.local.auto</name><value>false</value><description>Let Hive determine whether to run in local mode automatically</description></property>

题目24:

Hive中对推测执行描述正确的是?[多选]

A、为了避免,一个作业的多个任务之间运行速度不一致,一个慢的任务会拖慢作业的整体执行进度这种情况,Hadoop采用了推测执行(Speculative Execution)机制。
B、根据一定的法则推测出“拖后腿”的任务,并为这样的任务启动一个备份任务,让该任务与原始任务同时处理同一份数据,并最终选用最先成功运行完成任务的计算结果作为最终结果。
C、Hadoop的mapred-site.xml文件中进行配置,mapreduce.map.speculative默认是true
D、hive本身也提供了配置项来控制reduce-side的推测执行:hive.mapred.reduce.tasks.speculative.execution默认是true
【参考答案】: ABCD
【您的答案】: ACD

C 选项,在mapred-default.xml文件总找到了该参数,默认确实为true。

<property><name>mapreduce.map.speculative</name><value>true</value><description>If true, then multiple instances of some map tasksmay be executed in parallel.</description>
</property>

D选项, 在hive/conf/hive-default.xml.template文件中确实存在配置项来控制推测执行,正确。

<property><name>hive.mapred.reduce.tasks.speculative.execution</name><value>true</value><description>Whether speculative execution for reducers should be turned on. </description></property>

题目25:

Hive中对动态分区描述正确的是?[多选]

A、对分区表Insert数据时候,hive自动会根据分区字段的值,将数据插入到相应的分区中,但需要进行相应的配置。
B、开启动态分区功能(默认true,开启)hive.exec.dynamic.partition=true
C、在所有执行MR的节点上,最大一共可以创建多少个动态分区。默认1000
D、整个MR Job中,最大可以创建多少个HDFS文件。默认100000
【参考答案】: ABCD
【您的答案】: ACD
B选项,在hive/conf/hive-default.xml.template文件中可以确定动态分区功能默认是开启的。

<property><name>hive.exec.dynamic.partition</name><value>true</value><description>Whether or not to allow dynamic partitions in DML/DDL.</description></property>

题目26:

Hive中对内外表描述正确的是?[多选]

A、可以通过desc formatted table 来查询表的类型
B、修改内部表xxx为外部表alter table xxx set tblproperties(‘EXTERNAL’=‘TRUE’);
C、修改外部表xxx为内部表alter table xxx set tblproperties(‘EXTERNAL’=‘FALSE’);
D、(‘EXTERNAL’=‘TRUE’)和(‘EXTERNAL’=‘FALSE’)为固定写法,区分大小写
【参考答案】: ABCD
【您的答案】: AD
A、可以通过 desc formatted table 来查询表的类型。这是正确的,可以使用此命令来查看表的详细信息,包括表的类型(内部表或外部表)。

B、修改内部表为外部表的语法是使用以下命令:

ALTER TABLE xxx 
SET TBLPROPERTIES('EXTERNAL'='TRUE');

这个命令是正确的,它将内部表修改为外部表。

C、修改外部表为内部表的语法是使用以下命令:

ALTER TABLE xxx 
SET TBLPROPERTIES('EXTERNAL'='FALSE');

这个命令是正确的,它将外部表修改为内部表。

D、('EXTERNAL'='TRUE')('EXTERNAL'='FALSE') 是用于设置表属性的键值对,它们不是固定写法,而是用来指示表的类型的。这些键值对的大小写是敏感的,所以区分大小写是正确的。

所以正确的选项是 A、B、C 和 D。

相关文章:

Hive+Flume+Kafka章节测试六错题总结

题目2&#xff1a; EXTERNAL关键字的作用&#xff1f;[多选] A、EXTERNAL关键字可以让用户创建一个外部表 B、创建外部表时&#xff0c;可以不加EXTERNAL关键字 C、通过EXTERNAL创建的外部表只删除元数据&#xff0c;不删除数据 D、不加EXTERNAL的时候&#xff0c;默认创建内…...

【随笔】论多线程CPU离线渲染器的实现:A CPU BASED OFFLINE RENDERING ENGINE

前言 小熊挺喜欢玩游戏的&#xff0c;对于游戏画面有所追求&#xff0c;记得高中第一次玩战地的时候&#xff0c;惊叹于画面细腻的表现&#xff0c;并且还能开坦克车&#xff0c;这样的事情深深吸引了我。我是一个画面党&#xff0c;为了追求更好的画质表现我开始研究设置面板…...

多输入多输出 | MATLAB实现CNN-GRU-Attention卷积神经网络-门控循环单元结合SE注意力机制的多输入多输出预测

多输入多输出 | MATLAB实现CNN-GRU-Attention卷积神经网络-门控循环单元结合SE注意力机制的多输入多输出预测 目录 多输入多输出 | MATLAB实现CNN-GRU-Attention卷积神经网络-门控循环单元结合SE注意力机制的多输入多输出预测预测效果基本介绍程序设计往期精彩参考资料 预测效果…...

Ubuntu:Arduino IDE 开发环境配置【保姆级】

物联网开发学习笔记——目录索引 本章主要介绍在Ubuntu系统搭建Arduino IDE 开发环境&#xff0c;windows系统请移步&#xff1a;Windows&#xff1a;Arduino IDE 开发环境配置【保姆级】 参考官网&#xff1a;Arduino - Home 有关更多详细信息&#xff0c;请参阅 Arduino I…...

Kafka 开启SASL/SCRAM认证 及 ACL授权(三)验证

Kafka 开启SASL/SCRAM认证 及 ACL授权(三)验证。 官网地址:https://kafka.apache.org/ 本文说明如何做client验证ACL是否生效,我们之前开启了无acl信息不允许访问的配置。涉及的client有以下几个场景:shell脚本、python脚本、java应用、flink流。 kafka shell script验证…...

Pycharm 2023 设置远程调试

pycharm 版本 &#xff1a; 2023.2.1 整体流程参考&#xff1a;https://blog.csdn.net/xuanhaolaile/article/details/128293254 首先确定远程服务器上已经安装好 requirements.txt 中所需的依赖包。 1、SSH Configurations 添加远程服务器 2、Python Interpreter 注意&…...

asp.net core在其他程序集获取HttpContext

首先在Program.cs中&#xff0c;注册 builder.Services.AddHttpContextAccessor();Program.cs完整代码&#xff1a; using Microsoft.AspNetCore.Mvc.Filters; using Microsoft.CodeAnalysis.CSharp.Syntax; using System.Text.Encodings.Web; using System.Text.Unicode; us…...

UWB NI框架嵌入式实现——Qorvo示例

在Qorvo提供的DW3000示例代码中&#xff0c;实现了与Apple的NI框架的互通的示例&#xff0c;本文中针对其示例程序进行简要的分析。测试中使用Qorvo提供的模块&#xff0c;该模块为nRF52833DW3000的架构。 1. Qorvo相关库文件 Qorvo在提供示例时&#xff0c;仅提供了相关的库文…...

Linux OS源的问题记录

场景 安装了一台Linux虚拟机充当服务器&#xff0c;准备搭建一个elk环境&#xff0c;我使用命令安装docker的时候&#xff0c;报错提示 YumRepo Error: All mirror URLs are not using ftp, http[s] or file.Eg. Invalid release/repo/arch combination/ removing mirrorlist…...

数据库:Hive转Presto(五)

此篇将所有代码都补充完了&#xff0c;之前发现有的代码写错了&#xff0c;以这篇为准&#xff0c;以下为完整代码&#xff0c;如果发现我有什么考虑不周的地方&#xff0c;可以评论提建议&#xff0c;感谢。代码是想哪写哪&#xff0c;可能比较繁琐&#xff0c;还需要优化。 …...

SQL中for xml path 的用法

1. 用法 是一种将查询结果转换为 XML 格式的方法。它可以将查询结果中的每一行转换为一个 XML 元素&#xff0c;并且可以指定元素的名称和属性。 2. 应用示例 有一张学生选修课程的表&#xff0c;如下图所示 希望整合成下图所示效果 --建表 if object_id(StudentInfo,u) is…...

【TensorFlow2 之014】在 TF 2.0 中实现 LeNet-5

一、说明 在这篇文章中&#xff0c;我们将展示如何在 TensorFlow 中实现像 \(LeNet-5\) 这样的基础卷积神经网络。LeNet-5 架构由 Yann LeCun 于 1998 年发明&#xff0c;是第一个卷积神经网络。 数据黑客变种rs 深度学习 机器学习 TensorFlow 2020 年 2 月 29 日 | 0 …...

【2023】redis-stream配合spring的data-redis详细使用(包括广播和组接收)

目录 一、简介1、介绍2、对比 二、整合spring的data-redis实现1、使用依赖2、配置类2.1、配置RedisTemplate bean2.2、异常类 3、实体类3.1、User3.2、Book 4、发送消息4.1、RedisStreamUtil工具类4.2、通过延时队列线程池模拟发送消息4.3、通过http主动发送消息 5、&#x1f3…...

飞书应用机器人文件上传

背景&#xff1a; 接上一篇 flask_apscheduler实现定时推送飞书消息&#xff0c;当检查出的异常结果比较多的时候&#xff0c;群里会有很多推送消息&#xff0c;一条条检查工作量会比较大&#xff0c;且容易出现遗漏。   现在需要将定时任务执行的结果记录到文件&#xff0c;…...

高版本Mac系统如何打开低版本的Xcode

这里写目录标题 前言解决方案 前言 大家偶尔也碰见过更新Mac系统后经常发现低版本的Xcode用不了的情况吧.基本每年大版本更新之后都可以在各个开发群里碰见问这个问题的. 解决方案 打开访达->应用程序->选中打不开的那个版本的Xcode并且右键显示包内容->Contents-…...

测试H5需要注意的交互测试用例点

H5&#xff08;HTML5&#xff09;是一种用于构建网页的标准&#xff0c;可以实现丰富的交互和功能。测试H5交互通常涉及到验证网页在各种情况下的行为&#xff0c;包括用户输入、按钮点击、页面加载等等。以下是一些可能的H5交互测试用例&#xff1a; 页面加载&#xff1a; 验…...

1014蓝桥算法双周赛,学习算法技巧,助力蓝桥杯

家人们&#xff0c;我来免费给大家送福利了&#xff01;&#xff01;&#xff01; 【1014蓝桥算法双周赛 】 背景 蓝桥杯全国软件和信息技术专业人才大赛是由工业和信息化部人才交流中心举办的全国性IT学科赛事。参赛高校超过1200余所&#xff0c;累计参赛人数超过40万人。该…...

C语言之通讯录的实现篇

目录 test.c 主菜单menu 创建通讯录con 初始化通讯录InitContact 增加个人信息AddContact 展示个人信息ShowContact 删除个人信息DelContact 查找个人信息SearchContact 修改个人信息ModifyContact test.c总代码 contact.h 头文件包含 PeoInfo_个人信息的设置声…...

如何降低海康、大华等网络摄像头调用的高延迟问题(二)

目录 1.RTSP介绍 2.解决办法1 3.解决办法2 1.RTSP介绍 RTSP&#xff08;Real-time Streaming Protocol&#xff09;是一种用于实时流媒体传输的网络协议。它被设计用于在服务器和客户端之间传输音频、视频以及其他流媒体数据。 RTSP协议允许客户端通过与服务器建立RTSP会话…...

centos清理日志和缓存

今天使用redmine修改密码&#xff0c;修改报错&#xff0c;再去试试创建用户&#xff0c;创建用户的页面直接报错显示不出来。然后看了一下服务器&#xff0c;发现服务器磁盘空间全部占满了。 CentOS系统也会在使用很长一段时间后出现硬盘空间开始不够的情况&#xff0c;而这并…...

基于算法竞赛的c++编程(28)结构体的进阶应用

结构体的嵌套与复杂数据组织 在C中&#xff0c;结构体可以嵌套使用&#xff0c;形成更复杂的数据结构。例如&#xff0c;可以通过嵌套结构体描述多层级数据关系&#xff1a; struct Address {string city;string street;int zipCode; };struct Employee {string name;int id;…...

内存分配函数malloc kmalloc vmalloc

内存分配函数malloc kmalloc vmalloc malloc实现步骤: 1)请求大小调整:首先,malloc 需要调整用户请求的大小,以适应内部数据结构(例如,可能需要存储额外的元数据)。通常,这包括对齐调整,确保分配的内存地址满足特定硬件要求(如对齐到8字节或16字节边界)。 2)空闲…...

vue3 字体颜色设置的多种方式

在Vue 3中设置字体颜色可以通过多种方式实现&#xff0c;这取决于你是想在组件内部直接设置&#xff0c;还是在CSS/SCSS/LESS等样式文件中定义。以下是几种常见的方法&#xff1a; 1. 内联样式 你可以直接在模板中使用style绑定来设置字体颜色。 <template><div :s…...

Python实现prophet 理论及参数优化

文章目录 Prophet理论及模型参数介绍Python代码完整实现prophet 添加外部数据进行模型优化 之前初步学习prophet的时候&#xff0c;写过一篇简单实现&#xff0c;后期随着对该模型的深入研究&#xff0c;本次记录涉及到prophet 的公式以及参数调优&#xff0c;从公式可以更直观…...

对WWDC 2025 Keynote 内容的预测

借助我们以往对苹果公司发展路径的深入研究经验&#xff0c;以及大语言模型的分析能力&#xff0c;我们系统梳理了多年来苹果 WWDC 主题演讲的规律。在 WWDC 2025 即将揭幕之际&#xff0c;我们让 ChatGPT 对今年的 Keynote 内容进行了一个初步预测&#xff0c;聊作存档。等到明…...

C++ 基础特性深度解析

目录 引言 一、命名空间&#xff08;namespace&#xff09; C 中的命名空间​ 与 C 语言的对比​ 二、缺省参数​ C 中的缺省参数​ 与 C 语言的对比​ 三、引用&#xff08;reference&#xff09;​ C 中的引用​ 与 C 语言的对比​ 四、inline&#xff08;内联函数…...

unix/linux,sudo,其发展历程详细时间线、由来、历史背景

sudo 的诞生和演化,本身就是一部 Unix/Linux 系统管理哲学变迁的微缩史。来,让我们拨开时间的迷雾,一同探寻 sudo 那波澜壮阔(也颇为实用主义)的发展历程。 历史背景:su的时代与困境 ( 20 世纪 70 年代 - 80 年代初) 在 sudo 出现之前,Unix 系统管理员和需要特权操作的…...

AI编程--插件对比分析:CodeRider、GitHub Copilot及其他

AI编程插件对比分析&#xff1a;CodeRider、GitHub Copilot及其他 随着人工智能技术的快速发展&#xff0c;AI编程插件已成为提升开发者生产力的重要工具。CodeRider和GitHub Copilot作为市场上的领先者&#xff0c;分别以其独特的特性和生态系统吸引了大量开发者。本文将从功…...

什么是VR全景技术

VR全景技术&#xff0c;全称为虚拟现实全景技术&#xff0c;是通过计算机图像模拟生成三维空间中的虚拟世界&#xff0c;使用户能够在该虚拟世界中进行全方位、无死角的观察和交互的技术。VR全景技术模拟人在真实空间中的视觉体验&#xff0c;结合图文、3D、音视频等多媒体元素…...

保姆级【快数学会Android端“动画“】+ 实现补间动画和逐帧动画!!!

目录 补间动画 1.创建资源文件夹 2.设置文件夹类型 3.创建.xml文件 4.样式设计 5.动画设置 6.动画的实现 内容拓展 7.在原基础上继续添加.xml文件 8.xml代码编写 (1)rotate_anim (2)scale_anim (3)translate_anim 9.MainActivity.java代码汇总 10.效果展示 逐帧…...