大数据 - Spark系列《二》- 关于Spark在Idea中的一些常用配置
上一篇:
大数据 - Spark系列《一》- 从Hadoop到Spark:大数据计算引擎的演进-CSDN博客
目录
1. 🥙Idea中配置Live Templates来快速生成代码片段
2. 🥙Idea中配置文件模板自定义初始代码
3.🥙设置spark-submit提交程序时不在控制台打印日志信息
1. 🥙Idea中配置Live Templates来快速生成代码片段
下面是如何配置Live Templates来创建Spark对象的示例:
1. 打开IntelliJ IDEA,转到或Settings(Windows/Linux)。
2. 在设置对话框中,选择Editor - Live Templates。
3. 单击右侧的加号图标,选择Live Template。
4. 在弹出的对话框中,输入模板的缩写(Abbreviation)和描述(Description),例如sc2。
5. 在Template Text框中输入模板的文本,例如:
// 创建SparkConf对象,并设置应用程序名称和运行模式
val conf = new SparkConf().setAppName("Starting...") // 设置应用程序名称.setMaster("local[*]") // 设置运行模式为本地模式// 创建SparkContext对象,并传入SparkConf对象
val sc = new SparkContext(conf)

新建一个实例

2. 🥙Idea中配置文件模板自定义初始代码
在IntelliJ IDEA中配置每个新生成的文件的代码模板(File Templates)可以让您自定义每个新文件的初始代码。以下是配置步骤:
1)打开IntelliJ IDEA,转到Settings(Windows/Linux)。
2)在设置对话框中,选择Editor - File and Code Templates。
3)在顶部选项卡中选择File Templates。
4)在右侧窗格中,您可以看到当前可用的文件模板列表。选择Includes标签页下的File Header。
5)在文本编辑器中,您可以看到文件头部注释的默认模板。在这里,您可以编辑或添加您想要的注释内容。在您的情况下,您可以粘贴您的注释模板,类似于以下内容:
/*** @日期: 2024/1/31* @Author: Wang NaPao* @Blog: https://blog.csdn.net/weixin_40968325?spm=1018.2226.3001.5343* @Tips: 和我一起学习吧* @Description:*/


3.🥙设置spark-submit提交程序时不在控制台打印日志信息
在用spark-submit提交程序时,会打印很多类似图片所示的日志信息,它们会把想要的结果给淹没,所以要想法子去除控制台的日志信息
解决办法:在程序中设置日志级别。
Logger.getLogger("org.apache.spark").setLevel(Level.WARN)
关于setLevel()中的参数:
| LogLevel | Level | Use |
| OFF | 2147483647 | 关闭所有日志记录 |
| FATAL | 50000 | 如其翻译,致命的错误 |
| ERROR | 40000 | 错误信息提示,一般需要 Try Catch |
| WARN | 30000 | 潜在错误提示 |
| INFO | 20000 | 正常日志信息 |
| DEBUG | 10000 | 细粒度日志,用于应用调试 |
| TRACE | 5000 | 比调试更细粒度的日志信息 |
| ALL | -2147483648 | 打开所有日志记录 |
测试-
package com.doit.com.doit.day0128import org.apache.spark.{SparkConf, SparkContext}import org.apache.log4j.{Level, Logger}
/*** @日期: 2024/1/29* @Author: Wang NaPao* @Blog: https://blog.csdn.net/weixin_40968325?spm=1018.2226.3001.5343* @Tips: 我是技术大牛* @Description:*/object Test05 {def main(args: Array[String]): Unit = {val conf = new SparkConf().setAppName("doe").setMaster("local[*]")val sc = new SparkContext(conf)Logger.getLogger("org.apache.spark").setLevel(Level.WARN)val rdd1 = sc.makeRDD(1 to 5, 2)val rdd2 = sc.makeRDD(Seq("A", "B", "C", "D", "E"), 2)val rdd3 = sc.makeRDD(Seq("A", "B", "C", "D", "E"), 3)println(rdd1.zip(rdd2).collect().toList)println(rdd2.zip(rdd1).collect().toList)// println(rdd1.zip(rdd3).collect().toList)}
}


相关文章:
大数据 - Spark系列《二》- 关于Spark在Idea中的一些常用配置
上一篇: 大数据 - Spark系列《一》- 从Hadoop到Spark:大数据计算引擎的演进-CSDN博客 目录 1. 🥙Idea中配置Live Templates来快速生成代码片段 2. 🥙Idea中配置文件模板自定义初始代码 3.🥙设置spark-submit提交程…...
android 设置未知来源等 AppOpsManager 权限的设置接口
开始客户让我们执行下面的CMD 代码 adb shell appops set com.android.chrome REQUEST_INSTALL_PACKAGES allow 后来 GTP 告诉我有 Setmode的方法,后面在设置里面找到了 OP_REQUEST_INSTALL_PACKAGES 这个,里面有个方法mAppOpsManager.setMode(AppOp…...
使用GPT实现一个简单的网站
背景 In this exciting tutorial video, you’ll discover how to use 文心一言, a powerful language model developed by 百度, to generate ReactJS code for a simple blog website. With 文心一言’s help, you can quickly create a blog website that’s easy to custom…...
回归预测 | Matlab实现CPO-CNN-LSTM-Attention冠豪猪优化卷积长短期记忆神经网络注意力机制多变量回归预测(SE注意力机制)
回归预测 | Matlab实现CPO-CNN-LSTM-Attention冠豪猪优化卷积长短期记忆神经网络注意力机制多变量回归预测(SE注意力机制) 目录 回归预测 | Matlab实现CPO-CNN-LSTM-Attention冠豪猪优化卷积长短期记忆神经网络注意力机制多变量回归预测(SE注…...
11:Servlet中初始化参数的获取与应用-Java Web
目录 11.1 Servlet初始化参数简介11.2 如何在Servlet中获取初始化参数11.3 基于注解的初始化参数(Servlet 3.0)11.4 区别总结11.5 应用场景总结 在构建Java Web应用程序时,Servlet是核心组件之一,它负责处理HTTP请求并生成响应。而…...
STM32的ADC采集传感器的模拟量数据
1、 由于项目上使用传感器采集数据,传感器可以输出模拟电压信号,但是模拟电压信号的输出范围是1-5V,而STM32的ADC采集电压范围是0-3.3V,此时可以用一个简单的分压电路将1-5V的电压将至0.5V到2.5V的范围。 2、电阻分压电路可以使用…...
opencvb 十七 使用cmake配置opencv c++项目
1、cmake简介 1.1 cmake是什么 CMake是一个开源、跨平台的编译(Build)工具,是用来构建、测试和打包软件的。它能够用简单的语句来描述所有平台的编译过程。它能够输出各种各样的makefile或者project文件,能测试编译器所支持的C特…...
Java8 中文指南(一)
Java8 中文指南(一) 文章目录 Java8 中文指南(一)《Java8 指南》中文翻译接口的默认方法(Default Methods for Interfaces)Lambda 表达式(Lambda expressions)函数式接口(Functional Interfaces)方法和构造函数引用(Method and Co…...
引流技术-通过文件中增加联系方式并传播
文章目录 前言文档增加联系方式扩散网盘扩散自建网站借力 注意 前言 很多人在找资料的时候可能都遇到过下图情况: 1、文档最后面留一个自己的联系方式; 2、找的一堆文件中都有相同的情况; 3、一段时间全网搜到的很多相同文件也有这个联系方式…...
分布式搜索引擎_学习笔记_2
分布式搜索引擎_学习笔记_2 在昨天的学习中,我们已经导入了大量数据到elasticsearch中,实现了elasticsearch的数据存储功能。但elasticsearch最擅长的还是搜索和数据分析。 所以今天,我们研究下elasticsearch的数据搜索功能。我们会分别使用…...
【学习笔记】树上差分总结(点差分/边差分)
一.树上差分的基本概念 1.树上差分的定义 树上差分,顾名思义,意思就是在树上做差分。 至于什么是差分呢?如果不会的同学,可以先看看我的这篇博客:一维,二维差分の详解(简单易懂)_一维差分-CSDN博客 2.树…...
Vue.js设计与实现(霍春阳)
Vue.js设计与实现 (霍春阳) 电子版获取链接:Vue.js设计与实现(霍春阳) 编辑推荐 适读人群 :1.对Vue.js 2/3具有上手经验,且希望进一步理解Vue.js框架设计原理的开发人员; 2.没有使用过Vue.js,但对Vue.js框架设计感兴趣…...
go消息队列RabbitMQ - 订阅模式-fanout
1、发布订阅 订阅模式,消息被路由投递给多个队列,一个消息被多个消费者获取。 1) 可以有多个消费者 2) 每个消费者有自己的queue(队列) 3) 每个队列都要绑定到Exchange(交换机&…...
科普类——5G远程实时操控技术在国内港口应用简介(十三)
在中国,5G远程实时操控技术已经在多个港口得到应用,并且应用规模不断扩大,展现出良好的发展前景。以下是一些具体的应用案例: 上港集团洋山港:上港集团与华为合作,在全球港口首次将F5G技术应用于超远程控制…...
整理:汉诺塔简析
大体上,要解决一个汉诺塔问题,就需要解决两个更简单的汉诺塔问题 以盘子数量 3 的汉诺塔问题为例 要将 3 个盘子从 A 移动到 C,就要: 将两个盘子从 A 移动到 B(子问题 1) 为了解决子问题 1,就…...
Android 8.1 设置--声音中增加通话音量
Android 8.1 设置--声音中增加通话音量 近来收到项目需求,想要在设置--声音中增加一项通话音量调节,具体修改参照如下: /vendor/mediatek/proprietary/packages/apps/MtkSettings/res/values/strings.xml <!-- Sound: Title for the opt…...
C#中使用OpenCvSharp4绘制直线、矩形、圆、文本
C#中使用OpenCvSharp4绘制直线、矩形、圆、文本 继之前的Python中使用Opencv-python库绘制直线、矩形、圆、文本和VC中使用OpenCV绘制直线、矩形、圆和文字,将之前的Python和C示例代码翻译成C#语言,很简单,还是借用OpenCvSharp4库中的Line、…...
Qt程序设计-自定义控件(提升法)
本文讲解如何使用提升法自定义控件,控件有界面。 实现自定义一个开关控件,控件上显示当前的状态。实现过程如下: 1、在创建的项目上,添加qt设计界面类。 2、选择widget 3、更改名称为MySwitchButton 4、添加两个图标资源文件,用来显示开关状态 5、添加两个label,一个…...
计算机网络基础知识笔记
1 HOST和PORT Claude-2-100k: 我来用简单的语言解释一下HOST和PORT这两个网络术语: HOST就是设备的IP地址,比如"127.0.0.1"就是我们本机的IP地址; PORT就是端口号,可以把它简单理解为设备上的门牌号。 举个类比,我们要给某个人发信件,需要知道…...
【iOS ARKit】2D肢体动作捕捉
人体肢体动作捕捉在动漫影视制作、游戏CG 动画、实时模型驱动中有着广泛的应用,利用 ARKit,无须额外的硬件设备即可实现 2D和3D人体一系列关节和骨骼的动态捕捉,由于移动AR 的便携性及低成本,必将促进相关产业的发展。 ARBody Tr…...
OpenClaw+Kimi-VL-A3B-Thinking:自动化会议纪要生成工具
OpenClawKimi-VL-A3B-Thinking:自动化会议纪要生成工具 1. 为什么需要自动化会议纪要 作为技术团队的负责人,我每周要参加至少5场会议。每次会后整理纪要都要花费30-60分钟,最痛苦的是要反复听录音核对关键决策点。直到发现OpenClaw可以对接…...
5个核心价值教你如何合法突破付费内容限制:bypass-paywalls-chrome-clean工具全攻略
5个核心价值教你如何合法突破付费内容限制:bypass-paywalls-chrome-clean工具全攻略 【免费下载链接】bypass-paywalls-chrome-clean 项目地址: https://gitcode.com/GitHub_Trending/by/bypass-paywalls-chrome-clean 在信息获取日益受限的今天,…...
AutoGen Studio问题排查:模型服务启动失败解决方案
AutoGen Studio问题排查:模型服务启动失败解决方案 1. 问题现象与初步诊断 当您尝试启动AutoGen Studio时,可能会遇到模型服务无法正常启动的情况。这种情况通常表现为: Web界面可以访问但无法正常调用模型创建会话时长时间无响应测试模型…...
告别终端断开烦恼:nohup命令的完整使用指南(含日志管理技巧)
告别终端断开烦恼:nohup命令的完整使用指南(含日志管理技巧) 你是否遇到过这样的场景:在服务器上启动一个耗时任务,突然网络波动导致SSH连接断开,所有进度前功尽弃?作为开发者,这种经…...
3个关键优化:如何让Stable Diffusion模型在普通硬件上流畅运行?
3个关键优化:如何让Stable Diffusion模型在普通硬件上流畅运行? 【免费下载链接】chilloutmix_NiPrunedFp32Fix 项目地址: https://ai.gitcode.com/hf_mirrors/emilianJR/chilloutmix_NiPrunedFp32Fix 你是否曾经尝试运行Stable Diffusion模型&a…...
保姆级教程:在Ubuntu服务器上用Docker一键部署华为MindIE,快速搭建LLM私有化API服务
保姆级教程:在Ubuntu服务器上用Docker一键部署华为MindIE,快速搭建LLM私有化API服务 当企业需要将大语言模型(LLM)能力整合到内部系统时,私有化部署成为刚需。华为MindIE作为昇腾AI生态的重要组件,通过容器…...
BigDL-2.x DLlib深度指南:用Spark DataFrames构建分布式深度学习应用
BigDL-2.x DLlib深度指南:用Spark DataFrames构建分布式深度学习应用 【免费下载链接】BigDL-2.x BigDL: Distributed TensorFlow, Keras and PyTorch on Apache Spark/Flink & Ray 项目地址: https://gitcode.com/gh_mirrors/bi/BigDL-2.x BigDL-2.x是一…...
OpenClaw安全防护指南:千问3.5-27B本地化部署的权限管控策略
OpenClaw安全防护指南:千问3.5-27B本地化部署的权限管控策略 1. 为什么需要特别关注OpenClaw的安全防护? 去年冬天,我在自己的MacBook上部署OpenClaw时,曾因为一个简单的配置疏忽差点酿成大祸。当时我只是想让AI助手帮我整理桌面…...
SEO 关键词工具哪个最准确
SEO关键词工具哪个最准确? 在当今的互联网时代,SEO(搜索引擎优化)已经成为了网站流量增长的关键。而在SEO优化过程中,关键词研究是非常重要的一环。作为网站运营者,选择一个准确的SEO关键词工具至关重要。…...
微信数据解密技术解析:从原理到实战的完整指南
微信数据解密技术解析:从原理到实战的完整指南 【免费下载链接】PyWxDump 删库 项目地址: https://gitcode.com/GitHub_Trending/py/PyWxDump 在数字化时代,个人数据管理变得愈发重要。微信作为主流社交平台,其加密存储的数据给合法备…...
