当前位置: 首页 > news >正文

spark-sql 备忘录

wordcount

sc.textFile("../data/data.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect

读取json 文件 并通过sql 执行 join 查询

public static void main(String[] args) {SparkSession session = SparkSession.builder().master("local").appName("master").getOrCreate();Dataset<Row> df = session.read().json("./data/user2.json");
//        json.show();df.createOrReplaceTempView("user");Dataset<Row> df2 = session.read().json("./data/dept.json");df2.createOrReplaceTempView("dept");Dataset<Row> result = session.sql("select u.id,u.name,d.name dname from user u left join dept d" +" on u.deptno= d.id" +"");
//        result.show();
//        result.collectAsList().forEach(System.out::println);result.write().csv("data/result2");session.close();}

jdbc  导出csv

public static void main(String[] args) {SparkSession session = SparkSession.builder().master("local").appName("master").getOrCreate();Properties connectionProperties = new Properties();connectionProperties.put("user", "root");connectionProperties.put("password", "root");Long start = System.currentTimeMillis();Dataset<Row> report = session.read().jdbc("jdbc:mysql://localhost:3306/test","idms_user", connectionProperties).filter("createDate is not null");report.write().option("header", true).mode("overwrite").csv("data/idms_user");long end = System.currentTimeMillis();System.out.println("cost:" + (end - start)+"ms");session.close();}

jdbc  通过sql 查询  函数处理

/*jdbc  通过sql 查询  函数处理
*/ 
public static void main(String[] args) {SparkSession session = SparkSession.builder().master("local").appName("master").getOrCreate();Properties connectionProperties = new Properties();connectionProperties.put("user", "root");connectionProperties.put("password", "root");Long start = System.currentTimeMillis();Dataset<Row> report = session.read().jdbc("jdbc:mysql://localhost:3306/test","report", connectionProperties);report.createOrReplaceTempView("report");Dataset<Row> result = session.sql("select id,date_format(created_at,'yyyy-MM-dd') createDate ,title " +" , date_format(now(),'yyyy-MM-dd') nowDate" +" ,datediff(now(),created_at) days"+" from report where age>12");result.show();session.close();}

相关文章:

spark-sql 备忘录

wordcount sc.textFile("../data/data.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(__).collect 读取json 文件 并通过sql 执行 join 查询 public static void main(String[] args) {SparkSession session SparkSession.builder().master(&qu…...

基于softmax回归的多分类

基于softmax回归的多分类任务是机器学习领域中的一种常见应用。softmax回归,又称多项逻辑回归或多类逻辑回归,是逻辑回归在多分类问题上的推广。以下是对基于softmax回归的多分类任务的详细解释: 一、softmax回归的原理 softmax回归的核心思想是通过softmax函数将输入数据…...

bs4基本运用

1. bs4基本使用 1.1. 简介 bs4的全称为 BeautifulSoup。和lxml一样&#xff0c;是一个html的解析器&#xff0c;主要功能也是解析数据和提取数据 。 本模块作为了解模块&#xff0c;实际开发中很少用这个模块去解析数据&#xff0c;大家可能会想为什么这个模块会逐渐被淘汰&…...

MySQL 时区参数 time_zone 详解

文章目录 前言1. 时区参数影响2. 如何设置3. 字段类型选择 前言 MySQL 时区参数 time_zone 有什么用&#xff1f;修改它有什么影响&#xff1f;如何设置该参数&#xff0c;本篇文章会详细介绍。 1. 时区参数影响 time_zone 参数影响着 MySQL 系统函数还有字段的 DEFAULT CUR…...

Redis - 消息队列 Stream

一、概述 消息队列 定义 消息队列模型&#xff1a;一种分布式系统中的消息传递方案&#xff0c;由消息队列、生产者和消费者组成消息队列&#xff1a;负责存储和管理消息的中间件&#xff0c;也称为消息代理&#xff08;Message Broker&#xff09;生产者&#xff1a;负责 产…...

Docker:国内加速源

阿里云docker加速云&#xff1a; sudo tee /etc/docker/daemon.json <<EOF { “registry-mirrors”: [“https://euf11uji.mirror.aliyuncs.com”] } EOFhttps://docker.mozhu.dev/ sudo tee /etc/docker/daemon.json <<EOF {"registry-mirrors": [&qu…...

Android Studio更改项目使用的JDK

一、吐槽 过去&#xff0c;在安卓项目中配置JDK和Gradle的过程非常直观&#xff0c;只需要进入Android Studio的File菜单中的Project Structure即可进行设置&#xff0c;十分方便。 原本可以在这修改JDK: 但大家都知道&#xff0c;Android Studio的狗屎性能&#xff0c;再加…...

ubuntu+ros新手笔记(四):gazebo无法加载

以下为ChatGPT 的解决方案&#xff0c;对我来说是可行的&#xff01;&#xff01; 我按照第2步操作就解决辣&#xff01;&#xff01; 我的提问&#xff1a; 在ubuntu 22.04 和ros2 humble环境下&#xff0c;gazebo加载不了 ChatGPT 回答&#xff1a; 在 Ubuntu 22.04 和 …...

vue季度选择器(antd2.0 版本无此控件,单独写一个)

vue季度选择器 效果显示 效果显示 <template><div><a-popoverplacement"bottom"overlayClassName"season-picker"trigger"click"v-model"showSeason"><template #content><div class"season-picker-b…...

C/C++代码性能优化技巧的书籍及资料

使用C/C开发的场景&#xff0c;大多对代码的执行的速度&#xff0c;实时性有较高的要求&#xff0c;像嵌入式系统的开发&#xff0c;资源还受限。在算力存储空间有限的MCU上写出简洁又高效的代码实际是一种艺术。软件工程师在代码设计上的这种差距&#xff0c;会反映在产品的性…...

通俗易懂的 Nginx 反向代理 配置

通俗易懂的 Nginx 反向代理 配置 首先 root 与 alias 的区别 root 是直接拼接 root location location /i/ {root /data/w3; }当请求 /i/top.gif &#xff0c;/data/w3/i/top.gif 会被返回。 alias 是用 alias 替换 location location /i/ {alias /data/w3/images/; }当请…...

docker设置容器自动启动

说起开机自动启动应该很多人都遇到过&#xff0c;我们公司做的系统很多的中间件都没有设置开机自动启动然后中间修改问题又设置了一些临时生效的文件&#xff0c;开始的时候大家都不以为意&#xff0c;知道公司陆续有人离职入职管理交接一塌糊涂&#xff0c;项目成了历史遗留问…...

蓝桥杯刷题——day1

蓝桥杯刷题——day1 题目一题干题目解析代码 题目二题干题目解析代码 题目一 题干 给定一个字符串 s &#xff0c;验证 s 是否是 回文串 &#xff0c;只考虑字母和数字字符&#xff0c;可以忽略字母的大小写。本题中&#xff0c;将空字符串定义为有效的 回文串 。 题目链接&a…...

Leetcode 面试150题 399.除法求值

系列博客目录 文章目录 系列博客目录题目思路代码 题目 链接 思路 广度优先搜索 我们可以将整个问题建模成一张图&#xff1a;给定图中的一些点&#xff08;点即变量&#xff09;&#xff0c;以及某些边的权值&#xff08;权值即两个变量的比值&#xff09;&#xff0c;试…...

活动预告 |【Part2】Microsoft 安全在线技术公开课:安全性、合规性和身份基础知识

课程介绍 通过参加“Microsoft 安全在线技术公开课&#xff1a;安全性、合规性和身份基础知识”活动提升你的技能。在本次免费的介绍性活动中&#xff0c;你将获得所需的安全技能和培训&#xff0c;以创造影响力并利用机会推动职业发展。你将了解安全性、合规性和身份的基础知…...

Unity游戏实战

很小的时候在键盘机上玩过一个游戏叫寻秦&#xff0c;最近看有大佬把他的安卓版做出来了&#xff0c;打开封面就是Unity&#xff0c;想自己也尝试一下。...

SQL中的替换函数replace() 使用

这条 SQL 语句的作用是将 tool_tool 表中所有 link 字段包含 https://www.xxspvip.cn 的记录中的 https://www.xxspvip.cn 替换为 http://192.168.1.1。具体解释如下&#xff1a; SQL 语句分解 UPDATE tool_toolSET link REPLACE(link, https://www.xxspvip.cn, http://192.…...

Python面试常见问题及答案5

一、基础语法相关 问题1&#xff1a; Python的可变数据类型和不可变数据类型有哪些&#xff1f; 答案&#xff1a; 在Python中&#xff0c;可变数据类型有列表&#xff08;list&#xff09;、字典&#xff08;dict&#xff09;、集合&#xff08;set&#xff09;。这些数据类型…...

(css)element中el-select下拉框整体样式修改

(css)element中el-select下拉框整体样式修改 重点代码&#xff08;颜色可行修改&#xff09; // 修改input默认值颜色 兼容其它主流浏览器 /deep/ input::-webkit-input-placeholder {color: rgba(255, 255, 255, 0.50); } /deep/ input::-moz-input-placeholder {color: rgba…...

点击按钮打开dialog嵌套表格checked数据关闭dialog回显checked数据

介绍&#xff1a;点击按钮打开dialog嵌套表格&#xff0c;勾选数据&#xff0c;点击确认关闭弹窗并且回显选中得数据&#xff0c;回显的数据被删除&#xff0c;dialog里面的数据也被取消勾选&#xff0c;废话不多说 上代码&#xff01;&#xff01;&#xff01; 这里的勾选回显…...

别再只写CRUD了!用SpringBoot+MySQL设计一个高并发预约挂号系统,这些架构细节你得知道

高并发预约挂号系统架构实战&#xff1a;SpringBootMySQL核心技术解析 1. 系统架构设计挑战与解决方案 在医疗信息化高速发展的今天&#xff0c;预约挂号系统作为医院服务的"第一窗口"&#xff0c;其稳定性与性能直接影响患者就医体验。传统CRUD架构在面对挂号早高峰…...

AMD Ryzen处理器调试神器:SMUDebugTool完全指南

AMD Ryzen处理器调试神器&#xff1a;SMUDebugTool完全指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gitcode.…...

DownKyi终极指南:B站视频下载与管理的完整专业解决方案

DownKyi终极指南&#xff1a;B站视频下载与管理的完整专业解决方案 【免费下载链接】downkyi 哔哩下载姬downkyi&#xff0c;哔哩哔哩网站视频下载工具&#xff0c;支持批量下载&#xff0c;支持8K、HDR、杜比视界&#xff0c;提供工具箱&#xff08;音视频提取、去水印等&…...

Fansly下载器完整指南:3分钟掌握免费离线下载技巧

Fansly下载器完整指南&#xff1a;3分钟掌握免费离线下载技巧 【免费下载链接】fansly-downloader Easy to use fansly.com content downloading tool. Written in python, but ships as a standalone Executable App for Windows too. Enjoy your Fansly content offline anyt…...

从模型文件到孪生场景:一个Three.js三维模型管理系统的完整产品化思考

从技术原型到商业产品&#xff1a;构建Three.js数字孪生系统的全栈实践 在数字孪生技术快速渗透工业制造、智慧城市等领域的今天&#xff0c;如何将一个基于Three.js的模型展示Demo转化为真正具备商业价值的企业级管理系统&#xff1f;这个问题困扰着许多掌握前端3D技术的开发者…...

荣耀出征唯一官网下载:零氪平民友好 无套路轻松畅玩

国新出审〔2023〕941号&#xff0c;ISBN 978-7-498-12393-0&#xff0c;备案号&#xff1a;皖ICP备2023003237号-2。由河北传娱网络科技有限公司拥有著作权&#xff0c;方圆电子音像出版社有限责任公司正规出版&#xff0c;安徽游昕网络科技有限公司负责全程运营&#xff0c;资…...

B站SEO优化底层逻辑:以用户需求为核心,解锁低成本流量密码

在B站流量竞争日趋激烈的当下&#xff0c;很多创作者陷入“唯算法论”的误区&#xff0c;过度纠结于完播率、互动量等数据&#xff0c;却忽略了SEO优化的本质——匹配用户搜索需求。 一、认知重构&#xff1a;B站SEO的本质是“用户需求匹配”&#xff0c;而非“算法博弈”多数创…...

从Simulink模型到S32K3xx芯片:手把手教你玩转NXP官方MBD工具包(v1.4实战)

从Simulink模型到S32K3xx芯片&#xff1a;手把手教你玩转NXP官方MBD工具包&#xff08;v1.4实战&#xff09; 在汽车电子开发领域&#xff0c;时间就是竞争力。当传统手写代码遇上复杂的汽车MCU外设配置&#xff0c;工程师们常常陷入寄存器手册的海洋。而基于模型的设计&#x…...

给嵌入式Web服务器加个“胃”:手把手教你用lwIP-2.1.3的httpd处理POST表单数据(含内存管理避坑)

嵌入式Web服务器的"消化系统"&#xff1a;lwIP-2.1.3 POST数据处理深度解析 在资源受限的嵌入式设备中实现Web表单交互&#xff0c;就像为设备安装了一个精密的"消化系统"。这个系统需要高效处理来自外部的数据"营养"&#xff0c;同时避免因&quo…...

智能安卓主板选型指南:从需求分析到量产落地的全流程解析

1. 项目概述&#xff1a;智能安卓主板选型的核心价值在嵌入式开发和智能硬件项目里&#xff0c;选对一块主板&#xff0c;往往意味着项目成功了一半。我见过太多团队&#xff0c;前期功能设计得天花乱坠&#xff0c;结果卡在了硬件选型上&#xff0c;要么性能过剩成本失控&…...