当前位置: 首页 > news >正文

大数据分析入门10分钟快速了解SQL

SQL是什么?

SQL全称Structured Query Language(结构化查询语言”)

为什么要用SQL?

SQL通用

常见的表格分析操作,Excel也能做,为什么不用呢?

因为处理上亿行大数据时,Excel并不够用。

而常见的大数据引擎Hive、Spark、Flink都支持SQL,SQL在大数据中是通用语言。

SQL易用

Python和Java需要自己写算法,而SQL只需要描述结果,相比写算法简单太多了。

怎么用SQL?

只需要记住你有什么数据,想要什么数据。

再找相应的语法例子,自己改一改就会用了。

简单查询(SELECT)

你有一张users表,表中有id,name,age,city_code四个字段。

如果你想要知道name为张三的人的信息,那么SQL是

select id,name,city_code 
from users where name = '张三‘

排序查询(ORDER BY)

如果你想看看最年长的10位,那么SQL是

select id,name,city_code 
from users 
order by age desc -- desc表降序,asc表示升序
limit 10

聚合查询(GROUP BY)

如果你想要知道每个城市有多少人,那么SQL是

select count(id) as cnt  
from users 
group by city_code

连接查询(JOIN)

你有一张cities表,会有city_code,city_name字段。

它如同“邮政编码”和“地区”一样将“100000”映射到“北京”。

如果users直接存city_name,当city_name变化时,需要修改users表的多行;而有了cities,只需要改cities表中的1行

如果你想要知道每个人所在城市名称,那么SQL是

select name, city_name
from users
join cities
on users.city_code=cities.city_code

总结

10分钟带你了解了SQL的大概,但SQL远不止这些。

欢迎提出你遇到的SQL问题,我会针对性的出一些教程解答大家问题的~

相关文章:

大数据分析入门10分钟快速了解SQL

SQL是什么? SQL全称Structured Query Language(结构化查询语言”) 为什么要用SQL? SQL通用 常见的表格分析操作,Excel也能做,为什么不用呢? 因为处理上亿行大数据时,Excel并不够用。 而常见的大数据引…...

设置多用户远程登录windows server服务器

##设置多用户远程登录windows server服务器 ###1、远程登录windows server 2016 运行—>mstsc—>远程IP地址—>用户和密码 2、远程windows服务器设置多用户策略 运行—>gpedit.msc->计算机配置—管理模板—windows组件—远程桌面服务—远程桌面会话主机----连…...

一文了解栈

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、栈是什么?二、栈的实现思路1.顺序表实现2.单链表实现3.双向链表实现 三、接口函数的实现1.栈的定义2.栈的初始化3.栈的销毁4.入栈5.出栈6.返回栈…...

C语言----汉诺塔问题

1.什么是汉诺塔问题 简单来说,就是有三个柱子,分别为A柱,B柱,C柱。其中A柱从上往下存放着从小到大的圆盘,我们需要借助B柱和C柱,将A柱上的所有圆盘转移到C柱上,并且一次只能移动一个圆盘&#…...

Python中驼峰命名法和下划线命名法相互转换的实战代码

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…...

【hackmyvm】vivifytech靶机

渗透思路 信息收集端口扫描端口服务信息目录扫描爆破hydra--sshgit提权 信息收集 ┌──(kali㉿kali)-[~] └─$ fping -ag 192.168.9.0/24 2>/dev/null 192.168.9.119 --主机 192.168.9.164 --靶机个人习惯,也方便后续操作,将IP地址赋值给一个变…...

纯血鸿蒙APP实战开发——手写绘制及保存图片

介绍 本示例使用drawing库的Pen和Path结合NodeContainer组件实现手写绘制功能。手写板上完成绘制后,通过调用image库的packToFile和packing接口将手写板的绘制内容保存为图片,并将图片文件保存在应用沙箱路径中。 效果图预览 使用说明 在虚线区域手写…...

在什么情况下表单会被重复提交?如何避免?

表单被重复提交是Web应用中常见的问题,通常在用户提交表单后点击按钮多次,或在表单提交后刷新页面时发生。这可能导致数据的重复处理,比如重复记录或订单。 何时会发生表单重复提交? 用户多次点击提交按钮:在网络延迟…...

JavaScript 中的 Class 类

🔥 个人主页:空白诗 文章目录 🔥 引言🎯 基础知识🏗️ 构造函数 (Constructor)🔐 私有字段 (Private Fields)🔐 私有方法 (Private Methods)🧬 继承 (Inheritance)📦 静态…...

python实验三 实现UDP协议、TCP协议进行服务器端与客户端的交互

实验三 实验题目 1、请利用生成器构造一下求阶乘的函数Factorial(),定义一个函数m(),在m()中调用生成器Factorial()生成小于100的阶乘序列存入集合s中,输出s。 【代码】 def factorial():n1f1while 1:​ f * n​ yield (f)​ n1…...

ServiceNow 研究:通过RAG减少结构化输出中的幻觉

论文地址:https://arxiv.org/pdf/2404.08189 原文地址:rag-hallucination-structure-research-by-servicenow 在灾难性遗忘和模型漂移中,幻觉仍然是一个挑战。 2024 年 4 月 18 日 灾难性遗忘: 这是在序列学习或连续学习环境中出现…...

ADS基础教程10-多态性(动态模型选择)

目录 一、多态性定义二、操作步骤1.模型建立2.模型选择3.执行仿真 一、多态性定义 ADS中支持一个Symbol中,可以同时存在多个子图。在仿真时可以动态选择不同的子图继续宁仿真。 二、操作步骤 1.模型建立 在上一章A…...

代码随想录第四十六天|单词拆分

题目链接:. - 力扣(LeetCode)...

RabbitMQ的介绍和使用

1.同步通讯和异步通讯 举个例子,同步通讯就像是在打电话,因此它时效性较强,可以立即得到结果,但如果你正在和一个MM打电话,其他MM找你的话,你们之间是不能进行消息的传递和响应的 异步通讯就像是微信&#…...

前端get请求日期类型参数向后端传参失败

1、背景 get请求,通过url上传参,因此日期类型是string类型数据 2、异常信息 nested exception is org.springframework.core.convert.ConversionFailedException: Failed to convert from type [java.lang.String] to type [java.time.LocalDate] for…...

【docker 】 push 镜像提示:denied: requested access to the resource is denied

往 Docker Registry &#xff08;私服&#xff09;push 镜像提示&#xff1a;denied: requested access to the resource is denied 镜像push 语法&#xff1a;docker push <registry-host>:<registry-port>/<repository>:<tag> docker push 192.16…...

浏览器各类好用插件使用及常见问题(技巧)总结

目录 Vimium C快捷键问题为什么Vimium C - 全键盘操作浏览器插件在百度页面中, x ,o,f等快捷键不起作用如何使用viminum c插件进行自定义快捷键?vimucm 为什么在浏览器首页时快捷键不起作用? 网页截图问题firefox 网页截图使用 idm问题浏览器点击idm 不下载? 待续、更新中 V…...

Python批量计算多张遥感影像的NDVI

本文介绍基于Python中的gdal模块&#xff0c;批量基于大量多波段遥感影像文件&#xff0c;计算其每1景图像各自的NDVI数值&#xff0c;并将多景结果依次保存为栅格文件的方法。 如下图所示&#xff0c;现在有大量.tif格式的遥感影像文件&#xff0c;其中均含有红光波段与近红外…...

6.k8s中的secrets资源

一、Secret secrets资源&#xff0c;类似于configmap资源&#xff0c;只是secrets资源是用来传递重要的信息的&#xff1b; secret资源就是将value的值使用base64编译后传输&#xff0c;当pod引用secret后&#xff0c;k8s会自动将其base64的编码&#xff0c;反编译回正常的字符…...

git 更换远程仓库地址三种方法总结

git 更换远程仓库地址三种方法总结 一、前言 由于私服的 gitlab 的地址变更&#xff0c;导致部分项目代码提交不上去&#xff0c;需要修改远端仓地址。 其它需要修改远程仓地址的情况如&#xff1a;切换git clone 协议由ssh变为https。 二、环境 windows 10git version 2.3…...

突破性效率工具:3步实现Draw.io Mermaid智能绘图完整方案

突破性效率工具&#xff1a;3步实现Draw.io Mermaid智能绘图完整方案 【免费下载链接】drawio_mermaid_plugin Mermaid plugin for drawio desktop 项目地址: https://gitcode.com/gh_mirrors/dr/drawio_mermaid_plugin 还在为传统拖拽式绘图效率低下而烦恼吗&#xff1…...

【免费下载】 探索8051开发新境界:IAR for 8051(8.10版本)资源下载推荐

探索8051开发新境界&#xff1a;IAR for 8051&#xff08;8.10版本&#xff09;资源下载推荐 【下载地址】IARfor80518.10版本资源下载 IAR for 8051&#xff08;8.10版本&#xff09;资源下载 项目地址: https://gitcode.com/open-source-toolkit/1b6d8 项目介绍 在嵌…...

告别手动计算!用Python+ArcPy脚本批量搞定MODIS ET数据从8天到月均值的完整流程

从8天到月均值&#xff1a;PythonArcPy全自动处理MODIS ET数据的工程实践 当面对跨越多年、覆盖大区域的MOD16A2数据集时&#xff0c;传统的手工操作不仅效率低下&#xff0c;还容易引入人为错误。本文将展示如何用PythonArcPy构建一套完整的自动化流程&#xff0c;实现从原始8…...

用Python实现编译器前端:从Kaleidoscope到LLVM IR的实践指南

1. 项目概述&#xff1a;从“玩具”到“宝藏”的编译器学习之旅如果你对编译原理这门计算机科学的“硬核”课程感到既敬畏又头疼&#xff0c;觉得那些词法分析、语法树、中间代码优化等概念如同天书&#xff0c;那么你很可能已经尝试过一些经典的“龙书”配套项目&#xff0c;比…...

Linux巡检报告生成排查方法

Linux巡检报告生成排查方法本文面向具备一定 Linux 基础的技术人员&#xff0c;围绕巡检报告生成展开&#xff0c;重点讨论检查汇总、异常标记和结果归档。在中级运维和系统管理工作中&#xff0c;这类主题常常与配置变更、资源状态、权限边界、自动化任务和业务影响交织在一起…...

算力基石:CPU、GPU与嵌入式AI的技术逻辑与融合发展

在人工智能全面普及的时代&#xff0c;算力已经成为数字产业发展的核心驱动力。从日常使用的智能手机、家用电脑&#xff0c;到云端大模型、智能汽车、工业传感设备&#xff0c;各类智能终端的运转都离不开处理器的算力支撑。其中&#xff0c;CPU作为通用计算核心、GPU作为并行…...

DS18B20单总线温度传感器在CircuitPython中的实战应用指南

1. 项目概述与单总线协议的价值如果你正在用像Adafruit Feather M0 Express或Raspberry Pi Pico这类小巧的板子做项目&#xff0c;需要测量温度&#xff0c;DS18B20绝对是一个绕不开的经典选择。我这些年做过不少环境监测、智能家居的小玩意儿&#xff0c;从鱼缸水温到3D打印机…...

西安给孩子配镜哪个公司口碑好

如果在西安想给孩子配镜&#xff0c;甲目眼镜&#xff08;成都&#xff09;有限公司是个不错的选择。甲目眼镜聚焦中高端写字楼白领与商务人群&#xff0c;同时也为孩子配镜提供优质服务。它以“高性价比的高端眼镜”为使命&#xff0c;严选国内外一线品牌&#xff0c;重塑了品…...

【LabVIEW】驱动文件部署策略全解析:项目嵌入与系统集成的权衡与实践

1. LabVIEW驱动文件部署的核心挑战 第一次用LabVIEW控制仪器设备时&#xff0c;我盯着官方提供的驱动压缩包发呆了半小时——该把这些文件扔到哪个文件夹&#xff1f;这个问题看似简单&#xff0c;却直接关系到后续开发的便利性和项目可移植性。经过多个项目的实战验证&#xf…...

168MHz Cortex-M4+FPU+1MB Flash:STM32F405RGT6的高性能工业MCU参数解析

STM32F405RGT6&#xff1a;168MHz Cortex-M4工业MCU的高性能标杆在工业控制、电机驱动和物联网网关等嵌入式应用中&#xff0c;微控制器需要在处理性能、存储容量和外设集成度之间取得平衡。STM32F405RGT6是意法半导体STM32F4系列中的经典型号&#xff0c;基于ARM Cortex-M4内核…...