当前位置: 首页 > news >正文

数据结构、数据类型、数字编码、字符编码:保姆级图文详解

文章目录

  • 前言
  • 1、数据结构分类
    • 1.1、逻辑结构:线性与非线性
    • 1.2、物理结构:连续与分散
    • 1.3、数据结构的实现方式
    • 1.4、数据结构的选择依据
  • 2、基本数据类型
    • 2.1、定义与分类
    • 2.2、存储形式
  • 3、数字编码
    • 3.1、原码、反码与补码
    • 3.2、浮点数编码
    • 3.3、整数与浮点数区别
  • 4、字符编码
    • 4.1、ASCII 字符集
    • 4.2、GBK 字符集
    • 4.3、Unicode 字符集
    • 4.4、UTF-8 编码

前言

亲爱的家人们,创作很不容易,若对您有帮助的话,请点赞收藏加关注哦,您的关注是我持续创作的动力,谢谢大家!有问题请私信或联系邮箱:fn_kobe@163.com

1、数据结构分类

从两个维度划分:

①逻辑结构:关注数据元素之间的逻辑关系
②物理结构:关注数据在计算机内存中的存储方式

1.1、逻辑结构:线性与非线性

①定义:逻辑结构揭示数据元素之间的逻辑关系。数据线性排列或呈现更复杂的层次或网络关系。

②分类
i:线性结构:
数据呈一对一的顺序关系。常见结构:数组、链表、栈、队列、哈希表。

ii:非线性结构:
数据呈一对多或多对多的关系。分为以下两类:
i:树形结构:如树、堆、哈希表。
ii:网状结构:如图。
在这里插入图片描述

③特点
i:线性数据结构:简单直观,逻辑关系呈线性排列。
ii:非线性数据结构:适合表示复杂层次和网络关系,逻辑关系更复杂。

1.2、物理结构:连续与分散

①定义:物理结构描述数据在计算机内存中的存储方式。内存由单元格(内存空间)组成,每个单元格通过内存地址访问。
在这里插入图片描述

②分类
i:连续空间存储:数据存储在连续的内存块中。常见结构:数组。
ii:分散空间存储:数据存储在非连续的内存块中,通过指针连接。常见结构:链表
在这里插入图片描述

③特点

i:连续存储:访问效率高,但需要大块连续内存。适用于静态数据结构。
ii:分散存储:内存利用率高,支持动态调整。适用于动态数据结构。

1.3、数据结构的实现方式

①基于数组的实现
i:可实现:栈、队列、哈希表、树、堆、图、矩阵、张量等。
ii:特点:初始化后长度固定,但可通过重新分配内存实现一定的动态性。

②基于链表的实现
i:可实现:栈、队列、哈希表、树、堆、图等。
ii:特点:支持动态长度调整,适合在运行时需要频繁修改长度的场景。

③动态与静态数据结构
i:链表:动态数据结构,长度可在运行时调整。
ii:数组:静态数据结构,长度在初始化时固定,但通过内存重分配可具备动态性。

1.4、数据结构的选择依据

①性能与内存效率的权衡
i:连续存储(如数组):适合需要快速访问的数据结构,但对内存连续性要求高。
ii:分散存储(如链表):适合需要频繁插入和删除操作的数据结构,内存利用率更高。

②实际应用中的组合
数据结构往往基于数组和链表的组合实现。如哈希表可能结合数组(存储槽位)和链表(处理冲突)。

2、基本数据类型

2.1、定义与分类

基本数据类型是 CPU 直接运算的数据类型,用于表示数据基本形式。包括整数、浮点数、字符和布尔类型。
①主要类型:
i:整数类型:byte、short、int、long,用于表示整数。
ii:浮点数类型:float、double,用于表示小数。
iii:字符类型:char,用于表示字母、标点符号及其他字符。
iv:布尔类型:bool,用于表示“是/否”判断。

2.2、存储形式

所有基本数据类型以二进制形式存储,一个二进制位(bit)是计算的最小单位。一个字节(byte)由 8 个比特(bit)组成(绝大多数现代操作系统遵循此规则)。基本数据类型的取值范围取决于其占用的空间大小,例如:
在这里插入图片描述

3、数字编码

3.1、原码、反码与补码

①定义:

i:原码:二进制表示中,最高位为符号位(0表示正数,1表示负数),其余位表示数值。
ii:反码:正数的反码与原码相同,负数的反码为原码符号位不变,其余位按位取反。
iii:补码:正数的补码与原码相同,负数的补码为其反码加1。

在这里插入图片描述

②补码特点
解决原码和反码中“正零”和“负零”带来的歧义问题。通过将负数的运算转化为加法运算,简化硬件设计。
支持负数范围比正数多一个。

③计算机使用补码原因
统一正负数的加减法运算,不需要单独设计减法电路。消除正负零的歧义,简化条件判断。硬件电路设计更简单,高效支持并行化运算。

3.2、浮点数编码

①表示方式
根据 IEEE 754 标准,32 位浮点数 float 由以下三部分组成:
i:符号位(1 位):表示正数或负数。
ii:指数位(8 位):表示数值的指数部分。
iii:分数位(23 位):表示有效数字部分。
计算公式:
在这里插入图片描述

3.3、整数与浮点数区别

①存储空间
int 和 float 都占用 4 字节,但表示范围和精度不同。int 使用所有比特表示均匀分布的整数。float 使用部分比特表示指数位,扩展范围但降低精度。

②适用场景
整数类型适用于精确计算,如计数或索引操作。浮点数类型适用于需要表示小数或范围极大的数值。

4、字符编码

**①定义:**字符编码通过“字符集”将字符与二进制数一一对应,实现二进制数到字符的转换。
②需求背景:不同语言和符号的表示需要统一规则,字符编码规范解决这一问题。

4.1、ASCII 字符集

①特点:ASCII 是最早的字符集,使用7位二进制表示,共支持128个字符。包含英文大小写字母、数字、标点符号及控制字符。
②扩展:EASCII:扩展到8位,可表示256个字符。不同地区的 EASCII 字符集后128个字符定义不同,以适应本地语言需求。
在这里插入图片描述

4.2、GBK 字符集

①背景:GB2312(1980 年发布)解决汉字表示问题,支持 6763 个汉字,但无法覆盖罕见字和繁体字。
②扩展:GBK 在 GB2312 基础上扩展,支持 21886 个汉字。
③编码方式:ASCII 字符使用 1 字节。汉字使用 2 字节。

4.3、Unicode 字符集

①特点:统一字符集,支持全球语言和符号,理论上可容纳 100 多万个字符。通过统一的“码点”为每个字符分配编号。
②意义:解决多语言环境乱码问题。消除不同字符集之间的兼容性障碍。
③问题:Unicode 只是定义字符码点,没有规定如何存储字符,导致在实际实现中需要额外编码方案。
在这里插入图片描述

4.4、UTF-8 编码

①定义:UTF-8 是 Unicode 的一种编码方式,使用 1 至 4 字节表示一个字符。根据字符复杂性调整字节数,具备高效性和兼容性。
②规则:1 字节:ASCII 字符(最高位为 0)。多字节:起始字节高位以 1 标识字节长度,其余位用于编码字符码点。后续字节以 10 开头用于填充字符码点。

③优点:向下兼容 ASCII,适合处理历史遗留文本。多字节的起始位和校验位设计便于错误检测。
④其他编码方式
UTF-16:2 或 4 字节表示字符,常用非英文字符占 2 字节。
UTF-32:固定使用 4 字节,适配性差,占用空间大。
在这里插入图片描述

相关文章:

数据结构、数据类型、数字编码、字符编码:保姆级图文详解

文章目录 前言1、数据结构分类1.1、逻辑结构:线性与非线性1.2、物理结构:连续与分散1.3、数据结构的实现方式1.4、数据结构的选择依据 2、基本数据类型2.1、定义与分类2.2、存储形式 3、数字编码3.1、原码、反码与补码3.2、浮点数编码3.3、整数与浮点数区…...

DM适配连接kettle迁移工具(资源库+数据源配置)

适配改造介绍及说明 本次修改基于8.2.0.0版本调整,在该源码基础上进行DM的适配,已支持DM为资源库的配置以及相关数据迁移。kettle资源库是Kettle ETL工具内置的一个资源库。配置好的数据库可以直接缓存到资源库当中;创建、编辑好的转换/作业…...

WINFORM - DevExpress -> alertControl1提示信息框

第一个按钮为常规按钮, 单击触发 ButtonClick 事件. 第二个按钮有选中和未选中状态. 单击触发 ButtonDownChanged 事件。 if (e.ButtonName "alertButton2") { } 在dev用户界面中进行提示(usecontrolwinform) AlertInfo info new AlertInfo("提示",…...

STM32-串口-UART-Asynchronous

一,发送数据 #include "stdio.h" uint8_t hello[]"Hello,blocking\r\n"; HAL_UART_Transmit(&huart1,hello,sizeof(hello),500); 二,MicroLIB-printf(" hello\r\n") #include "stdio.h" #ifdef __GNUC…...

Nginx三种不同类型的虚拟主机(基于域名、IP 和端口)

🏡作者主页:点击! Nginx-从零开始的服务器之旅专栏:点击! 🐧Linux高级管理防护和群集专栏:点击! ⏰️创作时间:2025年1月15日13点14分 目录 1. 基于域名的虚拟主机 …...

Shell控监Kafka积压

1、获取Kafka消息堆积情况 vi check-kafka-lag.sh #!/bin/bashTOPIC"total_random" GROUP_ID"etl-dw" BOOTSTRAP_SERVER"node-01:9092,node-02:9092,node-03:9092"# 检查第一个参数是否为数字 if ! [[ $1 ~ ^[0-9]$ ]]; thenecho &…...

element-ui textarea备注 textarea 多行输入框

发现用这个组件,为了给用户更好的体验,要加下属性 1. 通过设置 autosize 属性可以使得文本域的高度能够根据文本内容自动进行调整,并且 autosize 还可以设定为一个对象,指定最小行数和最大行数。:autosize"{ minRows: 3, ma…...

Transformer创新模型!Transformer+BO-SVR多变量回归预测,添加气泡图、散点密度图(Matlab)

Transformer创新模型!TransformerBO-SVR多变量回归预测,添加气泡图、散点密度图(Matlab) 目录 Transformer创新模型!TransformerBO-SVR多变量回归预测,添加气泡图、散点密度图(Matlab&#xff0…...

大疆机场及无人机上云

最近基于大疆上云api进行二次开发,后面将按照开发步骤对其进行说明!...

用Cursor生成一个企业官网前端页面(生成腾讯、阿里官网静态页面)

用Cursor生成一个企业官网前端页面 第一版&#xff1a; <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><…...

Java 数组排序

目录 1.Java冒泡排序&#xff08;Bubble Sort&#xff09; 1.冒泡排序 2.冒泡排序的算法原理 3.冒泡排序的复杂度和性能 4.形成代码 2.Java快速排序&#xff08;Quick Sort&#xff09; 3.Java归并排序&#xff08;Merge Sort&#xff09; 4.Java选择排序&#xff08;S…...

LeetCode:78.子集

跟着carl学算法&#xff0c;本系列博客仅做个人记录&#xff0c;建议大家都去看carl本人的博客&#xff0c;写的真的很好的&#xff01; 代码随想录 LeetCode&#xff1a;78.子集 给你一个整数数组 nums &#xff0c;数组中的元素 互不相同 。返回该数组所有可能的子集&#xf…...

【经济学通识——国债】

国债 政府的支出一般大于收入&#xff0c;会有赤字 于是会向全社会去借钱。美国债务上限&#xff0c;象征性的&#xff08;一直上调&#xff09;全球政府债务都在上升。 亚当斯密觉得市场竞争最有效率 市场自由竞争会不可避免的出现萧条。于是&#xff0c;凯恩斯提出政府调节…...

联合体(Union)

联合体&#xff08;Union&#xff09;简介 联合体&#xff08;union&#xff09;是 C 和 C 编程语言中的一种数据结构&#xff0c;和结构体&#xff08;struct&#xff09;类似&#xff0c;但有一些重要的区别。 定义 联合体中的所有成员共享同一段内存&#xff0c;也就是说…...

Kibana:ES|QL 编辑器简介

作者&#xff1a;来自 Elastic drewdaemon ES|QL 很重要 &#x1f4aa; 正如你可能已经听说的那样&#xff0c;ES|QL 是 Elastic 的新查询语言。我们对 ES|QL 寄予厚望。它已经很出色了&#xff0c;但随着时间的推移&#xff0c;它将成为与 Elasticsearch 中的数据交互的最强大…...

【工具】curl工具

curl 官网&#xff1a; https://curl.se/ github: https://github.com/curl?languagec curl 命令 所有参数介绍在线文档 简单使用教程 邮件发送命令 注&#xff1a; 支持SMTP&#xff08;或者POP3&#xff09;协议&#xff0c;curl的版本必须高于7.20&#xff08;含&…...

idea中远程调试中配置的参数说明

Ⅰ 远程调试中配置的端口号与服务本身端口号区别 一、远程调试中配置端口号的作用 在 IDEA 中进行远程调试时配置的端口号主要用于建立开发工具&#xff08;如 IDEA&#xff09;和远程服务之间的调试连接。当你启动远程调试时&#xff0c;IDEA 会监听这个配置的端口号&#xf…...

JavaWeb 前端基础 html + CSS 快速入门 | 018

今日推荐语 指望别人的救赎&#xff0c;势必走向毁灭——波伏娃 日期 学习内容 打卡编号2025年01月17日JavaWeb 前端基础 html CSS018 前言 哈喽&#xff0c;我是菜鸟阿康。 今天 正式进入JavaWeb 的学习&#xff0c;简单学习 html CSS 这2各前端基础部分&am…...

Debian 设定 tomcat 定时重启

目录 背景 过程记录 1、编辑sh文件&#xff0c;完成重启功能 2、设置sh的可执行权限 ​编辑 3、设置定时任务 背景 在Debian 12系统中&#xff0c;原本部署了两个tomcat&#xff0c;结果总是遇到CPU飙升到影响应用正常使用的程度&#xff0c;找了很久原因还是没有找到。 …...

【QT】: 初识 QWidget 控件 | QWidget 核心属性(API) | qrc 文件

&#x1f525; 目录 1. 控件概述 控件体系的发展阶段 2. QWidget 核心属性 2.1 核心属性概览2.2 用件可用&#xff08;Enabled&#xff09; 2.3 坐标系&#xff08;Geometry&#xff09; **实例 1: 控制按钮的位置**实例 2: 表白 程序 2.4 窗口标题&#xff08;windowTiltle&a…...

AMLP框架实战:基于MACE构建高精度机器学习势函数

1. 项目概述&#xff1a;当机器学习势函数遇上自动化管道在计算化学和材料科学领域&#xff0c;我们长久以来面临着一个核心矛盾&#xff1a;精度与效率的权衡。密度泛函理论&#xff08;DFT&#xff09;能提供接近实验的精度&#xff0c;但计算成本高昂&#xff0c;通常只能处…...

Taurus多执行器对比实战:JMeter/Gatling/Locust统一压测方案

1. 为什么选Taurus做多执行器对比——不是为了炫技&#xff0c;而是为了少踩坑在性能测试领域&#xff0c;我见过太多团队卡在“选型”这一步&#xff1a;刚招来一个会写JMeter脚本的工程师&#xff0c;项目突然要压测WebSocket接口&#xff0c;发现JMeter原生支持弱、插件维护…...

Agent开发面试通关攻略:吃透稳拿offer

阅读前置&#xff1a;2026年当下最卷也最缺人的AI岗位&#xff0c;一定是AI Agent开发。最近刷遍CSDN、牛客、力扣最新面经&#xff0c;发现一个非常明显的招聘趋势&#xff1a;普通大模型微调岗位饱和内卷&#xff0c;而AI Agent开发岗位人才严重缺口&#xff0c;薪资更高、竞…...

贵阳婚礼西服定制攻略:面料、工艺、版型避坑指南

婚礼西装是男士婚礼造型的核心&#xff0c;区别于日常商务正装&#xff0c;婚礼西服更看重版型精致度、面料质感、上身挺拔感以及镜头适配度。在贵阳备婚的新人&#xff0c;大多会放弃成品西装&#xff0c;选择专属定制服务。但本地婚礼西服定制市场参差不齐&#xff0c;很多新…...

基于声卡与电流互感器的安全交流功率测量系统设计与实践

1. 项目概述&#xff1a;用声卡安全测量交流功率我一直对各种测量技术抱有浓厚的兴趣&#xff0c;毕竟“测量即认知”这句老话在今天依然适用。对于电力消耗和产出&#xff0c;没有什么比直接测量更能说明问题了。交流功率的测量&#xff0c;核心在于同时获取电压和电流的瞬时值…...

美团外卖mtgsig与waimai_sign双层签名逆向解析

1. 这不是“爬虫教程”&#xff0c;而是一份反向工程现场笔记你搜到这篇内容&#xff0c;大概率正卡在某个调试窗口前&#xff1a;抓包看到mtgsig和waimai_sign两个参数像两堵墙&#xff0c;无论怎么改请求头、换UA、清缓存&#xff0c;返回永远是{"code":403,"…...

毕业设计 yolov11骨折检测医疗辅助系统(源码+论文)

文章目录 0 前言1 项目运行效果2 课题背景2.1 研究背景2.2 国内外研究现状2.3 研究意义 3 设计框架&#xff08;骨折检测系统设计框架说明&#xff09;3.1. 系统架构图3.2. 技术选型3.2.1 核心组件3.2.2 辅助工具 3.3. 核心模块设计3.3.1 YOLO模型训练模块训练流程图关键伪代码…...

如何快速上手DeepPurpose?5分钟完成你的第一个药物-靶点相互作用预测模型

如何快速上手DeepPurpose&#xff1f;5分钟完成你的第一个药物-靶点相互作用预测模型 【免费下载链接】DeepPurpose A Deep Learning Toolkit for DTI, Drug Property, PPI, DDI, Protein Function Prediction (Bioinformatics) 项目地址: https://gitcode.com/gh_mirrors/de…...

2026论文顶级降AI率工具大曝光:一键把AIGC率降至安全线!

步入2026年&#xff0c;学术圈的规则已经彻底变了味。过去那种只盯着查重率的“降重焦虑”早就被更可怕的“降AI焦虑”取代了。AI检测算法越来越聪明&#xff0c;高校审核标准也越来越严苛&#xff0c;光是把重复率压下去已经完全不够用了。现在摆在学生和科研人员面前的难题是…...

如何用Untrunc拯救损坏视频?2025年终极MP4修复工具完全指南

如何用Untrunc拯救损坏视频&#xff1f;2025年终极MP4修复工具完全指南 【免费下载链接】untrunc Restore a damaged (truncated) mp4, m4v, mov, 3gp video. Provided you have a similar not broken video. 项目地址: https://gitcode.com/gh_mirrors/unt/untrunc 当你…...