当前位置: 首页 > article >正文

别再踩坑了!SQL Server数据类型那点事儿,看懂这篇少背三个锅蹬

从0构建WAV文件读懂计算机文件的本质虽然接触计算机有一段时间了但是我的视野一直局限于一个较小的范围之内往往只能看到于算法竞赛相关的内容计算机各种文件在我看来十分复杂认为构建他们并能达到目的是一件困难的事情然而近期我观看了油管上Magicalbat大神的视频发现其实它们的本质都惊人地简单所有计算机文件都是按特定规则组织的二进制数据是人为规定好格式再由计算机解析对于我们来说只要根据规定格式进行编辑就能够成功构建。今天我们就从最朴素的方式入手通过手动构建一个WAV音频文件拆解WAV格式的底层逻辑同时理解一个核心认知只要掌握了文件的格式规范任何类型的文件都能像搭积木一样一行行代码“拼”出来。先认识WAVWAV文件的格式WAV是微软开发的无损音频格式相比于压缩后的MP3它的结构更直白没有复杂的编码压缩因此我们能够通过C文件写入的方式直接完成wav文件的构建wav文件的核心由三个关键的“数据块(Chunk)”组成RIFF块文件的“身份卡”告诉计算机“我是一个WAV文件”fmt块音频的“参数说明”记录采样率、声道数、位深等核心参数data块真正的音频数据存储着声音的数字信号。而每个块的内容又如下图所示RIFF:字段名 字节数 数据类型 固定值/计算规则ChunkID 4 ASCII字符 固定为RIFF无终止符严格4字节ChunkSize 4 32位无符号整数 取值 整个WAV文件大小 - 8字节减去ChunkID和ChunkSize自身的8字节Format 4 ASCII字符 固定为WAVE无终止符严格4字节fmt:字段名 字节数 数据类型 固定值/计算规则ChunkID 4 ASCII字符 固定为fmt 末尾空格无终止符ChunkSize 4 32位无符号整数 PCM编码最常用下固定为16代表后续字段的总字节数不含ChunkID和ChunkSizeAudioFormat代码中Tag 2 16位无符号整数 编码格式1PCM无压缩通用3IEEE浮点6μ律7A律等NumChannels代码中Chnnels拼写笔误 2 16位无符号整数 声道数1单声道2立体声2多声道SampleRate 4 32位无符号整数 采样率每秒采样次数常见44100HzCD音质、48000Hz、22050Hz等ByteRate 4 32位无符号整数 每秒音频数据字节数 SampleRate × NumChannels × BitsPerSample / 8BlockAlign代码中BloclAlign拼写笔误 2 16位无符号整数 每个“采样帧”的字节数 NumChannels × BitsPerSample / 8播放器一次读取的最小单位BitsPerSample代码中BitsperSample 2 16位无符号整数 采样位深每个采样点的比特数8/16/24/3216位最常用data:字段名 字节数 数据类型 固定值/计算规则ChunkID代码中DataId 4 ASCII字符 固定为data无终止符严格4字节DataSize 4 32位无符号整数 音频数据总字节数 采样总数 × BlockAlign采样总数 SampleRate × 音频时长音频数据区 可变 二进制流 PCM编码下为线性整数/浮点数16位位深对应int16_t8位对应uint8_t32位浮点对应float我们接下来的代码就是严格按照这个模板把每个部分的二进制数据“写”进文件里。从零构建WAV一行代码拆解核心逻辑下面是完整的C代码新手也能看懂我们逐段拆解看如何从0生成一个能播放的440Hz正弦波WAV文件#includeusing namespace std;// 类型别名让代码更易读明确数据的字节长度#define u32 uint32_t // 32位无符号整数4字节#define u16 uint16_t // 16位无符号整数2字节#define f32 float // 32位浮点数4字节#define i16 int16_t // 16位有符号整数2字节#define HZ 44100 // 采样率每秒采集44100个声音样本标准音频采样率#define DURATION 5 // 音频时长5秒// 1. 定义WAV的三个核心数据块结构对应格式规范// RIFF块文件整体标识struct chunk1{char ChunkID[4]; // 块标识固定为RIFFu32 ChunkSize; // 从该字段到文件末尾的字节数总字节数-8char Format[4]; // 格式类型固定为WAVE}RIFF;// fmt块音频参数配置struct chunk2{char ChunkID[4]; // 块标识固定为fmt 注意末尾有空格u16 Tag; // 编码格式1代表PCM无压缩u32 ChunkSize; // fmt块的大小PCM格式固定为16u16 Chnnels; // 声道数1单声道2立体声u32 SampleRate; // 采样率u32 ByteRate; // 每秒数据量 采样率×声道数×位深/8u16 BloclAlign; // 每个采样的总字节数 声道数×位深/8u16 BitsperSample; // 每个采样的位深16位常见}Fmt;// data块音频数据存储区struct chunk3{char DataId[4]; // 块标识固定为datau32 DataSize; // 音频数据的总字节数}Data;signed main(int argc,char* argv[]){// 打开文件wb表示以二进制模式写入关键文件本质是二进制FILE *fp fopen(test.wav,wb);// 计算总采样数采样率×时长5秒×44100220500个样本u32 NumSamples HZ * DURATION;// 2. 填充RIFF块并写入文件memcpy(RIFF.ChunkID,RIFF,4); // 写入块标识RIFF.ChunkSize NumSamples*sizeof(u16)36; // 计算块大小memcpy(RIFF.Format,WAVE,4); // 声明为WAVE格式fwrite(RIFF.ChunkID,sizeof(char),4,fp); // 写入4个字符的ChunkIDfwrite(RIFF.ChunkSize,sizeof(u32),1,fp); // 写入4字节的ChunkSizefwrite(RIFF.Format,sizeof(char),4,fp); // 写入4个字符的Format// 3. 填充fmt块并写入文件memcpy(Fmt.ChunkID,fmt ,4);Fmt.ChunkSize 16; // PCM格式下fmt块固定16字节Fmt.Tag 1; // PCM无压缩编码Fmt.Chnnels 1; // 单声道Fmt.SampleRate HZ; // 44100Hz采样率Fmt.ByteRate HZ*sizeof(u16); // 每秒字节数44100×288200Fmt.BloclAlign Fmt.Chnnels * sizeof(u16); // 每个采样2字节Fmt.BitsperSample 16; // 16位位深// 按顺序写入fmt块的所有参数严格遵循格式规范fwrite(Fmt.ChunkID,sizeof(char),4,fp);fwrite(Fmt.ChunkSize,sizeof(u32),1,fp);fwrite(Fmt.Tag,sizeof(u16),1,fp);fwrite(Fmt.Chnnels,sizeof(u16),1,fp);fwrite(Fmt.SampleRate,sizeof(u32),1,fp);fwrite(Fmt.ByteRate,sizeof(u32),1,fp);fwrite(Fmt.BloclAlign,sizeof(u16),1,fp);fwrite(Fmt.BitsperSample,sizeof(u16),1,fp);// 4. 填充data块并写入文件memcpy(Data.DataId,data,4);Data.DataSize NumSamples * sizeof(u16); // 音频数据总字节数fwrite(Data.DataId,sizeof(char),4,fp);fwrite(Data.DataSize,sizeof(u32),1,fp);// 5. 生成音频数据并写入440Hz正弦波标准A调for(int i0;if32 t (f32)i/HZ; // 计算当前时间点秒// 生成440Hz正弦波的数值声音的本质是振动正弦波模拟声波f32 y sinf(t*440.0f*2.0f*3.1415926f);// 转换为16位整数适配16位位深的音频i16 sample (i16)(y*INT16_MAX);// 写入单个音频样本2字节fwrite(sample,sizeof(i16),1,fp);}fclose(fp); // 关闭文件return 0;}所有文件都是“按规则写二进制”的产物写完这段代码你可能会发现生成WAV文件的过程就是“按格式规范往文件里写二进制数据”的过程。而这个逻辑适用于所有计算机文件TXT文档本质是字符的ASCII/UTF-8编码比如字符A对应二进制01000001我们按顺序写入这些编码就成了TXT文件BMP图片由文件头记录宽、高、位深 像素数据每个像素的RGB值组成按BMP格式写这些数据就能生成图片MP4视频哪怕是压缩过的视频也是按MP4的格式规范把编码后的视频帧、音频帧组织成二进制数据EXE可执行文件遵循PE格式把指令、数据、资源按规则写入操作系统就能识别并运行。计算机之所以能“看懂”不同的文件不是因为文件有“魔法”而是因为程序员提前约定了“格式规范”——就像我们约定“RIFF”开头的是WAV文件播放器读到这个标识就按WAV的规则解析后续数据。计算机的本质是“朴素的规则”对刚接触计算机的人来说各种文件、软件、系统看似复杂但拆解到最底层都是“数据规则”的组合只要我们对着格式手册即便使用最朴素的方式也能够成功构建出可以使用的音频文件。计算机的世界没有想象中那般复杂计算机只在乎那最终排好队的 0 和 1。进一步思考从文件到软件了解了各类文件本质我们自然能理解计算机中各个编辑软件的原理是什么了就比如今天举的wav的例子如果我们将示例程序改进一下加入输入那么这是否就成了一个简单的音频编辑软件了呢所有的复杂软件如 Photoshop、Premiere底层逻辑都是如此读取特定规则的二进制 - 在内存中加工处理 - 按规则写回二进制。当你不再把文件看作“黑盒”你便拥有了重塑数字世界的能力。炔捍榔秩

相关文章:

别再踩坑了!SQL Server数据类型那点事儿,看懂这篇少背三个锅蹬

从0构建WAV文件:读懂计算机文件的本质 虽然接触计算机有一段时间了,但是我的视野一直局限于一个较小的范围之内,往往只能看到于算法竞赛相关的内容,计算机各种文件在我看来十分复杂,认为构建他们并能达到目的是一件困难…...

终极Windows和Office激活指南:KMS_VL_ALL_AIO完整教程

终极Windows和Office激活指南:KMS_VL_ALL_AIO完整教程 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows和Office激活烦恼吗?每次系统提示"产品未激活&q…...

Go Channel 缓冲区溢出问题

Go Channel 缓冲区溢出问题解析 在Go语言中,Channel是协程间通信的核心机制,但其缓冲区溢出问题常被开发者忽视。当写入数据的速度超过读取速度时,缓冲区可能溢出,导致程序阻塞或数据丢失。理解并解决这一问题,对构建…...

Java final关键字与抽象类深度解析

二、final关键字各位同学,接下来我们学习一个在面向对象编程中偶尔会用到的一个关键字叫final,也是为后面学习抽象类和接口做准备的。2.1 final修饰符的特点(面试题)我们先来认识一下final的特点,final关键字是最终的意思,可以修饰…...

6月PMP紧急预警:错过这次,下次难度让你哭!附60天极简通关计划

大家好,我是去年差点错过“末班车”的大头。 今天是4月6日。看到这个日期,我知道很多人心里在想什么:“还有两个月呢,急什么?” 我必须泼一盆冷水:留给你的时间真的不多了。 如果说之前还有机会摸鱼&…...

MIKEURBAN几种错误解决方法

今天小编给大家总结关于MIKEURBAN计算中常见的几种错误吧!错误一MIKE URBAN出现以上的错误时候,我们按照错误提示找出错误点的编号,此时的错误点是由于没有和汇水区做链接导致,重新手动做链接即可解决。错误二MIKE URBAN出现以上的…...

终极模组管理器:XXMI启动器让多游戏模组管理变得简单高效 [特殊字符]

终极模组管理器:XXMI启动器让多游戏模组管理变得简单高效 🚀 【免费下载链接】XXMI-Launcher Modding platform for GI, HSR, WW and ZZZ 项目地址: https://gitcode.com/gh_mirrors/xx/XXMI-Launcher 你是否曾经为《原神》《星穹铁道》《鸣潮》等…...

突破端侧极限!让 Gemma 4 在手机不仅能跑,还能“用中文张口说话” —— 安卓端侧大模型

2026 年 4 月初,Google 抛下了一枚重磅炸弹:Gemma 4 终于来了!更令人震撼的是,他们真的把多模态大模型完完整整塞进了手机里 —— 这一次,完全不需要联网、不需要传数据到云端,真正的零延迟隐私拉满的端侧离…...

STM32CubeMX 6.4+ 配置FreeRTOS+LWIP避坑实录(正点原子探索者V2 + LAN8720A)

STM32CubeMX 6.4高版本FreeRTOS与LWIP配置全攻略:从PHY复位到网络调试 最近在给正点原子探索者V2开发板移植FreeRTOSLWIP时,发现网上大部分教程都停留在CubeMX 5.x时代。当我用6.4版本按照老教程操作时,从时钟配置到PHY复位处处碰壁。经过三天…...

DDR5 SDRAM中的DQS间隔振荡器:原理、应用与误差分析

1. DDR5 SDRAM中的DQS间隔振荡器是什么? 如果你拆开过电脑内存条,可能会注意到那些排列整齐的黑色芯片——这就是SDRAM。而DDR5作为最新一代的内存标准,在速度和能效上都比前代有了显著提升。但今天我们要聊的不是这些宏观特性,而…...

告别重复搬砖!OpenClaw从零搭建可操作系统级AI智能体,自动化提效10倍实战指南

做开发、运维、办公的同学,是不是每天都在被重复的系统操作折磨?每天上班先开固定的5个软件、批量重命名上百个项目文件、服务器日常巡检查日志、Excel数据处理生成周报、重复的键鼠操作填OA表单,这些机械重复的工作,占了每天60%以…...

访问控制漏洞深度拆解(含代码)

在区块链安全事件中,访问控制漏洞(Access Control)已成为损失最高的攻击类型之一。攻击者无需复杂技术,只要找到“未加权限限制”的关键函数,就能直接接管合约甚至清空资金🔍 漏洞原理解析该漏洞本质是“谁都能调用本该受限的函数…...

【PyTorch 3.0静态图分布式训练权威指南】:20年炼成的7大避坑法则与吞吐量提升2.8倍实测方案

第一章:PyTorch 3.0静态图分布式训练的演进逻辑与核心范式PyTorch 3.0标志着从动态图主导范式向“动静统一”架构的关键跃迁。其静态图能力不再依赖独立编译器(如TorchScript或JIT的有限优化),而是通过原生集成的torch.compile()后…...

CLion 2025.1.1 + CubeMX + CMake:一站式配置STM32调试与烧录环境(以F103C8T6为例)

1. 为什么选择CLion开发STM32? 第一次用CLion开发STM32时,我整个人都是懵的——之前用Keil习惯了那种"配置5分钟,编译2小时"的节奏,突然切换到CLion这种现代IDE还真有点不适应。但用顺手之后发现真香定律再次应验&#…...

纽约州校园数据泄露激增背景下的安全治理与技术防御研究

摘要 2026 年 4 月 6 日,databreaches.net发布报道显示,2025 年纽约州校园数据安全事件同比大幅上升72%,其中长岛地区报告数量达44 起,揭示美国 K-12 教育机构在数据安全防护、账号权限管理、威胁监测与应急响应等方面存在系统性短…...

【Linux开发】01多线程编程:线程的创建与运行

一、为什么需要线程? 1.1 回顾多进程的缺点 我们之前学习了多进程服务器:父进程 fork 出子进程来处理客户端请求。这种方式虽然能实现并发,但存在一些问题: 资源开销大:每个进程都有独立的地址空间,创建和切…...

Matlab串口通信上位机开发:从零搭建实时数据采集系统(附完整代码)

Matlab串口通信上位机开发实战:从零构建工业级数据采集系统 在工业自动化、物联网设备调试和科研实验数据采集领域,串口通信作为最基础也最可靠的数据传输方式,至今仍发挥着不可替代的作用。Matlab凭借其强大的数值计算能力和丰富的可视化工具…...

LIME算法实战:从理论到应用的全面解析

1. 为什么我们需要LIME算法? 第一次接触LIME算法是在处理一个医疗影像分类项目时。当时我们的深度学习模型准确率高达95%,但医生们始终不敢完全信任这个"黑箱"。我记得有位老专家指着CT扫描图问我:"小伙子,你能告诉…...

Wireshark蓝牙协议抓包实战:从环境搭建到数据解析

1. 环境准备:硬件与软件双管齐下 搞蓝牙协议分析就像侦探破案,没有趁手的工具可不行。我去年调试智能手环时,就因为没配好环境浪费了两天时间。咱们先从必备装备说起: 硬件三件套缺一不可: nRF52840 Dongle&#xff1a…...

OpenClaw开发提效指南:Qwen3.5-9B实现日志分析+异常修复建议

OpenClaw开发提效指南:Qwen3.5-9B实现日志分析异常修复建议 1. 为什么开发者需要日志分析自动化 作为一名全栈开发者,我每天要面对数十个微服务的日志文件。传统的人工排查方式就像在黑暗森林中摸索——需要反复grep关键字、比对时间戳、手动拼接调用链…...

电能质量扰动仿真:MATLAB/Simulink的奇妙之旅

Power Quality Disturbance:基于MATLAB/Simulink的各种电能质量扰动仿真模型,包括配电线路故障、感应电机启动、变压器励磁、单相/三相非线性负载等模型,可用于模拟各种电能质量扰动和分析研究。 附带一份详细的说明文档对各模型进行说明&…...

解锁商场流量密码:一次地贴定制如何让我的活动效果翻倍?

在商场运营与活动营销中,流量获取与转化始终是核心痛点——高空广告成本高、受众触达不精准,传统海报易被忽略,线上引流又面临流量碎片化、转化链路长的困境。而商场地贴作为一种低成本、高触达、强引导的户外广告物料,往往被多数…...

Unity发布京东小游戏反

从 UI 工程师到 AI 应用架构者 13 年前,我的工作是让按钮在 IE6 上对齐; 13 年后,我用 fetch-event-source 订阅大模型的“思维流”,用 OCR 解锁图片中的文字——前端,正在成为 AI 产品的第一道体验防线。 最近&#x…...

MCP服务器架构设计图首次公开:含时序一致性保障机制、跨域设备注册拓扑、双向心跳状态机(2024 Q2最新LTS版)

第一章:MCP服务器架构设计图概览与核心设计哲学MCP(Modular Control Plane)服务器并非传统单体控制平面的简单重构,而是一种以“可插拔、可观测、可演进”为根基的分布式控制面架构。其设计图呈现清晰的分层结构:底层为…...

从SVM到LSTM:我的谣言检测模型优化踩坑实录(附PHEME/微博数据集对比)

从SVM到LSTM:我的谣言检测模型优化踩坑实录 去年夏天接手社交媒体谣言检测项目时,我完全没料到这个看似标准的文本分类任务会如此充满挑战。团队最初的想法很简单:用传统机器学习方法快速搭建基线,再逐步升级到深度学习模型。但当…...

小白/程序员必看:收藏这份强化学习训练智能体的实战指南(HelloAgents实战篇)

本文介绍了如何使用强化学习训练智能体,从LLM训练流程讲起,对比了PBRFT与Agentic RL的区别,并详细阐述了Agentic RL的六大核心能力:推理、工具使用、记忆、规划、自我改进和感知。文章还介绍了HelloAgents框架如何集成强化学习库T…...

APSIM模型---农田管理优化、作物品种和株型筛选、农田固碳和温室气体排放等

随着数字农业和智慧农业的发展,基于过程的农业生产系统模型在模拟作物对气候变化的响应与适应、农田管理优化、作物品种和株型筛选、农田固碳和温室气体排放等领域扮演着越来越重要的作用。APSIM (Agricultural Production Systems sIMulator)模型是世界知名的作物生…...

使用钉钉远程操作你的claude code露

先回顾:三次握手(建立连接)核心流程(实际版) 为了让挥手流程衔接更顺畅,咱们先快速回顾三次握手的实际核心,避免上下文脱节: 第一步(客户端→服务器)&#xf…...

我的前半生

大家好,我是李文涛。2026年,我步入了人生的不惑之年。回望来时路,快四十载光阴如白驹过隙。今天想和大家分享一下我的前半生——一个从秦岭深处走出的小镇青年,是如何一步步走到今天的。1、 在最美的地方,度过最纯真的…...

Java全栈开发工程师面试实录:从基础到高阶的深度技术探讨

Java全栈开发工程师面试实录:从基础到高阶的深度技术探讨 一、开场介绍 面试官(李工):你好,我是李工,目前在一家互联网大厂负责后端架构设计。今天来聊聊你的技术背景和项目经验。 应聘者(张伟&…...