当前位置: 首页 > article >正文

别再踩坑了!SQL Server数据类型那点事儿,看懂这篇少背三个锅没

从0构建WAV文件读懂计算机文件的本质虽然接触计算机有一段时间了但是我的视野一直局限于一个较小的范围之内往往只能看到于算法竞赛相关的内容计算机各种文件在我看来十分复杂认为构建他们并能达到目的是一件困难的事情然而近期我观看了油管上Magicalbat大神的视频发现其实它们的本质都惊人地简单所有计算机文件都是按特定规则组织的二进制数据是人为规定好格式再由计算机解析对于我们来说只要根据规定格式进行编辑就能够成功构建。今天我们就从最朴素的方式入手通过手动构建一个WAV音频文件拆解WAV格式的底层逻辑同时理解一个核心认知只要掌握了文件的格式规范任何类型的文件都能像搭积木一样一行行代码“拼”出来。先认识WAVWAV文件的格式WAV是微软开发的无损音频格式相比于压缩后的MP3它的结构更直白没有复杂的编码压缩因此我们能够通过C文件写入的方式直接完成wav文件的构建wav文件的核心由三个关键的“数据块(Chunk)”组成RIFF块文件的“身份卡”告诉计算机“我是一个WAV文件”fmt块音频的“参数说明”记录采样率、声道数、位深等核心参数data块真正的音频数据存储着声音的数字信号。而每个块的内容又如下图所示RIFF:字段名 字节数 数据类型 固定值/计算规则ChunkID 4 ASCII字符 固定为RIFF无终止符严格4字节ChunkSize 4 32位无符号整数 取值 整个WAV文件大小 - 8字节减去ChunkID和ChunkSize自身的8字节Format 4 ASCII字符 固定为WAVE无终止符严格4字节fmt:字段名 字节数 数据类型 固定值/计算规则ChunkID 4 ASCII字符 固定为fmt 末尾空格无终止符ChunkSize 4 32位无符号整数 PCM编码最常用下固定为16代表后续字段的总字节数不含ChunkID和ChunkSizeAudioFormat代码中Tag 2 16位无符号整数 编码格式1PCM无压缩通用3IEEE浮点6μ律7A律等NumChannels代码中Chnnels拼写笔误 2 16位无符号整数 声道数1单声道2立体声2多声道SampleRate 4 32位无符号整数 采样率每秒采样次数常见44100HzCD音质、48000Hz、22050Hz等ByteRate 4 32位无符号整数 每秒音频数据字节数 SampleRate × NumChannels × BitsPerSample / 8BlockAlign代码中BloclAlign拼写笔误 2 16位无符号整数 每个“采样帧”的字节数 NumChannels × BitsPerSample / 8播放器一次读取的最小单位BitsPerSample代码中BitsperSample 2 16位无符号整数 采样位深每个采样点的比特数8/16/24/3216位最常用data:字段名 字节数 数据类型 固定值/计算规则ChunkID代码中DataId 4 ASCII字符 固定为data无终止符严格4字节DataSize 4 32位无符号整数 音频数据总字节数 采样总数 × BlockAlign采样总数 SampleRate × 音频时长音频数据区 可变 二进制流 PCM编码下为线性整数/浮点数16位位深对应int16_t8位对应uint8_t32位浮点对应float我们接下来的代码就是严格按照这个模板把每个部分的二进制数据“写”进文件里。从零构建WAV一行代码拆解核心逻辑下面是完整的C代码新手也能看懂我们逐段拆解看如何从0生成一个能播放的440Hz正弦波WAV文件#includeusing namespace std;// 类型别名让代码更易读明确数据的字节长度#define u32 uint32_t // 32位无符号整数4字节#define u16 uint16_t // 16位无符号整数2字节#define f32 float // 32位浮点数4字节#define i16 int16_t // 16位有符号整数2字节#define HZ 44100 // 采样率每秒采集44100个声音样本标准音频采样率#define DURATION 5 // 音频时长5秒// 1. 定义WAV的三个核心数据块结构对应格式规范// RIFF块文件整体标识struct chunk1{char ChunkID[4]; // 块标识固定为RIFFu32 ChunkSize; // 从该字段到文件末尾的字节数总字节数-8char Format[4]; // 格式类型固定为WAVE}RIFF;// fmt块音频参数配置struct chunk2{char ChunkID[4]; // 块标识固定为fmt 注意末尾有空格u16 Tag; // 编码格式1代表PCM无压缩u32 ChunkSize; // fmt块的大小PCM格式固定为16u16 Chnnels; // 声道数1单声道2立体声u32 SampleRate; // 采样率u32 ByteRate; // 每秒数据量 采样率×声道数×位深/8u16 BloclAlign; // 每个采样的总字节数 声道数×位深/8u16 BitsperSample; // 每个采样的位深16位常见}Fmt;// data块音频数据存储区struct chunk3{char DataId[4]; // 块标识固定为datau32 DataSize; // 音频数据的总字节数}Data;signed main(int argc,char* argv[]){// 打开文件wb表示以二进制模式写入关键文件本质是二进制FILE *fp fopen(test.wav,wb);// 计算总采样数采样率×时长5秒×44100220500个样本u32 NumSamples HZ * DURATION;// 2. 填充RIFF块并写入文件memcpy(RIFF.ChunkID,RIFF,4); // 写入块标识RIFF.ChunkSize NumSamples*sizeof(u16)36; // 计算块大小memcpy(RIFF.Format,WAVE,4); // 声明为WAVE格式fwrite(RIFF.ChunkID,sizeof(char),4,fp); // 写入4个字符的ChunkIDfwrite(RIFF.ChunkSize,sizeof(u32),1,fp); // 写入4字节的ChunkSizefwrite(RIFF.Format,sizeof(char),4,fp); // 写入4个字符的Format// 3. 填充fmt块并写入文件memcpy(Fmt.ChunkID,fmt ,4);Fmt.ChunkSize 16; // PCM格式下fmt块固定16字节Fmt.Tag 1; // PCM无压缩编码Fmt.Chnnels 1; // 单声道Fmt.SampleRate HZ; // 44100Hz采样率Fmt.ByteRate HZ*sizeof(u16); // 每秒字节数44100×288200Fmt.BloclAlign Fmt.Chnnels * sizeof(u16); // 每个采样2字节Fmt.BitsperSample 16; // 16位位深// 按顺序写入fmt块的所有参数严格遵循格式规范fwrite(Fmt.ChunkID,sizeof(char),4,fp);fwrite(Fmt.ChunkSize,sizeof(u32),1,fp);fwrite(Fmt.Tag,sizeof(u16),1,fp);fwrite(Fmt.Chnnels,sizeof(u16),1,fp);fwrite(Fmt.SampleRate,sizeof(u32),1,fp);fwrite(Fmt.ByteRate,sizeof(u32),1,fp);fwrite(Fmt.BloclAlign,sizeof(u16),1,fp);fwrite(Fmt.BitsperSample,sizeof(u16),1,fp);// 4. 填充data块并写入文件memcpy(Data.DataId,data,4);Data.DataSize NumSamples * sizeof(u16); // 音频数据总字节数fwrite(Data.DataId,sizeof(char),4,fp);fwrite(Data.DataSize,sizeof(u32),1,fp);// 5. 生成音频数据并写入440Hz正弦波标准A调for(int i0;if32 t (f32)i/HZ; // 计算当前时间点秒// 生成440Hz正弦波的数值声音的本质是振动正弦波模拟声波f32 y sinf(t*440.0f*2.0f*3.1415926f);// 转换为16位整数适配16位位深的音频i16 sample (i16)(y*INT16_MAX);// 写入单个音频样本2字节fwrite(sample,sizeof(i16),1,fp);}fclose(fp); // 关闭文件return 0;}所有文件都是“按规则写二进制”的产物写完这段代码你可能会发现生成WAV文件的过程就是“按格式规范往文件里写二进制数据”的过程。而这个逻辑适用于所有计算机文件TXT文档本质是字符的ASCII/UTF-8编码比如字符A对应二进制01000001我们按顺序写入这些编码就成了TXT文件BMP图片由文件头记录宽、高、位深 像素数据每个像素的RGB值组成按BMP格式写这些数据就能生成图片MP4视频哪怕是压缩过的视频也是按MP4的格式规范把编码后的视频帧、音频帧组织成二进制数据EXE可执行文件遵循PE格式把指令、数据、资源按规则写入操作系统就能识别并运行。计算机之所以能“看懂”不同的文件不是因为文件有“魔法”而是因为程序员提前约定了“格式规范”——就像我们约定“RIFF”开头的是WAV文件播放器读到这个标识就按WAV的规则解析后续数据。计算机的本质是“朴素的规则”对刚接触计算机的人来说各种文件、软件、系统看似复杂但拆解到最底层都是“数据规则”的组合只要我们对着格式手册即便使用最朴素的方式也能够成功构建出可以使用的音频文件。计算机的世界没有想象中那般复杂计算机只在乎那最终排好队的 0 和 1。进一步思考从文件到软件了解了各类文件本质我们自然能理解计算机中各个编辑软件的原理是什么了就比如今天举的wav的例子如果我们将示例程序改进一下加入输入那么这是否就成了一个简单的音频编辑软件了呢所有的复杂软件如 Photoshop、Premiere底层逻辑都是如此读取特定规则的二进制 - 在内存中加工处理 - 按规则写回二进制。当你不再把文件看作“黑盒”你便拥有了重塑数字世界的能力。讼圃膊哟

相关文章:

别再踩坑了!SQL Server数据类型那点事儿,看懂这篇少背三个锅没

从0构建WAV文件:读懂计算机文件的本质 虽然接触计算机有一段时间了,但是我的视野一直局限于一个较小的范围之内,往往只能看到于算法竞赛相关的内容,计算机各种文件在我看来十分复杂,认为构建他们并能达到目的是一件困难…...

ArduMotor:跨平台电机驱动抽象库设计与实现

1. ArduMotor库概述:面向Arduino与KL46Z平台的电机驱动抽象层ArduMotor是一个专为嵌入式电机控制设计的轻量级C库,核心目标是为Arduino兼容平台(如UNO、Nano)及NXP FRDM-KL46Z开发板提供统一、可移植的电机驱动接口。其底层硬件抽…...

ESP8266红外MQTT网关:基于Homie协议的轻量级IoT封装

1. 项目概述simple-homie-iot-ir是一个面向 ESP8266 平台(亦可适配 ESP32)的轻量级嵌入式 IoT 封装库,其核心定位并非从零实现 Homie 规范,而是作为homie-iotESP 库的简化抽象层,专为红外(IR)设…...

2026奇点智能技术大会前瞻(仅限首批参会者解密的8项AI-Native Data Stack技术白皮书)

第一章:2026奇点智能技术大会:AI原生大数据处理 2026奇点智能技术大会(https://ml-summit.org) 本届大会首次定义“AI原生大数据处理”范式——数据不再经由传统ETL管道预处理后喂给模型,而是以流式、语义化、向量化形态直接进入推理与训练…...

CISSP域3知识点 安全工程基础

🏗️ CISSP 域3安全工程基础丨把安全"建"进系统里Domain 3 安全架构与工程 OSG第十版第8章核心内容 占域3(13%总权重)30%以上,概念题场景题双高频 这一块是整个 CISSP 的理论地基,不搞透,后面很…...

效率神器!命令行终端优化(Zsh, iTerm2)

效率神器!命令行终端优化(Zsh, iTerm2) 对于开发者和技术爱好者来说,命令行终端是日常工作中不可或缺的工具。默认的终端配置往往功能有限,操作效率低下。通过优化终端环境,比如使用Zsh和iTerm2&#xff0…...

AI模型签名+SBOM+运行时策略绑定:SITS2026现场演示12分钟构建合规可信AI交付单元

第一章:SITS2026演讲:AI原生DevSecOps实践 2026奇点智能技术大会(https://ml-summit.org) 在SITS2026主会场,来自全球头部云原生安全团队的联合实践展示了如何将大语言模型(LLM)与策略即代码(Policy-as-C…...

避坑指南:在Ubuntu 20.04上编译安装GTSAM 4.2并运行因子图示例

深度避坑指南:Ubuntu 20.04下GTSAM 4.2编译安装与因子图实战全解析 当你在Ubuntu 20.04上尝试编译安装GTSAM 4.2时,是否遇到过Python绑定失败、CMake参数配置错误或是依赖版本冲突的困扰?作为机器人感知和SLAM领域的重要工具库,GT…...

从零开始:ArcGIS Pro二次开发环境搭建与首个模块加载项实战

1. 环境准备:从零搭建ArcGIS Pro开发环境 第一次接触ArcGIS Pro二次开发时,我花了整整两天时间才把环境配置好。现在回想起来,其实只要抓住几个关键点就能避开那些坑。首先需要确认的是软件版本匹配问题——这是新手最容易翻车的地方。根据我…...

终极指南:如何用VR-Reversal免费将3D视频转为2D播放

终极指南:如何用VR-Reversal免费将3D视频转为2D播放 【免费下载链接】VR-reversal VR-Reversal - Player for conversion of 3D video to 2D with optional saving of head tracking data and rendering out of 2D copies. 项目地址: https://gitcode.com/gh_mirr…...

C#索引器练习题

索引器是一种特殊的属性,允许类或结构的实例像数组一样通过索引进行访问。它提供了使用 [] 运算符访问对象中元素集合的便捷方式。一、考察索引器的定义与使用 难度:⭐定义一个 StudentClass 班级类,该类中包含一个集合用于存储学生姓名。…...

知乎x-zse-96参数逆向实战:从断点调试到Python复现

1. 逆向分析前的准备工作 第一次接触知乎x-zse-96参数逆向时,我完全是个小白。记得当时为了抓取一些公开的问答数据,直接用requests发请求却总是返回403错误。后来才发现,知乎的接口有个关键的安全校验参数x-zse-96,这个参数的值是…...

从果园到代码:手把手教你用YOLOv5+DeepSort实现猕猴桃自动计数(附避坑指南)

从果园到代码:手把手教你用YOLOv5DeepSort实现猕猴桃自动计数(附避坑指南) 盛夏的果园里,阳光透过茂密的枝叶洒在成串的猕猴桃上。果农老王正拿着记录本,一株株清点着今年的收成。"这活儿太费眼了,数着…...

SDD基于规范编程-OpenSpec及SuperPowers伟

智能体时代的代码范式转移与 C# 的战略转型 传统的 C# 开发模式,即所谓的“工程导向型”开发,要求开发者创建一个复杂的项目结构,包括项目文件(.csproj)、解决方案文件(.sln)、属性设置以及依赖…...

WPF无边框窗口最大化时避免遮挡任务栏的终极方案

1. 为什么无边框窗口会遮挡任务栏? 很多开发者在使用WPF开发自定义窗口时,都会遇到一个头疼的问题:当窗口设置为无边框(WindowStyle"None")并最大化时,窗口会遮挡系统的任务栏。这个问题看似简单…...

得意黑Smiley Sans:一款能让你爱上中文排版的窄斜体黑体终极指南

得意黑Smiley Sans:一款能让你爱上中文排版的窄斜体黑体终极指南 【免费下载链接】smiley-sans 得意黑 Smiley Sans:一款在人文观感和几何特征中寻找平衡的中文黑体 项目地址: https://gitcode.com/gh_mirrors/smi/smiley-sans 你是否厌倦了千篇一…...

AI原生敏捷开发落地指南(Gartner 2024验证:交付周期压缩63%的关键转折点)

第一章:AI原生敏捷开发的范式跃迁 2026奇点智能技术大会(https://ml-summit.org) 传统敏捷开发以人为核心、迭代交付为特征,而AI原生敏捷开发则将大模型能力深度嵌入需求分析、测试生成、代码补全与运维反馈闭环中,形成“感知—推理—执行—…...

CentOS 7.6服务器上,用FileZilla搞定VOS3000 8.0安装与授权(附详细命令)

CentOS 7.6服务器上高效部署VOS3000 8.0的完整指南 在当今VoIP业务快速发展的背景下,稳定可靠的通信系统部署成为企业运营的关键。本文将详细介绍如何在CentOS 7.6服务器上,结合FileZilla等工具,完成VOS3000 8.0的专业级部署与授权流程。不同…...

保姆级教程:用PaLI-X和PaLM-E微调你自己的RT-2风格机器人模型(附避坑指南)

从零构建RT-2风格机器人模型:基于PaLI-X/PaLM-E的实战指南 当我在实验室第一次看到RT-2模型准确识别出"即将倾倒的杯子"并实施救援动作时,意识到具身智能的临界点已经到来。这不是简单的物体抓取,而是机器对物理世界的因果推理——…...

Q、K、V大揭秘:小白也能看懂的自注意力机制,助你入门大模型(收藏版)

本文用大白话解释了自注意力机制中的核心元素Q、K、V,通过图书馆找书的类比,说明了Q代表查询指令、K代表索引标签、V代表实际内容。文章阐述了Q、K、V如何协同工作,实现精准的信息匹配和加权整合,帮助读者理解大模型如何处理全局信…...

SGP40气体传感器I²C驱动与嵌入式移植实战

1. SGP40气体传感器底层驱动技术解析1.1 传感器核心特性与工程定位SGP40是瑞士Sensirion公司推出的数字式挥发性有机化合物(VOC)气体传感器,专为室内空气质量监测、智能家电和IoT终端设计。其核心价值不在于直接输出ppm级VOC浓度,…...

SpringCloud进阶--Sentinel 流量防卫兵弛

一、项目背景与核心价值 1. 解决的核心痛点 Navicat的数据库连接密码并非明文存储,而是通过AES算法加密后写入.ncx格式的XML配置文件中。一旦用户忘记密码,常规方式只能重新配置连接,效率极低。本项目只作为学习研究使用,不做其他…...

从Matlab到FPGA:CIC滤波器设计验证全流程(附可下载的Verilog代码与测试脚本)

从Matlab到FPGA:CIC滤波器设计验证全流程实战指南 在数字信号处理领域,CIC(Cascaded Integrator-Comb)滤波器因其无需乘法器的硬件友好特性,成为数字下变频、采样率转换等场景的首选方案。本文将带领算法工程师和FPGA开…...

Hagicode.Libs:统一集成多个 AI 编程助手 CLI 的工程实践郝

1. 什么是 Apache SeaTunnel? Apache SeaTunnel 是一个非常易于使用、高性能、支持实时流式和离线批处理的海量数据集成平台。它的目标是解决常见的数据集成问题,如数据源多样性、同步场景复杂性以及资源消耗高的问题。 核心特性 丰富的数据源支持&#…...

Claude Code Auto Mode 的技术实现

Claude Code Auto Mode 通过智能代码补全和上下文理解提升编程效率。该模式能自动分析当前代码上下文,预测开发者意图,提供精准的代码建议。支持多种编程语言,包括Python、JavaScript、Java等主流语言。深度学习模型实时学习项目代码风格和模…...

uni-app上传图片总失败?可能是你没处理好这几个细节(uni-file-picker实战排雷)

uni-app图片上传疑难排查指南:从临时路径到稳定交付的完整解决方案 在移动端开发中,文件上传功能看似简单,却暗藏诸多"坑点"。最近接手一个电商项目时,我们团队在uni-file-picker组件上栽了跟头——用户上传的图片时而显…...

mbino:Arduino上实现mbed HAL的轻量级嵌入式抽象层

1. 项目概述mbino 是一个面向 Arduino 平台的轻量级嵌入式抽象层移植库,其核心目标是将 mbed OS 2 的标准化硬件抽象 API(Hardware Abstraction Layer, HAL)无缝引入以 AVR 8-bit 微控制器(如 ATmega328P、ATmega2560)…...

diffusion model的基本概念

主要分为两个步骤:加密加噪声让原图变成模糊图(Forward Process),将模糊图去噪声,让其变成清晰图(Reverse Process) 先说Recerse Process的过程本质就是去除掉无用的像素,让有用的像素留下来(类似加密与解密…...

信息时代的内容创作者,你离“爆款“只差一个正确的信息入口

说实话,作为一个在互联网内容行业摸爬滚打七八年的老编辑,我早就被各种信息轰炸得有些麻木了。每天早上醒来,手机里躺着十几个App的推送通知,微信群里几百条未读消息,邮箱里塞满了各类资讯订阅。想要快速了解今天发生了…...

OpenGL多线程踩坑实录:EGL_BAD_ACCESS错误排查与修复指南

OpenGL多线程开发中的EGL_BAD_ACCESS:从原理到实战解决方案 当你在深夜调试一个复杂的OpenGL多线程应用时,突然在终端看到EGL_BAD_ACCESS错误提示,那种感觉就像在高速公路上爆胎——既焦虑又无助。这个错误在多线程OpenGL开发中极为常见&…...