当前位置: 首页 > article >正文

别再踩坑了!SQL Server数据类型那点事儿,看懂这篇少背三个锅厣

从0构建WAV文件读懂计算机文件的本质虽然接触计算机有一段时间了但是我的视野一直局限于一个较小的范围之内往往只能看到于算法竞赛相关的内容计算机各种文件在我看来十分复杂认为构建他们并能达到目的是一件困难的事情然而近期我观看了油管上Magicalbat大神的视频发现其实它们的本质都惊人地简单所有计算机文件都是按特定规则组织的二进制数据是人为规定好格式再由计算机解析对于我们来说只要根据规定格式进行编辑就能够成功构建。今天我们就从最朴素的方式入手通过手动构建一个WAV音频文件拆解WAV格式的底层逻辑同时理解一个核心认知只要掌握了文件的格式规范任何类型的文件都能像搭积木一样一行行代码“拼”出来。先认识WAVWAV文件的格式WAV是微软开发的无损音频格式相比于压缩后的MP3它的结构更直白没有复杂的编码压缩因此我们能够通过C文件写入的方式直接完成wav文件的构建wav文件的核心由三个关键的“数据块(Chunk)”组成RIFF块文件的“身份卡”告诉计算机“我是一个WAV文件”fmt块音频的“参数说明”记录采样率、声道数、位深等核心参数data块真正的音频数据存储着声音的数字信号。而每个块的内容又如下图所示RIFF:字段名 字节数 数据类型 固定值/计算规则ChunkID 4 ASCII字符 固定为RIFF无终止符严格4字节ChunkSize 4 32位无符号整数 取值 整个WAV文件大小 - 8字节减去ChunkID和ChunkSize自身的8字节Format 4 ASCII字符 固定为WAVE无终止符严格4字节fmt:字段名 字节数 数据类型 固定值/计算规则ChunkID 4 ASCII字符 固定为fmt 末尾空格无终止符ChunkSize 4 32位无符号整数 PCM编码最常用下固定为16代表后续字段的总字节数不含ChunkID和ChunkSizeAudioFormat代码中Tag 2 16位无符号整数 编码格式1PCM无压缩通用3IEEE浮点6μ律7A律等NumChannels代码中Chnnels拼写笔误 2 16位无符号整数 声道数1单声道2立体声2多声道SampleRate 4 32位无符号整数 采样率每秒采样次数常见44100HzCD音质、48000Hz、22050Hz等ByteRate 4 32位无符号整数 每秒音频数据字节数 SampleRate × NumChannels × BitsPerSample / 8BlockAlign代码中BloclAlign拼写笔误 2 16位无符号整数 每个“采样帧”的字节数 NumChannels × BitsPerSample / 8播放器一次读取的最小单位BitsPerSample代码中BitsperSample 2 16位无符号整数 采样位深每个采样点的比特数8/16/24/3216位最常用data:字段名 字节数 数据类型 固定值/计算规则ChunkID代码中DataId 4 ASCII字符 固定为data无终止符严格4字节DataSize 4 32位无符号整数 音频数据总字节数 采样总数 × BlockAlign采样总数 SampleRate × 音频时长音频数据区 可变 二进制流 PCM编码下为线性整数/浮点数16位位深对应int16_t8位对应uint8_t32位浮点对应float我们接下来的代码就是严格按照这个模板把每个部分的二进制数据“写”进文件里。从零构建WAV一行代码拆解核心逻辑下面是完整的C代码新手也能看懂我们逐段拆解看如何从0生成一个能播放的440Hz正弦波WAV文件#includeusing namespace std;// 类型别名让代码更易读明确数据的字节长度#define u32 uint32_t // 32位无符号整数4字节#define u16 uint16_t // 16位无符号整数2字节#define f32 float // 32位浮点数4字节#define i16 int16_t // 16位有符号整数2字节#define HZ 44100 // 采样率每秒采集44100个声音样本标准音频采样率#define DURATION 5 // 音频时长5秒// 1. 定义WAV的三个核心数据块结构对应格式规范// RIFF块文件整体标识struct chunk1{char ChunkID[4]; // 块标识固定为RIFFu32 ChunkSize; // 从该字段到文件末尾的字节数总字节数-8char Format[4]; // 格式类型固定为WAVE}RIFF;// fmt块音频参数配置struct chunk2{char ChunkID[4]; // 块标识固定为fmt 注意末尾有空格u16 Tag; // 编码格式1代表PCM无压缩u32 ChunkSize; // fmt块的大小PCM格式固定为16u16 Chnnels; // 声道数1单声道2立体声u32 SampleRate; // 采样率u32 ByteRate; // 每秒数据量 采样率×声道数×位深/8u16 BloclAlign; // 每个采样的总字节数 声道数×位深/8u16 BitsperSample; // 每个采样的位深16位常见}Fmt;// data块音频数据存储区struct chunk3{char DataId[4]; // 块标识固定为datau32 DataSize; // 音频数据的总字节数}Data;signed main(int argc,char* argv[]){// 打开文件wb表示以二进制模式写入关键文件本质是二进制FILE *fp fopen(test.wav,wb);// 计算总采样数采样率×时长5秒×44100220500个样本u32 NumSamples HZ * DURATION;// 2. 填充RIFF块并写入文件memcpy(RIFF.ChunkID,RIFF,4); // 写入块标识RIFF.ChunkSize NumSamples*sizeof(u16)36; // 计算块大小memcpy(RIFF.Format,WAVE,4); // 声明为WAVE格式fwrite(RIFF.ChunkID,sizeof(char),4,fp); // 写入4个字符的ChunkIDfwrite(RIFF.ChunkSize,sizeof(u32),1,fp); // 写入4字节的ChunkSizefwrite(RIFF.Format,sizeof(char),4,fp); // 写入4个字符的Format// 3. 填充fmt块并写入文件memcpy(Fmt.ChunkID,fmt ,4);Fmt.ChunkSize 16; // PCM格式下fmt块固定16字节Fmt.Tag 1; // PCM无压缩编码Fmt.Chnnels 1; // 单声道Fmt.SampleRate HZ; // 44100Hz采样率Fmt.ByteRate HZ*sizeof(u16); // 每秒字节数44100×288200Fmt.BloclAlign Fmt.Chnnels * sizeof(u16); // 每个采样2字节Fmt.BitsperSample 16; // 16位位深// 按顺序写入fmt块的所有参数严格遵循格式规范fwrite(Fmt.ChunkID,sizeof(char),4,fp);fwrite(Fmt.ChunkSize,sizeof(u32),1,fp);fwrite(Fmt.Tag,sizeof(u16),1,fp);fwrite(Fmt.Chnnels,sizeof(u16),1,fp);fwrite(Fmt.SampleRate,sizeof(u32),1,fp);fwrite(Fmt.ByteRate,sizeof(u32),1,fp);fwrite(Fmt.BloclAlign,sizeof(u16),1,fp);fwrite(Fmt.BitsperSample,sizeof(u16),1,fp);// 4. 填充data块并写入文件memcpy(Data.DataId,data,4);Data.DataSize NumSamples * sizeof(u16); // 音频数据总字节数fwrite(Data.DataId,sizeof(char),4,fp);fwrite(Data.DataSize,sizeof(u32),1,fp);// 5. 生成音频数据并写入440Hz正弦波标准A调for(int i0;if32 t (f32)i/HZ; // 计算当前时间点秒// 生成440Hz正弦波的数值声音的本质是振动正弦波模拟声波f32 y sinf(t*440.0f*2.0f*3.1415926f);// 转换为16位整数适配16位位深的音频i16 sample (i16)(y*INT16_MAX);// 写入单个音频样本2字节fwrite(sample,sizeof(i16),1,fp);}fclose(fp); // 关闭文件return 0;}所有文件都是“按规则写二进制”的产物写完这段代码你可能会发现生成WAV文件的过程就是“按格式规范往文件里写二进制数据”的过程。而这个逻辑适用于所有计算机文件TXT文档本质是字符的ASCII/UTF-8编码比如字符A对应二进制01000001我们按顺序写入这些编码就成了TXT文件BMP图片由文件头记录宽、高、位深 像素数据每个像素的RGB值组成按BMP格式写这些数据就能生成图片MP4视频哪怕是压缩过的视频也是按MP4的格式规范把编码后的视频帧、音频帧组织成二进制数据EXE可执行文件遵循PE格式把指令、数据、资源按规则写入操作系统就能识别并运行。计算机之所以能“看懂”不同的文件不是因为文件有“魔法”而是因为程序员提前约定了“格式规范”——就像我们约定“RIFF”开头的是WAV文件播放器读到这个标识就按WAV的规则解析后续数据。计算机的本质是“朴素的规则”对刚接触计算机的人来说各种文件、软件、系统看似复杂但拆解到最底层都是“数据规则”的组合只要我们对着格式手册即便使用最朴素的方式也能够成功构建出可以使用的音频文件。计算机的世界没有想象中那般复杂计算机只在乎那最终排好队的 0 和 1。进一步思考从文件到软件了解了各类文件本质我们自然能理解计算机中各个编辑软件的原理是什么了就比如今天举的wav的例子如果我们将示例程序改进一下加入输入那么这是否就成了一个简单的音频编辑软件了呢所有的复杂软件如 Photoshop、Premiere底层逻辑都是如此读取特定规则的二进制 - 在内存中加工处理 - 按规则写回二进制。当你不再把文件看作“黑盒”你便拥有了重塑数字世界的能力。椎彝旱狡

相关文章:

别再踩坑了!SQL Server数据类型那点事儿,看懂这篇少背三个锅厣

从0构建WAV文件:读懂计算机文件的本质 虽然接触计算机有一段时间了,但是我的视野一直局限于一个较小的范围之内,往往只能看到于算法竞赛相关的内容,计算机各种文件在我看来十分复杂,认为构建他们并能达到目的是一件困难…...

像素剧本圣殿详细步骤:基于Qwen2.5-14B-Instruct的剧本张力增强微调方法

像素剧本圣殿详细步骤:基于Qwen2.5-14B-Instruct的剧本张力增强微调方法 1. 项目概述 像素剧本圣殿(Pixel Script Temple)是一款专为剧本创作设计的AI辅助工具,基于Qwen2.5-14B-Instruct大模型深度微调而成。这个工具将先进的自然语言处理技术与复古像…...

MedGemma应用案例:如何用药企医学影像标注辅助系统提升研究效率?

MedGemma应用案例:如何用药企医学影像标注辅助系统提升研究效率? 1. 医学影像标注的行业痛点 在药物研发和医学研究中,医学影像标注是一项基础但极其耗时的工作。传统标注流程面临三大核心挑战: 人工成本高:需要专业…...

cv_resnet50_face-reconstruction效果可视化:热力图分析重建误差分布与关键面部区域精度

cv_resnet50_face-reconstruction效果可视化:热力图分析重建误差分布与关键面部区域精度 你是不是也好奇,一个人脸重建模型到底“重建”得怎么样?它能把你的五官还原得一模一样吗?眼睛、鼻子、嘴巴这些关键部位,哪个重…...

Graphormer在嵌入式边缘计算设备的轻量化部署研究

Graphormer在嵌入式边缘计算设备的轻量化部署研究 1. 边缘计算中的图神经网络应用场景 在医疗诊断、材料研发和药物发现等领域,分子特性分析是一个关键环节。传统方法依赖实验室测试和计算模拟,不仅成本高昂,而且耗时漫长。Graphormer这类图…...

编写程序让智能文具收纳盒检测物品缺失,常用笔不在时提示“寻找放回”。

项目名称:PenPal Guardian (智能文具收纳盒)一、 实际应用场景描述场景设定为一个带有重量感应和RFID识别功能的智能文具收纳盒。在这个场景中,收纳盒被放置在办公桌的固定位置。盒子里预先放置了“必备三件套”:一支签字笔、一支铅笔、一把尺…...

性价比高的佛山市办公家具工程哪家技术强

行业痛点分析当前,佛山市办公家具工程领域面临诸多技术挑战。在设计方面,普通办公桌造型老旧,难以满足现代企业对品牌形象与办公空间美学的需求,数据表明,超60%的企业认为现有办公家具档次不够,无法体现企业…...

Blazor Hybrid跨端失控?揭秘WinUI3/MacCatalyst/iOS 18原生桥接的3种反模式与1套工业级Bridge Protocol设计规范

第一章:Blazor Hybrid跨端失控的本质与2026技术拐点研判Blazor Hybrid 的“跨端失控”并非架构缺陷,而是其运行时契约在多宿主环境(WebView2、Android WebView、iOS WKWebView)中持续弱化的必然结果。当 .NET MAUI 或 Avalonia 作…...

DDD难落地?就让AI干吧! - cleanddd-skills介绍衔

AI训练存储选型的演进路线 第一阶段:单机直连时代 早期的深度学习数据集较小,模型训练通常在单台服务器或单张GPU卡上完成。此时直接将数据存储在训练机器的本地NVMe SSD/HDD上。 其优势在于IO延迟最低,吞吐量极高,也就是“数据离…...

编写程序让智能鱼缸换水提醒,水质指标超标提示“及时换水”。

项目名称:Aquarium Guardian (智能鱼缸管家)一、 实际应用场景描述在一个典型的家庭或办公室观赏鱼缸场景中,鱼友(用户)通常依赖经验或日历提醒来进行换水。然而,鱼缸的水质受多种因素影响:* 生物因素&…...

DeepSpeed 学习指南

DeepSpeed 代码库学习指南 适合希望深入理解 DeepSpeed 内部机制的工程师与研究者。 目录 项目定位与核心价值整体架构分层目录结构详解核心模块深度导览 4.1 入口与初始化4.2 DeepSpeedEngine — 训练引擎4.3 ZeRO — 显存优化系列4.4 混合精度优化器4.5 流水线并行4.6 序列并…...

FlicFlac:开源音频转换工具从原理到实践

FlicFlac:开源音频转换工具从原理到实践 【免费下载链接】FlicFlac Tiny portable audio converter for Windows (WAV FLAC MP3 OGG APE M4A AAC) 项目地址: https://gitcode.com/gh_mirrors/fl/FlicFlac 在数字音频处理领域,格式转换是连接不同…...

【PHP大文件处理避坑红宝书】:基于17个真实生产事故总结的8条黄金铁律

第一章:PHP大文件处理的核心挑战与认知误区在Web应用中处理GB级日志、视频元数据或批量导出报表时,开发者常误将 file_get_contents() 或 $_FILES[upload][tmp_name] 直接用于大文件操作,导致内存耗尽、超时中断或服务不可用。这些实践暴露了…...

“羽绒服面料哪家好?”这 5 家源头工厂值得加入采购清单

在 2026 年的服装消费大环境中,品牌的供应链抗压能力正面临前所未有的考验。随着气候变化与消费趋势的急速迭代,品牌方对于核心材料的需求,已经从单纯的“低价采购”彻底转变为“确定性交付”。对于采购主理人与供应链总监而言,评…...

如何使用HS2-HF_Patch优化Honey Select 2游戏体验:完整指南

如何使用HS2-HF_Patch优化Honey Select 2游戏体验:完整指南 【免费下载链接】HS2-HF_Patch Automatically translate, uncensor and update HoneySelect2! 项目地址: https://gitcode.com/gh_mirrors/hs/HS2-HF_Patch HS2-HF_Patch是一款专为《Honey Select …...

如何提高邮件营销的投资回报率

在与大量客户的长期沟通中,我发现一个非常有趣的现象,即大家对邮件营销的投资回报率出现了两极分化的评价:一部分企业认为邮件营销的效果非常一般,发着发着就不发了;而另一部分企业认为,邮件营销的投资回报…...

LAYONTHEGROUND筛

一、什么是requests? requests 是一个用于发送HTTP请求的 Python 库。 它可以帮助你: 轻松发送GET、POST、PUT、DELETE等请求 处理Cookie、会话等复杂性 自动解压缩内容 处理国际化域名和URL 二、应用场景 requests 广泛应用于以下实际场景: …...

Degrees of Lewdity游戏中文本地化完全指南:从认知到进阶的全流程解决方案

Degrees of Lewdity游戏中文本地化完全指南:从认知到进阶的全流程解决方案 【免费下载链接】Degrees-of-Lewdity-Chinese-Localization Degrees of Lewdity 游戏的授权中文社区本地化版本 项目地址: https://gitcode.com/gh_mirrors/de/Degrees-of-Lewdity-Chines…...

绕开原厂协议:非侵入式梯控改造的OT架构解耦与状态机设计

摘要: 在机器人跨层调度项目中,架构师常面临特种设备管理方“严禁改动原生电路与读取主板总线”的硬性约束。本文深度拆解如何通过引入边缘设备,实现 OT(操作技术)层面的彻底解耦。重点探讨在非侵入式架构下&#xff0…...

2026年揭秘长沙那些被众多人推荐的宝藏酒吧

在长沙这座充满活力与激情的城市,酒吧文化丰富多彩。2026年,有一家宝藏酒吧不容错过——长沙米娅秀场,它以独特的魅力在众多酒吧中脱颖而出。打破传统,解决社交痛点传统酒吧存在诸多社交痛点,如拼桌与社交尴尬、噪音污…...

SMUDebugTool专业级实战指南:Ryzen系统深度调试与优化

SMUDebugTool专业级实战指南:Ryzen系统深度调试与优化 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gi…...

文献综述与波普尔语境的形成:从 “伪神” 到 “补锅匠” 的逻辑坍缩史

文献综述与波普尔语境的形成:从 “伪神” 到 “补锅匠” 的逻辑坍缩史摘要本文系统批判20世纪科学哲学“三座丰碑”——波普尔、库恩、拉卡托斯及费耶阿本德,揭示其理论演进实为从逻辑诈骗到社会学强辩、再到官僚式和稀泥的堕落三部曲。波普尔以“可证伪…...

「EEG脑电信号处理——(20)癫痫发作类型分类:ILAE 2017 标准详解」2026年04月08日

目录 摘要 1. 癫痫发作的基本概念 2. ILAE 2017 发作分类框架 典型病例举例 病例1(局灶性发作) 病例2(全面性发作) 3. 进一步分类的两大关键观察指标 4. 局灶性发作(Focal Onset Seizures) 4.1 按…...

[App逆向]环境搭建下篇 — — 逆向源码+hook实战

[App逆向]环境搭建下篇——逆向源码hook 上篇:[App逆向]环境搭建上篇——抓取apk https包 免责声明:本教程仅供技术学习和安全研究使用,禁止用于任何非法用途。逆向他人 App 前请获得授权。 环境搭建 1. 安装jadx——逆向代码 1.安装jadx …...

世界第一个开源可商用 .NET Office 转 PDF 工具/库 - MiniPdf魄

1. 智能软件工程的范式转移:从库集成到原生框架演进 在生成式人工智能(Generative AI)从单纯的文本生成向具备自主规划与执行能力的“代理化(Agentic)”系统跨越的过程中,.NET 生态系统正在经历一场自该平台…...

终极解决方案:Windows 10 OneDrive 彻底卸载专业指南

终极解决方案:Windows 10 OneDrive 彻底卸载专业指南 【免费下载链接】OneDrive-Uninstaller Batch script to completely uninstall OneDrive in Windows 10 项目地址: https://gitcode.com/gh_mirrors/on/OneDrive-Uninstaller 在Windows 10系统中&#xf…...

[PL2303老芯片兼容性困境]:驱动适配方案实现设备激活(适用于工业控制与嵌入式开发场景)

[PL2303老芯片兼容性困境]:驱动适配方案实现设备激活(适用于工业控制与嵌入式开发场景) 【免费下载链接】pl2303-win10 Windows 10 driver for end-of-life PL-2303 chipsets. 项目地址: https://gitcode.com/gh_mirrors/pl/pl2303-win10 …...

我不是狐狸,我是那Harness Engineering涯

Julia(julialang.org)由Stefan Karpinski、Jeff Bezanson等在2009年创建,目标是融合Python的易用性、C的高性能、R的统计能力、Matlab的科学计算生态。 其核心设计哲学是: 高性能:编译型语言(JIT&#xff0…...

跨设备进度同步:多设备追番中断的智能解决方案——Kazumi无缝续播体验

跨设备进度同步:多设备追番中断的智能解决方案——Kazumi无缝续播体验 【免费下载链接】Kazumi 基于自定义规则的番剧采集APP,支持流媒体在线观看,支持弹幕,支持实时超分辨率。 项目地址: https://gitcode.com/gh_mirrors/ka/Ka…...

为什么92%的PHP团队异步化失败?——高并发场景下I/O等待、内存泄漏与协程调度三大暗礁全曝光

第一章:PHP异步I/O的底层本质与失败全景图PHP 传统同步阻塞模型在 I/O 密集型场景中天然受限——每次 socket read/write、数据库查询或 HTTP 请求都会让整个进程挂起,直至内核返回结果。其底层本质并非缺乏异步能力,而是运行时(Z…...