当前位置: 首页 > article >正文

Spring IOC 源码学习 事务相关的 BeanDefinition 解析过程 (XML)感

从0构建WAV文件读懂计算机文件的本质虽然接触计算机有一段时间了但是我的视野一直局限于一个较小的范围之内往往只能看到于算法竞赛相关的内容计算机各种文件在我看来十分复杂认为构建他们并能达到目的是一件困难的事情然而近期我观看了油管上Magicalbat大神的视频发现其实它们的本质都惊人地简单所有计算机文件都是按特定规则组织的二进制数据是人为规定好格式再由计算机解析对于我们来说只要根据规定格式进行编辑就能够成功构建。今天我们就从最朴素的方式入手通过手动构建一个WAV音频文件拆解WAV格式的底层逻辑同时理解一个核心认知只要掌握了文件的格式规范任何类型的文件都能像搭积木一样一行行代码“拼”出来。先认识WAVWAV文件的格式WAV是微软开发的无损音频格式相比于压缩后的MP3它的结构更直白没有复杂的编码压缩因此我们能够通过C文件写入的方式直接完成wav文件的构建wav文件的核心由三个关键的“数据块(Chunk)”组成RIFF块文件的“身份卡”告诉计算机“我是一个WAV文件”fmt块音频的“参数说明”记录采样率、声道数、位深等核心参数data块真正的音频数据存储着声音的数字信号。而每个块的内容又如下图所示RIFF:字段名 字节数 数据类型 固定值/计算规则ChunkID 4 ASCII字符 固定为RIFF无终止符严格4字节ChunkSize 4 32位无符号整数 取值 整个WAV文件大小 - 8字节减去ChunkID和ChunkSize自身的8字节Format 4 ASCII字符 固定为WAVE无终止符严格4字节fmt:字段名 字节数 数据类型 固定值/计算规则ChunkID 4 ASCII字符 固定为fmt 末尾空格无终止符ChunkSize 4 32位无符号整数 PCM编码最常用下固定为16代表后续字段的总字节数不含ChunkID和ChunkSizeAudioFormat代码中Tag 2 16位无符号整数 编码格式1PCM无压缩通用3IEEE浮点6μ律7A律等NumChannels代码中Chnnels拼写笔误 2 16位无符号整数 声道数1单声道2立体声2多声道SampleRate 4 32位无符号整数 采样率每秒采样次数常见44100HzCD音质、48000Hz、22050Hz等ByteRate 4 32位无符号整数 每秒音频数据字节数 SampleRate × NumChannels × BitsPerSample / 8BlockAlign代码中BloclAlign拼写笔误 2 16位无符号整数 每个“采样帧”的字节数 NumChannels × BitsPerSample / 8播放器一次读取的最小单位BitsPerSample代码中BitsperSample 2 16位无符号整数 采样位深每个采样点的比特数8/16/24/3216位最常用data:字段名 字节数 数据类型 固定值/计算规则ChunkID代码中DataId 4 ASCII字符 固定为data无终止符严格4字节DataSize 4 32位无符号整数 音频数据总字节数 采样总数 × BlockAlign采样总数 SampleRate × 音频时长音频数据区 可变 二进制流 PCM编码下为线性整数/浮点数16位位深对应int16_t8位对应uint8_t32位浮点对应float我们接下来的代码就是严格按照这个模板把每个部分的二进制数据“写”进文件里。从零构建WAV一行代码拆解核心逻辑下面是完整的C代码新手也能看懂我们逐段拆解看如何从0生成一个能播放的440Hz正弦波WAV文件#includeusing namespace std;// 类型别名让代码更易读明确数据的字节长度#define u32 uint32_t // 32位无符号整数4字节#define u16 uint16_t // 16位无符号整数2字节#define f32 float // 32位浮点数4字节#define i16 int16_t // 16位有符号整数2字节#define HZ 44100 // 采样率每秒采集44100个声音样本标准音频采样率#define DURATION 5 // 音频时长5秒// 1. 定义WAV的三个核心数据块结构对应格式规范// RIFF块文件整体标识struct chunk1{char ChunkID[4]; // 块标识固定为RIFFu32 ChunkSize; // 从该字段到文件末尾的字节数总字节数-8char Format[4]; // 格式类型固定为WAVE}RIFF;// fmt块音频参数配置struct chunk2{char ChunkID[4]; // 块标识固定为fmt 注意末尾有空格u16 Tag; // 编码格式1代表PCM无压缩u32 ChunkSize; // fmt块的大小PCM格式固定为16u16 Chnnels; // 声道数1单声道2立体声u32 SampleRate; // 采样率u32 ByteRate; // 每秒数据量 采样率×声道数×位深/8u16 BloclAlign; // 每个采样的总字节数 声道数×位深/8u16 BitsperSample; // 每个采样的位深16位常见}Fmt;// data块音频数据存储区struct chunk3{char DataId[4]; // 块标识固定为datau32 DataSize; // 音频数据的总字节数}Data;signed main(int argc,char* argv[]){// 打开文件wb表示以二进制模式写入关键文件本质是二进制FILE *fp fopen(test.wav,wb);// 计算总采样数采样率×时长5秒×44100220500个样本u32 NumSamples HZ * DURATION;// 2. 填充RIFF块并写入文件memcpy(RIFF.ChunkID,RIFF,4); // 写入块标识RIFF.ChunkSize NumSamples*sizeof(u16)36; // 计算块大小memcpy(RIFF.Format,WAVE,4); // 声明为WAVE格式fwrite(RIFF.ChunkID,sizeof(char),4,fp); // 写入4个字符的ChunkIDfwrite(RIFF.ChunkSize,sizeof(u32),1,fp); // 写入4字节的ChunkSizefwrite(RIFF.Format,sizeof(char),4,fp); // 写入4个字符的Format// 3. 填充fmt块并写入文件memcpy(Fmt.ChunkID,fmt ,4);Fmt.ChunkSize 16; // PCM格式下fmt块固定16字节Fmt.Tag 1; // PCM无压缩编码Fmt.Chnnels 1; // 单声道Fmt.SampleRate HZ; // 44100Hz采样率Fmt.ByteRate HZ*sizeof(u16); // 每秒字节数44100×288200Fmt.BloclAlign Fmt.Chnnels * sizeof(u16); // 每个采样2字节Fmt.BitsperSample 16; // 16位位深// 按顺序写入fmt块的所有参数严格遵循格式规范fwrite(Fmt.ChunkID,sizeof(char),4,fp);fwrite(Fmt.ChunkSize,sizeof(u32),1,fp);fwrite(Fmt.Tag,sizeof(u16),1,fp);fwrite(Fmt.Chnnels,sizeof(u16),1,fp);fwrite(Fmt.SampleRate,sizeof(u32),1,fp);fwrite(Fmt.ByteRate,sizeof(u32),1,fp);fwrite(Fmt.BloclAlign,sizeof(u16),1,fp);fwrite(Fmt.BitsperSample,sizeof(u16),1,fp);// 4. 填充data块并写入文件memcpy(Data.DataId,data,4);Data.DataSize NumSamples * sizeof(u16); // 音频数据总字节数fwrite(Data.DataId,sizeof(char),4,fp);fwrite(Data.DataSize,sizeof(u32),1,fp);// 5. 生成音频数据并写入440Hz正弦波标准A调for(int i0;if32 t (f32)i/HZ; // 计算当前时间点秒// 生成440Hz正弦波的数值声音的本质是振动正弦波模拟声波f32 y sinf(t*440.0f*2.0f*3.1415926f);// 转换为16位整数适配16位位深的音频i16 sample (i16)(y*INT16_MAX);// 写入单个音频样本2字节fwrite(sample,sizeof(i16),1,fp);}fclose(fp); // 关闭文件return 0;}所有文件都是“按规则写二进制”的产物写完这段代码你可能会发现生成WAV文件的过程就是“按格式规范往文件里写二进制数据”的过程。而这个逻辑适用于所有计算机文件TXT文档本质是字符的ASCII/UTF-8编码比如字符A对应二进制01000001我们按顺序写入这些编码就成了TXT文件BMP图片由文件头记录宽、高、位深 像素数据每个像素的RGB值组成按BMP格式写这些数据就能生成图片MP4视频哪怕是压缩过的视频也是按MP4的格式规范把编码后的视频帧、音频帧组织成二进制数据EXE可执行文件遵循PE格式把指令、数据、资源按规则写入操作系统就能识别并运行。计算机之所以能“看懂”不同的文件不是因为文件有“魔法”而是因为程序员提前约定了“格式规范”——就像我们约定“RIFF”开头的是WAV文件播放器读到这个标识就按WAV的规则解析后续数据。计算机的本质是“朴素的规则”对刚接触计算机的人来说各种文件、软件、系统看似复杂但拆解到最底层都是“数据规则”的组合只要我们对着格式手册即便使用最朴素的方式也能够成功构建出可以使用的音频文件。计算机的世界没有想象中那般复杂计算机只在乎那最终排好队的 0 和 1。进一步思考从文件到软件了解了各类文件本质我们自然能理解计算机中各个编辑软件的原理是什么了就比如今天举的wav的例子如果我们将示例程序改进一下加入输入那么这是否就成了一个简单的音频编辑软件了呢所有的复杂软件如 Photoshop、Premiere底层逻辑都是如此读取特定规则的二进制 - 在内存中加工处理 - 按规则写回二进制。当你不再把文件看作“黑盒”你便拥有了重塑数字世界的能力。醒饺文卑

相关文章:

Spring IOC 源码学习 事务相关的 BeanDefinition 解析过程 (XML)感

从0构建WAV文件:读懂计算机文件的本质 虽然接触计算机有一段时间了,但是我的视野一直局限于一个较小的范围之内,往往只能看到于算法竞赛相关的内容,计算机各种文件在我看来十分复杂,认为构建他们并能达到目的是一件困难…...

这是我的第一篇文章

以后将会发布一些有关我Java的学习过程...

从零开始掌握时序逻辑电路:状态机设计与FPGA实战解析

1. 时序逻辑电路基础入门 第一次接触时序逻辑电路时,我盯着教科书上的波形图发呆了半小时。直到在实验室用FPGA开发板亲眼看到LED灯随着时钟信号有规律地闪烁,才真正理解这个抽象概念。时序逻辑电路和组合逻辑电路最大的区别,就像音乐会现场和…...

手把手教你用GPT-oss:20b:CSDN平台图文教程,小白也能快速部署

手把手教你用GPT-oss:20b:CSDN平台图文教程,小白也能快速部署 想体验接近GPT-4级别的智能对话,但又担心数据隐私、网络延迟或持续付费?今天,我将带你通过CSDN平台,在几分钟内免费部署一个完全开源、本地运…...

Harness Engineering(驾驭工程)-2026年最强的智能体-周红伟

AI 模型已经能写出 100 万行代码。真正的挑战不再是让它写得更好,而是怎么驾驭它稳定、可靠、不失控地工作。这套围绕 AI 智能体构建约束、反馈与控制系统的方法论,就是 2026 年初迅速席卷工程圈的新范式——Harness Engineering(驾驭工程&am…...

提示词工程(Prompt Engineering)-周红伟

你有没有遇到过这种情况:明明给了 AI 一个问题,得到的回答却空泛、跑题、毫无用处? 这不是 AI 的问题,往往是提问方式的问题。 提示词工程(Prompt Engineering)就是一门关于如何构造和精炼你的提示词的艺术…...

Rustup进阶指南:5个高效管理Rust工具链的实战技巧

Rustup进阶指南:5个高效管理Rust工具链的实战技巧 【免费下载链接】rustup The Rust toolchain installer 项目地址: https://gitcode.com/gh_mirrors/ru/rustup Rustup作为Rust官方工具链安装器,让开发者能够轻松管理多个Rust版本、切换发布渠道…...

AIMP(音乐播放软件)

AIMP是一款免费的音频播放器,支持多种音频格式,包括MP3、OGG、FLAC、WAV、AAC等。它具有简洁的界面和强大的功能,是一款非常受欢迎的音频播放器。 软件功能 1. 支持多种音频格式,包括MP3、OGG、FLAC、WAV、AAC等。 2. 支持自动歌…...

200+技术改进实现环世界400%帧率提升的架构解析

200技术改进实现环世界400%帧率提升的架构解析 【免费下载链接】Performance-Fish Performance Mod for RimWorld 项目地址: https://gitcode.com/gh_mirrors/pe/Performance-Fish 随着殖民地规模扩大,《环世界》玩家常面临严重的性能瓶颈问题。游戏在后期处…...

Notepad--完全指南:掌握跨平台国产文本编辑器的3个实用技巧

Notepad--完全指南:掌握跨平台国产文本编辑器的3个实用技巧 【免费下载链接】notepad-- 一个支持windows/linux/mac的文本编辑器,目标是做中国人自己的编辑器,来自中国。 项目地址: https://gitcode.com/GitHub_Trending/no/notepad-- …...

大卫小东(Sheldon)唾

Issue 概述 先来看看提交这个 Issue 的作者是为什么想到这个点子的,以及他初步的核心设计概念。?? 本 PR 实现了 Apache Gravitino 与 SeaTunnel 的集成,将其作为非关系型连接器的外部元数据服务。通过 Gravitino 的 REST API 自动获取表结构和元数据&…...

防静电门禁(ESD 闸机)系统深度技术方案:原理、硬件、接线、调试、故障排查

本文从硬件原理、电气接口、通信协议、联动逻辑、调试步骤、故障树六个维度,完整拆解防静电门禁闸机系统(ESD) 的技术实现与工程落地,内容适用于:电子 / 半导体车间 EHS、设备、IE 工程师智能化工程、安防系统 集成商 …...

Apache Solr 详解:企业级搜索平台的核心特性与架构

Apache Solr 详解:企业级搜索平台的核心特性与架构 文章目录 Apache Solr 详解:企业级搜索平台的核心特性与架构1. 核心功能2. 核心概念与架构2.1 关键术语2.2 工作流程 3. Solr vs. Elasticsearch4. 典型应用场景5. 快速入门与资源5.1 安装准备5.2 启动…...

GetQzonehistory:让QQ空间记忆不再“云端漂浮”,你的青春值得永久保存

GetQzonehistory:让QQ空间记忆不再“云端漂浮”,你的青春值得永久保存 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 还记得那些深夜发的说说、毕业时的感慨、旅…...

CentOS 7.9源码编译glibc 2.28:从“cannot find -lnss_test2”报错到成功部署的实战复盘

1. 问题背景与复现 最近在CentOS 7.9系统上源码编译glibc 2.28时,遇到了一个让人头疼的报错:/usr/bin/ld: cannot find -lnss_test2。这个错误发生在编译的最后阶段,直接导致安装失败。作为一个长期和Linux系统打交道的老手,我决定…...

零基础转行大模型选哪个岗位方向最易上手?常见问题全解析

零基础转行大模型选哪个岗位方向最易上手?常见问题全解析 标签:#人工智能、#深度学习、#自然语言处理、#神经网络、#机器学习、#计算机视觉、#ai ### 先打破一个误区:大模型≠只有算法岗,普通人也能进### 大模型岗位:哪…...

AIAgent响应延迟超800ms?SITS2026案例实测:4步将LCEL流水线性能提升6.8倍(附压测对比数据)

第一章:SITS2026案例:AIAgent个人助理开发 2026奇点智能技术大会(https://ml-summit.org) SITS2026(Smart Intelligence Technology Showcase 2026)是面向下一代AI原生应用的标杆性实践平台,其中“AIAgent个人助理”…...

非计算机专业转AI Agent:补哪些基础最有效

【本段核心】现在很多大学生都有转AI的想法,但每天做的却是收藏一堆教程、刷一堆概念、看一堆“LLM 从入门到精通”,然后继续焦虑、继续拖沓、继续投简历没回音。我就是双非野鸡二本经济学转Agent的,成效把 Agent 这条路跑通之后,…...

FirPE 维护系统 v2.1.0

FirPE 是一款系统预安装环境(Windows PE),它具有简约、易操作等特点,使用起来十分人性化。以U盘作为使用载体,空间更为充分,携带更为方便。同时整合各种装机必备工具,有效提高系统安装效率。Fir…...

FreeRTOS队列实战:uxQueueMessagesWaiting在UART中断中的那些坑

FreeRTOS队列深度解析:UART中断中的uxQueueMessagesWaiting陷阱与实战对策 在嵌入式开发中,UART通信与FreeRTOS队列的结合使用堪称经典组合,但正是这种看似简单的组合,却暗藏诸多玄机。我曾在一个工业传感器采集项目中&#xff0c…...

3步解锁B站专业直播:告别直播姬限制的终极方案

3步解锁B站专业直播:告别直播姬限制的终极方案 【免费下载链接】bilibili_live_stream_code 用于在准备直播时获取第三方推流码,以便可以绕开哔哩哔哩直播姬,直接在如OBS等软件中进行直播,软件同时提供定义直播分区和标题功能 项…...

Nebula Console深度解析:高效管理图数据库的核心技巧与实战指南

Nebula Console深度解析:高效管理图数据库的核心技巧与实战指南 【免费下载链接】nebula-console Command line interface for the Nebula Graph service 项目地址: https://gitcode.com/gh_mirrors/ne/nebula-console Nebula Console作为NebulaGraph图数据库…...

基于VScode的安装——MinGW的介绍和安装

1、MinGW介绍 MinGW开源免费,是Windows上的GNU编译工具链,核心是把GCC编译器移植到Windows。主要作用是在Windows上用GCC编译C/C等编程语言,直接生成原生Windows .exe可执行文件,只依赖Windows自带的MSVCRT系统库,不依…...

3步实现Chrome浏览器与KeePass密码库无缝同步

3步实现Chrome浏览器与KeePass密码库无缝同步 【免费下载链接】ChromeKeePass Chrome extensions for automatically filling credentials from KeePass/KeeWeb 项目地址: https://gitcode.com/gh_mirrors/ch/ChromeKeePass 你是否厌倦了每次登录网站都要手动输入密码&a…...

B站资源下载终极指南:跨平台BiliTools使用全攻略

B站资源下载终极指南:跨平台BiliTools使用全攻略 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools 还在为…...

KP09 Encoder使用教程

注意:请不要同时将两个typec口接入数据线。 2026.3.22更新 汉化版VIAL改键软件,链接:VIAL汉化版——VIAL-JL – yoonas blog 2026.3.23更新 组合键设置 默认功能 1、默认键位 键盘有九个按键,两个旋钮,旋钮可以按下。上…...

CentOS 7 下DNF安装与常见报错解决方案

1. 为什么要在CentOS 7上安装DNF? 很多刚接触CentOS 7的开发者可能会疑惑:系统自带的yum包管理器用得好好的,为什么还要折腾DNF?这个问题我也曾经纠结过。经过实际使用对比,我发现DNF确实有不少优势。 首先&#xff0c…...

从 219 秒到 1.3 秒!CausVid:首个媲美双向扩散的流式视频生成模型深度解析

前言 你是否有过这样的经历:输入一段文本生成视频,盯着屏幕等了 3 分多钟才看到结果?这就是传统双向视频扩散模型的致命痛点 —— 生成 128 帧视频需要 219 秒,且必须等全部内容生成完毕才能观看,更别提中途修改提示词…...

Jvppeteer终极指南:Java开发者如何快速掌握浏览器自动化

Jvppeteer终极指南:Java开发者如何快速掌握浏览器自动化 【免费下载链接】jvppeteer Java API For Chrome and Firefox 项目地址: https://gitcode.com/gh_mirrors/jv/jvppeteer 你是否曾为Java项目中的网页自动化测试、数据抓取或性能分析而烦恼&#xff1f…...

AD9833 vs 传统晶振:在超声波发生器设计中,我们该如何选择?

AD9833与晶振的终极对决:超声波发生器设计中的芯片选型策略 当你在设计一款便携式超声波清洗仪或工业测厚设备时,信号源的选择往往决定了整个项目的成败。面对市场上琳琅满目的解决方案,工程师们常常陷入两难:是选择传统晶振的稳定…...