当前位置: 首页 > article >正文

告别Foremost和DD:用Python脚本一键自动化提取CTF中的‘图种’和隐藏文件

用Python打造CTF隐写分析利器自动化提取图种与隐藏文件在CTF竞赛中压缩包隐写和文件拼接是常见的挑战类型。许多选手习惯使用foremost或dd这类工具进行文件分离但这些工具往往需要手动操作在处理批量文件或复杂嵌套结构时效率低下。本文将带你用Python构建一个自动化分析工具不仅能识别JPGZIP/RAR的图种结构还能智能处理伪加密等高级技巧。1. 理解文件拼接与隐写原理JPG文件以FF D8开头FF D9结束。图片查看器会忽略FF D9之后的内容这为隐藏数据创造了条件。常见的图种就是在JPG文件后追加ZIP/RAR压缩包[ JPG数据 | FF D9 | ZIP/RAR数据 ]传统方法使用foremost扫描整个文件或手动用dd切割文件。我们的Python脚本将实现更智能的检测def find_jpeg_end(data): 定位JPG结束标记FF D9 jpeg_end data.find(b\xFF\xD9) if jpeg_end -1: return None return jpeg_end 2 # 包含FF D9两个字节2. 构建自动化检测框架完整的检测流程应包括文件类型识别、隐藏数据定位和内容提取三个阶段。我们可以使用Python的magic库进行更精确的文件类型判断import magic def detect_file_type(data): mime magic.from_buffer(data, mimeTrue) if jpeg in mime: return JPEG elif zip in mime: return ZIP elif rar in mime: return RAR return UNKNOWN对于复合文件我们需要分段检测def analyze_composite_file(file_path): with open(file_path, rb) as f: data f.read() jpeg_end find_jpeg_end(data) if jpeg_end and len(data) jpeg_end: front_part data[:jpeg_end] hidden_part data[jpeg_end:] print(f前部文件类型: {detect_file_type(front_part)}) print(f隐藏部分类型: {detect_file_type(hidden_part)}) return hidden_part return None3. 处理伪加密的高级技巧ZIP伪加密是通过修改文件头中的加密标志位实现的。我们可以编写专门的检测函数def check_fake_encryption(zip_data): # 查找中央目录记录 central_dir_start zip_data.rfind(b\x50\x4B\x01\x02) if central_dir_start -1: return False # 检查全局加密标记 (偏移量6字节处) global_flags zip_data[central_dir_start6:central_dir_start8] is_encrypted (global_flags[1] 1) 1 # 检查局部文件头加密标记 local_header_start zip_data.find(b\x50\x4B\x03\x04) if local_header_start ! -1: local_flags zip_data[local_header_start6:local_header_start8] local_encrypted (local_flags[1] 1) 1 return is_encrypted and not local_encrypted return False4. 完整自动化工具实现结合上述技术我们可以构建一个完整的自动化处理工具import os import zipfile import rarfile from io import BytesIO class CTFStegAnalyzer: def __init__(self): self.temp_dir extracted_files os.makedirs(self.temp_dir, exist_okTrue) def extract_hidden_data(self, file_path): hidden_data self._find_hidden_part(file_path) if not hidden_data: return False if hidden_data.startswith(bPK): return self._handle_zip(hidden_data) elif hidden_data.startswith(bRar!): return self._handle_rar(hidden_data) return False def _find_hidden_part(self, file_path): with open(file_path, rb) as f: data f.read() jpeg_end data.find(b\xFF\xD9) if jpeg_end ! -1 and len(data) jpeg_end 2: return data[jpeg_end2:] return data if data.startswith((bPK, bRar!)) else None def _handle_zip(self, data): try: with zipfile.ZipFile(BytesIO(data)) as zip_ref: if check_fake_encryption(data): print([!] 检测到ZIP伪加密尝试绕过...) # 伪加密绕过逻辑 modified_data self._fix_fake_encryption(data) return self._handle_zip(modified_data) zip_ref.extractall(self.temp_dir) return True except Exception as e: print(fZIP提取失败: {e}) return False def _handle_rar(self, data): try: with rarfile.RarFile(BytesIO(data)) as rar_ref: rar_ref.extractall(self.temp_dir) return True except Exception as e: print(fRAR提取失败: {e}) return False def _fix_fake_encryption(self, data): # 实现伪加密修复逻辑 # 这里需要实际修改字节数据 return data5. 实战应用与性能优化在实际CTF比赛中我们还需要考虑以下增强功能批量处理模式def batch_process(directory): analyzer CTFStegAnalyzer() for root, _, files in os.walk(directory): for file in files: file_path os.path.join(root, file) print(f\n处理文件: {file_path}) if analyzer.extract_hidden_data(file_path): print(f成功提取隐藏内容到 {analyzer.temp_dir})嵌套提取检测def recursive_extract(file_path, depth3): if depth 0: return analyzer CTFStegAnalyzer() if analyzer.extract_hidden_data(file_path): for extracted_file in os.listdir(analyzer.temp_dir): new_path os.path.join(analyzer.temp_dir, extracted_file) recursive_extract(new_path, depth-1)性能对比表方法处理速度准确性易用性批量处理Foremost中等高中等支持DD命令快依赖参数低需脚本Python脚本可调节可定制高原生支持6. 异常处理与边界情况健壮的工具需要处理各种异常情况def safe_extract(file_path): try: with open(file_path, rb) as f: header f.read(4) if header.startswith(b\xFF\xD8): # JPG处理逻辑 pass elif header.startswith(bPK): # ZIP处理逻辑 pass elif header.startswith(bRar!): # RAR处理逻辑 pass else: print(未知文件格式) except PermissionError: print(权限不足无法读取文件) except FileNotFoundError: print(文件不存在) except Exception as e: print(f未知错误: {str(e)})在处理实际CTF题目时我发现最常遇到的三个问题是1) 文件头被部分破坏2) 嵌套层级过深3) 非常规的伪加密变种。针对这些问题我们的脚本需要保持足够的灵活性。

相关文章:

告别Foremost和DD:用Python脚本一键自动化提取CTF中的‘图种’和隐藏文件

用Python打造CTF隐写分析利器:自动化提取图种与隐藏文件 在CTF竞赛中,压缩包隐写和文件拼接是常见的挑战类型。许多选手习惯使用foremost或dd这类工具进行文件分离,但这些工具往往需要手动操作,在处理批量文件或复杂嵌套结构时效率…...

从‘老王分遗产’到智能指针:用生活例子彻底搞懂C++的dynamic_cast和std::dynamic_pointer_cast

从‘老王分遗产’到智能指针:用生活例子彻底搞懂C的dynamic_cast和std::dynamic_pointer_cast 想象一下,你正在处理一个复杂的家族遗产分配问题。老王有一对儿女——小明和小红,他们各自有不同的财产继承方式。在C的世界里,这种家…...

深入Canvas渲染管线:从Rebuild、Rebatch到动静分离,一次讲清Unity UI合批原理

深入Canvas渲染管线:从Rebuild、Rebatch到动静分离,一次讲清Unity UI合批原理 在Unity UI开发中,性能优化是一个永恒的话题。当我们面对复杂的UI界面时,经常会遇到卡顿、掉帧等问题,而这些问题往往与Canvas的渲染机制密…...

OpenClaw与系统环境冲突:Windows/Mac系统兼容问题解决指南

OpenClaw 与系统环境冲突:Windows/Mac 系统兼容问题解决指南引言在当今多平台协作的时代,软件能否在不同操作系统上顺畅运行变得至关重要。OpenClaw,作为一款功能强大的专业工具(例如:数据处理、设计、开发环境等&…...

Dragablz性能优化实战:提升大型WPF应用的响应速度

Dragablz性能优化实战:提升大型WPF应用的响应速度 【免费下载链接】Dragablz Dragable and tearable tab control for WPF 项目地址: https://gitcode.com/gh_mirrors/dr/Dragablz Dragablz作为WPF平台上一款强大的可拖拽标签控件,为开发者提供了…...

实战指南:如何用开源统计软件JASP提升数据分析效率

实战指南:如何用开源统计软件JASP提升数据分析效率 【免费下载链接】jasp-desktop JASP aims to be a complete statistical package for both Bayesian and Frequentist statistical methods, that is easy to use and familiar to users of SPSS 项目地址: http…...

OMNeT++ 6.0.1 踩坑记:手把手教你搞定INET 4.5.0与TSN仿真环境搭建

OMNeT 6.0.1 踩坑记:手把手教你搞定INET 4.5.0与TSN仿真环境搭建 第一次打开OMNeT 6.0.1的IDE时,那种既兴奋又忐忑的心情至今记忆犹新。作为一款开源的离散事件网络仿真工具,OMNeT在学术界和工业界都有着广泛的应用,特别是在时间…...

LxgwNeoXiHei特殊符号支持:易经、麻将、象棋符号全解析

LxgwNeoXiHei特殊符号支持:易经、麻将、象棋符号全解析 【免费下载链接】LxgwNeoXiHei A Chinese sans-serif font derived from IPAex Gothic. 一款衍生于「IPAexゴシック」的中文黑体字型。 项目地址: https://gitcode.com/gh_mirrors/lx/LxgwNeoXiHei Lxg…...

Linux驱动入门-设备树DTS

**设备树**(**DTS**:device tree source),字面意思就是一块电路板上设备如上图中CPU、DDR、I2C、GPIO、SPI等,**按照树形结构描绘成的一棵树**。按照**策略**和**功能**分离的思路,就是驱动代码(功能&#…...

Loom协程的“幽灵权限”有多危险?——基于Banking系统压测发现的3类零日上下文泄露漏洞(附ASM字节码级防护补丁)

第一章:Loom协程安全转型的底层认知与风险全景Java Loom 项目引入的虚拟线程(Virtual Threads)并非语法糖,而是JVM运行时层面的结构性演进。其核心在于将调度权从操作系统线程移交至用户态调度器,从而解耦“并发逻辑单…...

MedGemma-X临床提示词工程:提升病灶检出率的10类高质量提问模板

MedGemma-X临床提示词工程:提升病灶检出率的10类高质量提问模板 1. 引言:为什么提示词工程如此重要 MedGemma-X作为新一代智能影像诊断助手,其核心能力在于理解医生的自然语言提问并给出精准回应。但就像与人类专家交流一样,问问…...

企业级Blazor微前端落地失败率高达63%!你缺的不是文档,而是这4个被微软内部禁用的“伪最佳实践”

第一章:企业级Blazor微前端落地失败率高达63%的真相企业级Blazor微前端项目在生产环境中的实际落地成功率远低于预期——据2023年《.NET Enterprise Architecture Survey》对147家采用Blazor构建微前端架构的企业回溯分析,63%的项目在6个月内因架构不可持…...

intv_ai_mk11惊艳案例:用‘分点说明’指令生成直播复盘报告,覆盖数据/话术/节奏

intv_ai_mk11惊艳案例:用分点说明指令生成直播复盘报告,覆盖数据/话术/节奏 1. 直播复盘报告生成效果展示 直播结束后,运营团队最头疼的就是整理复盘报告。传统方式需要人工回看录像、统计数据、分析话术,耗时耗力。而使用intv_…...

设计系统已死?AI时代的两种终极范式对决:Awesome DESIGN.md vs UI UX Pro Max

2026年4月,GitHub Trending榜单上一个名为"Awesome DESIGN.md"的项目以惊人的速度攀升,10天斩获4万星,20天突破10万星,创下了前端领域有史以来最快的增长记录。与此同时,一个名为"UI UX Pro Max"的…...

微信读书笔记如何优雅地融入Obsidian知识库?

微信读书笔记如何优雅地融入Obsidian知识库? 【免费下载链接】obsidian-weread-plugin Obsidian Weread Plugin is a plugin to sync Weread(微信读书) hightlights and annotations into your Obsidian Vault. 项目地址: https://gitcode.com/gh_mirrors/ob/obsi…...

Python Bilibili API完整指南:从零开始构建B站数据应用

Python Bilibili API完整指南:从零开始构建B站数据应用 【免费下载链接】bilibili-api 哔哩哔哩常用API调用。支持视频、番剧、用户、频道、音频等功能。原仓库地址:https://github.com/MoyuScript/bilibili-api 项目地址: https://gitcode.com/gh_mir…...

Pixel Epic智识终端多场景落地:金融/咨询/高校研报自动化实践

Pixel Epic智识终端多场景落地:金融/咨询/高校研报自动化实践 1. 引言:当研究报告遇上像素冒险 在金融分析、咨询服务和学术研究领域,撰写高质量研究报告一直是一项耗时费力的工作。传统的研究工具往往界面单调、操作复杂,让本应…...

10分钟掌握传统中文手写数据集:构建智能识别系统的终极指南

10分钟掌握传统中文手写数据集:构建智能识别系统的终极指南 【免费下载链接】Traditional-Chinese-Handwriting-Dataset Open source traditional chinese handwriting dataset. 项目地址: https://gitcode.com/gh_mirrors/tr/Traditional-Chinese-Handwriting-Da…...

告别iTunes!在Ubuntu 22.04上通过libimobiledevice直接管理iPhone照片和文件

告别iTunes!在Ubuntu 22.04上通过libimobiledevice直接管理iPhone照片和文件 当你在Ubuntu桌面上插入iPhone数据线时,是否经历过这样的尴尬时刻——系统弹窗提示"无法识别的设备",而你的照片和文档就像被锁在玻璃展柜里&#xff0c…...

免费跨平台游戏打包神器:轻松将HTML游戏转换为专业桌面应用

免费跨平台游戏打包神器:轻松将HTML游戏转换为专业桌面应用 【免费下载链接】twine-app-builder Automatically generate Windows and macOS versions of your Twine games, for free! 项目地址: https://gitcode.com/gh_mirrors/tw/twine-app-builder 还在为…...

从CRNN到BERT:图解BiLSTM如何成为NLP经典模块的‘骨架’

从CRNN到BERT:BiLSTM如何塑造NLP的十年技术演进 在自然语言处理领域,某些技术模块如同生物进化中的关键器官,它们跨越不同模型架构,成为解决特定问题的通用方案。BiLSTM(双向长短期记忆网络)正是这样一个&q…...

告别手动擦除!用Mimics.19的Pulmonary模块5分钟搞定肺支气管三维建模

5分钟解锁肺部三维建模:Mimics.19 Pulmonary模块实战指南 看着屏幕上密密麻麻的肺部CT切片,刚入行的医学影像工程师小林叹了口气——手动标注气管结构的工作量简直令人绝望。每张切片上都需要用鼠标小心翼翼擦除外层组织,稍有不慎就会破坏纤细…...

QuPath选区模式革命:Shift键反选功能如何重塑病理图像标注工作流

QuPath选区模式革命:Shift键反选功能如何重塑病理图像标注工作流 【免费下载链接】qupath QuPath - Open-source bioimage analysis for research 项目地址: https://gitcode.com/gh_mirrors/qu/qupath 在病理图像分析领域,高效精确的细胞核标注是…...

Windows Cleaner:拯救C盘空间的桌面医生

Windows Cleaner:拯救C盘空间的桌面医生 【免费下载链接】WindowsCleaner Windows Cleaner——专治C盘爆红及各种不服! 项目地址: https://gitcode.com/gh_mirrors/wi/WindowsCleaner 不知道你有没有过这样的经历:打开电脑准备开始一天…...

技术债务灾难:行业集体埋雷

冰山之下,测试之困在追求敏捷与快速交付的软件开发现代洪流中,“技术债务”已从一个晦涩的工程隐喻,演变为悬在无数项目头顶的达摩克利斯之剑。对于身处质量保障一线的软件测试从业者而言,技术债务远非开发团队的内部烦恼&#xf…...

LinkSwift:八大网盘直链下载终极解决方案

LinkSwift:八大网盘直链下载终极解决方案 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘 / 迅雷云…...

Effective harnesses for long-running agents翻译

⚠️ 在开始阅读之前,如果你对 实时 Agent / 数字人 / 多模态系统 / LiveKit 架构 感兴趣, 欢迎先到 GitHub 给项目点一个 ⭐ Star,这是对开源作者最大的支持。🚀 AlphaAvatar 项目地址(强烈建议先收藏,该项…...

OpenClaw人人养虾:音频与语音

Audio Node(音频节点)为 Agent 提供语音输入和输出能力,包括语音转文字 STT(Speech-to-Text)和文字转语音 TTS(Text-to-Speech)。启动音频节点openclaw node --type audio首次启动系统会要求授予…...

如何在5分钟内掌握PPTist:免费开源在线PPT制作工具的终极指南

如何在5分钟内掌握PPTist:免费开源在线PPT制作工具的终极指南 【免费下载链接】PPTist PowerPoint-ist(/pauəpɔintist/), An online presentation application that replicates most of the commonly used features of MS PowerPoint, allo…...

从UML到SysML:给软件工程师的系统思维升级指南(含实战案例拆解)

从UML到SysML:给软件工程师的系统思维升级指南(含实战案例拆解) 当软件工程师第一次接触需要协调传感器、控制器和机械臂的物联网项目时,往往会陷入"代码思维"的困境——试图用类图和时序图描述所有交互,却发…...