当前位置: 首页 > article >正文

21.dirsearch:Web 路径扫描工具

一、项目介绍

dirsearch 是一款高效、多线程的 Web 路径扫描工具,专为渗透测试人员和网络安全研究人员设计,用于发现目标网站的隐藏目录、敏感文件及未授权接口。其支持自定义字典、代理配置、请求头伪装等功能,适用于红队渗透、漏洞挖掘及资产测绘等场景。

1.1 核心功能

  • 多线程扫描:默认 20 线程,可自定义调整以提高效率。
  • 智能错误处理:自动过滤重复状态码(如 404),降低误报率。
  • 灵活扩展支持
    • 支持自定义字典(如 -w 指定字典文件)。
    • 支持多种扩展名扫描(如 -e php,asp,aspx)。
  • 结果输出:生成可读性强的报告(TXT/JSON/CSV),便于后续分析。
  • 绕过检测:支持随机 User-Agent、代理池、请求延迟等隐蔽扫描策略。

1.2 适用场景

  • 红队渗透:快速定位网站后台、敏感文件(如 admin.phpbackup.zip)。
  • 漏洞验证:发现未授权访问的 API 接口(如 /api/v1/users)。
  • 资产梳理:扫描企业网站的暴露面资产(如遗留测试页面)。

二、安装教程

2.1 环境要求

  • 操作系统:全平台兼容(Windows/Linux/macOS)。
  • Python 版本:3.7+(推荐 Python 3.9)。

2.2 安装方法

方法一:Git 克隆(推荐)
git clone https://github.com/maurosoria/dirsearch.git  
cd dirsearch  
pip install -r requirements.txt  
方法二:Kali Linux 直接安装
sudo apt update  
sudo apt install dirsearch  
方法三:Docker 部署
docker pull quay.io/dirsearch/dirsearch  
docker run -it --rm quay.io/dirsearch/dirsearch -u http://example.com  

三、基础使用教程

3.1 常用命令参数

参数

功能说明

-u URL

指定目标 URL(如 http://example.com)。

-w FILE

指定自定义字典文件(默认使用 dictionaries/common.txt)。

-e EXTENSIONS

扫描指定扩展名(如 php,html,zip)。

-t THREADS

设置线程数(默认 20,建议不超过 50)。

--timeout SEC

设置请求超时时间(默认 30 秒)。

--random-agent

启用随机 User-Agent。

3.2 基础扫描示例

  1. 扫描单个目标
python3 dirsearch.py -u http://example.com -e php,html  
  1. 使用自定义字典
python3 dirsearch.py -u http://example.com -w /path/to/custom_wordlist.txt  
  1. 过滤状态码
python3 dirsearch.py -u http://example.com --exclude-status 403,500  

四、进阶使用教程

4.1 代理与隐蔽扫描

  1. 通过代理扫描
python3 dirsearch.py -u http://example.com --proxy http://127.0.0.1:8080  
  1. 设置请求延迟
python3 dirsearch.py -u http://example.com --delay 2  # 单位:秒  
  1. 随机 User-Agent
python3 dirsearch.py -u http://example.com --random-agent  

4.2 递归扫描与深度控制

python3 dirsearch.py -u http://example.com --recursive -R 3  # 递归深度 3  

4.3 结果处理与报告生成

  1. 导出 JSON 报告
python3 dirsearch.py -u http://example.com -o report.json --format json  
  1. 结合其他工具处理结果
cat report.json | jq '.results[] | .url' | httpx -status-code  

4.4 高级字典策略

  1. 动态生成字典
    • 使用工具(如 CeWL)抓取目标网站内容生成字典:
cewl http://example.com -d 3 -m 5 -w custom_words.txt  
    • 合并字典并去重:
cat dict1.txt dict2.txt | sort -u > merged_dict.txt  

五、官方下载地址

  • GitHub 仓库:GitHub - maurosoria/dirsearch: Web path scanner

六、注意事项

  1. 合法授权:仅在授权范围内使用,禁止非法入侵。
  2. 性能调优
    • 避免线程数过高导致目标服务器过载或被封禁。
    • 内网环境可适当增加线程(如 -t 50)。
  1. 误报处理
    • 结合人工验证排除误报(如 403 Forbidden 可能是权限问题而非路径存在)。
    • 使用 --exclude-text 过滤特定响应内容(如 "Not Found")。

通过 dirsearch,用户可高效完成 Web 路径的探测任务,建议结合 nmap(端口扫描)和 httpx(HTTP 探测)构建完整的攻击链。

相关文章:

21.dirsearch:Web 路径扫描工具

一、项目介绍 dirsearch 是一款高效、多线程的 Web 路径扫描工具,专为渗透测试人员和网络安全研究人员设计,用于发现目标网站的隐藏目录、敏感文件及未授权接口。其支持自定义字典、代理配置、请求头伪装等功能,适用于红队渗透、漏洞挖掘及资…...

VSTO(C#)Excel开发4:打印设置

初级代码游戏的专栏介绍与文章目录-CSDN博客 我的github:codetoys,所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。 这些代码大部分以Linux为目标但部分代码是纯C的,可以在任何平台上使用。 源码指引:github源…...

设计模式Python版 模板方法模式(上)

文章目录 前言一、模板方法模式二、模板方法模式示例 前言 GOF设计模式分三大类: 创建型模式:关注对象的创建过程,包括单例模式、简单工厂模式、工厂方法模式、抽象工厂模式、原型模式和建造者模式。结构型模式:关注类和对象之间…...

源IP泄露后如何涅槃重生?高可用架构与自动化防御体系设计

一、架构层解决方案 1. 高防代理架构设计 推荐架构: 用户 → CDN(缓存静态资源) → 高防IP(流量清洗) → 源站集群(真实IP隐藏) ↑ Web应用防火墙(WAF) 实施要点&a…...

transformer bert 多头自注意力

输入的(a1,a2,a3,a4)是最终嵌入,是一个(512,768)的矩阵;而a1是一个token,尺寸是768 a1通过wq权重矩阵,经过全连接变换得到查询向量q1;a2通过Wk权重矩阵得到键向量k2;q和k点乘就是值…...

python-leetcode-定长子串中元音的最大数目

1456. 定长子串中元音的最大数目 - 力扣(LeetCode) 可以使用 滑动窗口 方法来解决这个问题。步骤如下: 初始化:计算前 k 个字符中元音字母的个数,作为初始窗口的值。滑动窗口:遍历字符串,每次右…...

Spring Boot + MyBatis-Plus 项目目录结构

以下是一个标准的 Spring Boot MyBatis-Plus 项目目录结构及文件命名规范,包含每个目录和文件的作用说明,适用于中大型项目开发: 项目根目录结构 src/ ├── main/ │ ├── java/ # Java 源代码 │ │ └── com/…...

Python之变量及简单的数据类型

本文来源于《Python从入门到实践》,自己整理以供工作参考 基本内容 print("Hello Python World!")message "Hello Python world!" print(message)message "Helllo Python Crash Course world!" print(message)name "ada lov…...

力扣 Hot 100 刷题记录 - 翻转二叉树

力扣 Hot 100 刷题记录 - 翻转二叉树 题目描述 翻转二叉树 是力扣 Hot 100 中的一道经典题目,题目要求如下: 给你一棵二叉树的根节点 root,翻转这棵二叉树,并返回其根节点。 示例 1: 输入:root [4,2,7…...

力扣215.数组中的第K个最大元素--堆排序法(java)

为了找到数组中第K个最大的元素,我们可以使用堆排序的方法。堆排序的核心是构建一个最大堆,并通过多次交换堆顶元素来找到前K个最大的元素。具体步骤如下: 方法思路 构建最大堆:将输入数组转换为最大堆,使得每个父节…...

MySQL增删改查操作 -- CRUD

个人主页:顾漂亮 目录 1.CRUD简介 2.Create新增 使用示例: 注意点: 3.Retrieve检索 使用示例: 注意点: 4.where条件查询 前置知识:-- 运算符 比较运算符 使用示例: 注意点&#xf…...

【算法day9】回文数-给你一个整数 x ,如果 x 是一个回文整数,返回 true ;否则,返回 false 。

回文数 给你一个整数 x ,如果 x 是一个回文整数,返回 true ;否则,返回 false 。 回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数。 例如,121 是回文&#…...

RSA混合加密RSA混合加密

RSA混合加密是一种结合非对称加密(RSA)和对称加密(AES)的技术,通过两者的优势互补,实现高效且安全的数据传输。以下是详细解释和示例: RSA混合加密的核心原理 非对称加密(RSA&#x…...

蛋白质功能预测论文阅读记录2025(DPFunc、ProtCLIP)

前言 最近研究到瓶颈了,怎么优化都提升不了,遂开始看点最新的论文。 DPFunc 2025.1.2 Nature Communication 中南大学 论文地址:DPFunc: accurately predicting protein function via deep learning with domain-guided structure inform…...

Linux网络套接字编程——UDP服务器

Linux网络套接字编程——创建并绑定-CSDN博客 前面已经介绍了网络套接字的创建和绑定,这篇文章会通过UDP套接字实现一个UDP服务器。 先介绍将使用的接口。 recvfrom ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,struct sockaddr *src_addr,…...

主流向量数据库对比

在 AI 的 RAG(检索增强生成)研发领域,向量数据库是存储和查询向量嵌入的核心工具,用于支持高效的语义搜索和信息检索。向量嵌入是文本或其他非结构化数据的数值表示,RAG 系统通过这些嵌入从知识库中检索相关信息&#…...

54.HarmonyOS NEXT 登录模块开发教程(八):测试与调试技巧

温馨提示:本篇博客的详细代码已发布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下载运行哦! HarmonyOS NEXT 登录模块开发教程(八):测试与调试技巧 文章目录 HarmonyOS NEXT 登录模块开发教程(…...

Vue3中 ref 与 reactive区别

ref 用途: ref 通常用于创建一个响应式的基本类型数据(如 string、number、boolean 等),但它也可以用于对象或数组 返回值: ref 返回一个带有 .value 属性的对象,访问或修改数据需要通过 .value 进行 使用场景: …...

结构型——装饰器模式

装饰器模式 装饰器是指能动态地为对象添加额外的功能的一种结构型设计模式。 特点 不修改原有代码的情况下,动态地扩展一个对象的功能。支持多个装饰器叠加使用透明性,装饰后的对象与原对象保持一致,客户端无需感知装饰过程 结构模式与实…...

在Simulink中将Excel数据导入可变负载模块的方法介绍

文章目录 数据准备与格式要求Excel数据格式MATLAB预处理数据导入方法使用From Spreadsheet模块(直接导入Excel)通过MATLAB工作区中转(From Workspace模块)使用1-D Lookup Table模块(非线性负载映射)Signal Builder模块(变载工况导入)可变负载模块配置注意事项与调试在S…...

分布式事务的产生背景及理论指导

分布式事务的产生背景 在现代互联网和企业级系统架构中,随着业务需求的增长,单体架构逐渐向微服务架构、分布式架构演进。传统单体架构下,事务管理相对简单,可以依赖数据库的本地事务(如 MySQL 的 ACID 事务&#xff…...

动手学强化学习-记录

3.5 蒙特卡洛方法 统计每一个状态s出现的总次数和总回报,用大数定律,总回报/总次数≈状态s的期望回报 第4章 动态规划算法 策略迭代中的策略评估使用贝尔曼期望方程来得到一个策略的状态价值函数,这是一个动 态规划的过程;而价值迭代直接使用贝尔曼最…...

RocketMQ性能优化篇

在分布式消息系统中,RocketMQ以其高性能、高可靠性和高可扩展性而被广泛应用。然而,为了充分发挥其性能优势,需要进行一系列的性能测试和优化。本文将从性能测试方法和优化实践两个方面,详细介绍如何对RocketMQ进行性能优化。通过…...

C语言为例谈数据依赖性

数据依赖性(Data Dependency)是指程序中后续操作的计算结果或内存访问依赖于前面操作的结果。在存在数据依赖的情况下,编译器或处理器会保证这些操作的执行顺序,因此不需要显式地使用内存屏障(Memory Barrier&#xff…...

阿里云操作系统控制台评测:国产AI+运维 一站式运维管理平台

阿里云操作系统控制台评测:国产AI运维 一站式运维管理平台 引言 随着云计算技术的飞速发展,企业在云端的运维管理面临更高的要求。阿里云操作系统控制台作为一款集运维管理、智能助手和系统诊断等多功能于一体的工具,正逐步成为企业高效管理…...

C++中的const与类型转换艺术

目录 强制转换 static_cast const_cast reinterpret_cast dynamic_cast const关键字 修饰内置类型* 修饰指针类型* 类比 数组指针 指针数组 函数指针 指针函数 强制转换 C语言中的强制转换在C代码中依然可以使用,这种C风格的转换格式非常简单 TYPE a …...

网络安全演练有哪些形式

OPENVAS使用 1、确定指定IP是否能ping通 2、创建扫描目标 3、创建扫描任务(scan management →newtask) 4、开始任务start 5、查看扫描细节 6、查看扫描结果,包含漏洞详细信息,亦可到处PDF文件 7、导出扫描结果报告 8、为…...

c++常用的算术生成算法

注意&#xff1a; 算术生成算法属于小型算法&#xff0c;使用时包含的头文件为 #include <numeric> 算法简介&#xff1a; accumulate //计算容器元素累加总和fill //向容器中添加元素 1. accumulate 功能描述&#xff1a; 计算区间内 容器元素…...

2011. 执行操作后的变量值

执行操作后的变量值 题目描述尝试做法推荐做法 题目描述 存在一种仅支持 4 种操作和 1 个变量 X 的编程语言&#xff1a; X 和 X 使变量 X 的值 加 1 –X 和 X-- 使变量 X 的值 减 1 最初&#xff0c;X 的值是 0 给你一个字符串数组 operations &#xff0c;这是由操作组成的…...

特辣的海藻!10

基础知识点 1.清除换行符 scan.nextInt()要加scan.nextLine()清楚换行符。 2.Map.Entry<K, V> Map.Entry是Map接口的嵌套接口&#xff0c;表示一个键值对&#xff08;Key-Value&#xff09; 常用方法&#xff1a; entry.getKey()&#xff1a;获取键 …...