14. 从零用Rust编写正反向代理, HTTP文件服务器的实现过程及参数
wmproxy
wmproxy
是由Rust
编写,已实现http/https
代理,socks5
代理, 反向代理,静态文件服务器,内网穿透,配置热更新等, 后续将实现websocket
代理等,同时会将实现过程分享出来, 感兴趣的可以一起造个轮子法
项目 ++wmproxy++
gite: https://gitee.com/tickbh/wmproxy
github: https://github.com/tickbh/wmproxy
HTTP文件服务器的意义
HTTP文件服务器的意义是可以放置网站文件,可以放置数据文件。
HTTP服务器一般指网站服务器,是指驻留于因特网上某种类型计算机的程序,可以处理浏览器等Web客户端的请求并返回相应响应。
当前大量的应用会依赖到文件服务器,比如我们非常熟悉的网站(会加载index.html)文件及各种css及js文件,比如我们的各种APP会有相对应的版本信息,会有相应的版本文件,又或者小程序本身就是一个可执行文件,当你点击的时候,应用去下载相应的小程序文件,然后在本地进行加载,然后打开提供服务。目前我们的互联网上冲浪完全无法离开文件服务器。
HTTP文件服务器几大作用
1. 文件共享
文件服务器的主要功能是提供文件共享功能。它允许用户从他们自己的计算机或设备访问共享文件和文件夹,而不管他们的物理位置。用户可以查看、编辑和保存存储在服务器上的文件,所有有权访问该文件的用户都会自动更新更改。
以下是我们在聊天软件上发送一张图片给另一个人的流程
2. 集中存储
此时你的不小心将数据删除,此时你想找回原来的图片,以下是整个过程
此时文件服务器担任着集中存储的角色,海量的数据将汇聚在中心服务器上,我们可以通过网络访问到海量的数据资源。
3. 备份与恢复
上述过程,相当于服务器帮你备份了图片数据,在你不小心丢失的时候,可以恢复您的数据,我们最经常使用的如图片备份到网盘,一方面可以释放掉本地的空间,另一方面我们可以将数据保存到很久之后。
4. 访问控制
我们在获取到图片地址的时候,并不是任何的角色都可以获取到该图片的资源,在服务器内部中,会有相关的权限验证,在为您提供数据的同时,并保护着您的数据安全。
file_server文件服务器
一个静态文件服务器,支持真实和虚拟文件系统。它通过将请求的URI路径附加到站点的根路径来形成文件路径。
最常见的是,file_server指令与root指令配对,为整个网站设置文件根。其中保证所有的访问仅能在root指定的目录之下,不能访问其上级的任何数据,故在root下的目录理论上即使禁目录访问也可能被全部访问到(暴力遍历),但在root上级的目录不可能被以任何的方式进行访问,即使添加../
相对路径也不行。
file_server参数相关
结构定义如下:
pub struct FileServer {#[serde(default = "default_root")]pub root: String,#[serde(default)]pub prefix: String,#[serde(default="default_hide")]pub hide: Vec<String>,#[serde(default = "default_index")]pub index: Vec<String>,#[serde(default = "default_status")]pub status: u16,#[serde(default = "default_precompressed")]pub precompressed: Vec<String>,#[serde(default)]pub disable_compress: bool,#[serde(default = "default_bool_true")]pub browse: bool,
}
- browse 对没有索引文件的目录的请求,当前又是一个目录的情况下启用文件列表。
- root 设置网站根目录。指向的是当前文件磁盘下的路径前缀,如
/file/
,那么提供服务的将是/file/
的文件服务 - prefix Url的前缀,如
/static/
,如果我们获取到一个请求路径如/static/src/wmproxy.md
,那么我们会去掉前缀得到src/wmproxy.md
,那么实际的指向为/file/src/wmproxy.md
进行文件服务 - hide 是一个要隐藏的文件或文件夹的列表;如果要求,文件服务器将假装它们不存在。该指令接受占位符和glob模式。注意,这些是 文件系统 路径,不是请求路径。换句话说,相对路径使用当前工作目录作为基础,而不是网站根目录;所有的路径在比较之前都会被转换为绝对形式(如果可能的话)。指定一个没有路径分隔符的文件名或模式,将隐藏所有具有匹配名称的文件,无论其位置如何;
- index 是一个寻找索引文件的文件名列表。默认:
index.html index.htm
。 - precompressed 是用于搜索预压缩挎包文件的编码格式列表。支持的格式有gzip(.gz),和br(.br)。所有的文件查找将首先寻找未压缩文件的存在。一旦找到,我们将以未添加之前的格式做
mimetype
,如README.md.gz
取的是md的mimetype
,也就是text/plain
。并适当地设置Content-Encoding响应头。否则,将以正常的未压缩文件进行响应。如果encode指令被启用,那么如果没有预压缩,它可能会对响应进行即时压缩。如我们访问README.md
,但此时目录下存在README.md.gz
,那我们我们响应的是gz的文件,并设置Content-Encoding: gzip
,如此做的好处,我们对该文件的任何请求,我们都无须耗任何压缩的时间,响应更快,我们可以用更高的压缩比来进行预压缩,可节省更多时间。 - status 是一个可选的状态代码覆盖,在编写响应时使用。在用自定义错误页面响应请求时特别有用。可以是一个3位数的状态代码,例如:
404
。支持占位符。默认情况下,写入的状态代码通常是200
,或206
,用于部分内容。
- 当前目录外的静态文件服务器。
reverse:file_server:
- 启用了文件列表:
reverse:file_server:browse: true
- 只服务于
/static
文件夹中的静态文件:
reverse:file_server:root: /static/browse: true
- 隐藏所有.git文件夹及其内容。
reverse:file_server:root: /static/browse: truehide: [.git]
- 如果客户端支持(Accept-Encoding头),发送
gzip,br
,则检查请求的文件是否存在预压缩的文件。因此,如果/path/to/file被请求,/path/to/file.br和/path/to/file.gz`,并提供第一个具有相应内容编码的可用文件。
reverse:file_server:root: /static/browse: truehide: [.git]precompressed: [br, gzip]
mimetype
作用
多用途互联网邮件扩展(MIME,Multipurpose Internet Mail Extensions)
是一个 互联网标准,它扩展了 电子邮件标准,使其能够支持非 ASCII字符、 二进制格式附件等多种格式的邮件消息。
内容类型(Content-Type),这个头部领域用于指定消息的类型。一般以下面的形式出现。[type]/[subtype]
type有下面的形式。
Text:用于标准化地表示的文本信息,文本消息可以是多种字符集和或者多种格式的;
Multipart:用于连接消息体的多个部分构成一个消息,这些部分可以是不同类型的数据;
Application:用于传输应用程序数据或者二进制数据;
Message:用于包装一个E-mail消息;
Image:用于传输静态图片数据;
Audio:用于传输音频或者音声数据;
Video:用于传输动态影像数据,可以是与音频编辑在一起的视频数据格式。
subtype
用于指定type的详细形式。type/subtype配对的集合和与此相关的参数,将随着时间而增长。为了确保这些值在一个有序而且公开的状态下开发,MIME使用Internet Assigned Numbers Authority (IANA)作为中心的注册机制来管理这些值。常用的subtype值如下所示:
- text/plain(纯文本)
- text/html(HTML文档)
- application/xhtml+xml(XHTML文档)
- image/gif(GIF图像)
- image/jpeg(JPEG图像)
- image/png(PNG图像)
- video/mpeg(MPEG动画)
- application/octet-stream(任意的二进制数据)
- application/pdf(PDF文档)
- application/msword(Microsoft Word文件)
- message/rfc822( RFC 822形式)
- multipart/alternative(HTML邮件的HTML形式和纯文本形式,相同内容使用不同形式表示)
- application/x-www-form-urlencoded(使用HTTP的POST方法提交的表单)
- multipart/form-data(同上,但主要用于表单提交时伴随文件上传的场合)
我们根据现有的已知的,我们用了静态变量做了以下数据定义,后续将会进行数据补充或者自定义
lazy_static! {static ref DEFAULT_MIMETYPE: HashMap<&'static str, &'static str> = {let mut m = HashMap::<&'static str, &'static str>::new();m.insert("doc", "application/msword");m.insert("pdf", "application/pdf");m.insert("rtf", "application/rtf");m.insert("xls", "application/vnd.ms-excel");m.insert("ppt", "application/vnd.ms-powerpoint");m.insert("rar", "application/application/x-rar-compressed");m.insert("swf", "application/x-shockwave-flash");m.insert("zip", "application/zip");m.insert("json", "application/json");m.insert("yaml", "text/plain");m.insert("mid", "audio/midi");m.insert("midi", "audio/midi");m.insert("kar", "audio/midi");m.insert("mp3", "audio/mpeg");m.insert("ogg", "audio/ogg");m.insert("m4a", "audio/m4a");m.insert("ra", "audio/x-realaudio");m.insert("gif", "image/gif");m.insert("jpeg", "image/jpeg");m.insert("jpg", "image/jpeg");m.insert("png", "image/png");m.insert("tif", "image/tiff");m.insert("tiff", "image/tiff");m.insert("wbmp", "image/vnd.wap.wbmp");m.insert("ico", "image/x-icon");m.insert("jng", "image/x-jng");m.insert("bmp", "image/x-ms-bmp");m.insert("svg", "image/svg+xml");m.insert("svgz", "image/svg+xml");m.insert("webp", "image/webp");m.insert("svg", "image/svg+xml");m.insert("css", "text/css");m.insert("html", "text/html");m.insert("htm", "text/html");m.insert("shtml", "text/html");m.insert("txt", "text/plain");m.insert("md", "text/plain");m.insert("xml", "text/xml");m.insert("3gpp", "video/3gpp");m.insert("3gp", "video/3gpp");m.insert("mp4", "video/mp4");m.insert("mpeg", "video/mpeg");m.insert("mpg", "video/mpeg");m.insert("mov", "video/quicktime");m.insert("webm", "video/webm");m.insert("flv", "video/x-flv");m.insert("m4v", "video/x-m4v");m.insert("wmv", "video/x-ms-wmv");m.insert("avi", "video/x-msvideo");m};
}
源码实现
源码主要实现在
file_server.rs
的deal_request
函数。节选
pub async fn deal_request(&self,req: Request<RecvStream>,
) -> ProtResult<Response<RecvStream>> {let path = req.path().clone();// 无效前缀,无法处理if !path.starts_with(&self.prefix) {return Ok(self.ret_error_msg("unknow path"));}let root_path = Path::new(&self.root);let mut real_path = Path::new(&real_path).to_owned();// 必须保证不会跑出root设置的目录之外,如故意访问`../`之类的if !real_path.starts_with(root_path) || self.is_hide_path(root_path.as_ref()) {return Ok(self.ret_error_msg("can't view parent file"));}// 访问路径是目录,尝试是否有index的文件,如果有还是以文件访问if real_path.is_dir() {for index in &self.index {let new_path = real_path.join(index);if new_path.exists() {real_path = new_path;break;}}}// 访问为目录,如果启用目录访问,则返回当前的文件夹的内容if real_path.is_dir() {if !self.browse {return Ok(self.ret_error_msg("can't view parent file"));}let mut binary = BinaryMut::new();// ... let recv = RecvStream::only(binary.freeze());let builder = Response::builder().version(req.version().clone());let mut response = builder.header(HeaderName::CONTENT_TYPE, "text/html; charset=utf-8").body(recv).map_err(|_err| io::Error::new(io::ErrorKind::Other, ""))?;if self.disable_compress {response.headers_mut().insert(HeaderName::CONTENT_ENCODING, "");}return Ok(response);} else {// 访问为文件,判断当前的后缀,返回合适的mimetype,如果有合适的预压缩文件,也及时返回if self.is_hide_path(path.as_ref()) {return Ok(self.ret_error_msg("can't view file"));}// 获取后缀let extension = if let Some(s) = real_path.extension() {s.to_string_lossy().to_string()} else {String::new()};let application = DEFAULT_MIMETYPE.get(&*extension).unwrap_or(&"");//查找是否有合适的预压缩文件if let Some(accept) = req.headers().get_option_value(&HeaderName::ACCEPT_ENCODING) {for pre in &self.precompressed {// 得客户端发送支持该格式if !accept.contains(pre.as_bytes()) {continue;}let mut new = real_path.clone();new.as_mut_os_string().push(".");match &**pre {"gzip" => new.as_mut_os_string().push("gz"),"br" => new.as_mut_os_string().push("br"),_ => continue,};// 如果预压缩文件存在if new.exists() {println!("convert to new file {}", new.to_string_lossy());let file = File::open(new).await?;let mut recv = RecvStream::new_file(file, BinaryMut::new(), false);match &**pre {"gzip" => recv.set_compress_origin_gzip(),"br" => recv.set_compress_brotli(),_ => unreachable!(),}// ...return Ok(response);}}}if !real_path.exists() {return Ok(self.ret_error_msg("can't view file"));}// ...return Ok(response);}
}
结语
如此静态文件服务器则已初步实现,文件服务中的压缩及流式传输已基本完成
相关文章:
14. 从零用Rust编写正反向代理, HTTP文件服务器的实现过程及参数
wmproxy wmproxy是由Rust编写,已实现http/https代理,socks5代理, 反向代理,静态文件服务器,内网穿透,配置热更新等, 后续将实现websocket代理等,同时会将实现过程分享出来ÿ…...
【随笔】MD5加密字符串、文件apache、springframework实现
文章目录 一、引入依赖二、工具代码三、测试代码四、输出结果 一、引入依赖 commons-codec <dependency><groupId>commons-codec</groupId><artifactId>commons-codec</artifactId><version>1.13</version> </dependency>二…...

java八股 设计模式
企业场景篇-03-设计模式-工厂设计模式-工厂方法模式_哔哩哔哩_bilibili 1.简单工厂模式 新加咖啡类的时候需要在唯一的那个工厂类里加代码,这样就耦合了 2.工厂模式 相对于简单模式的一个工厂生产所有咖啡,这里只定义了一个抽象咖啡工厂,然…...

Docker安装(CentOS)+简单使用
Docker安装(CentOS) 一键卸载旧的 sudo yum remove docker* 一行代码(自动安装) 使用官方安装脚本 curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun 启动 docker并查看状态 运行镜像 hello-world docker run hello-world 简单使用 使用 docker run …...
Mybatis配置-环境配置(environments)
MyBatis支持配置多个环境,这有助于将您的SQL映射应用于多个数据库,无论出于何种原因。例如,您可能希望为开发、测试和生产环境使用不同的配置。或者,您可能有多个共享相同模式的生产数据库,并且想要在两者上使用相同的…...

Android模拟器的安装和adb连接
一、前置说明 APP 自动化可以使用真机进行测试,也可以使用模拟器来模拟安卓设备。我们可以根据个人喜好安装模拟器,个人推荐安装两款模拟器:网易 MuMu 模拟器、夜神模拟器。 MuMu模拟器可以支持 Android 12 版本,优点是…...
引领创新潮流,武汉灰京文化开创游戏行业新推广标杆
作为市场引领者,武汉灰京文化通过多渠道、多维度的市场推广手段,不仅助力游戏产品广泛传播,更为整个游戏行业树立了新的推广标杆。公司的成功经验为其他游戏发行商提供了有力的借鉴,推动了行业向更创新、更多元的方向发展。 引领…...

HTML5文档
目录 HTML5文档结构1.HTML5页面结构2.HTML5新增结构元素 HTML5新增页面元素1.hgroup标记2.figure标记与figcaption标记3.mark标记与time标记4.details标记与summary标记5.progress标记与meter标记6.input标记与datalist标记 HTML5文档结构 HTML5文档结构同样是由头部和主体两部…...

springboot实现发送邮件开箱即用
springboot实现发送邮件开箱即用 环境依赖包yml配置Service层Controller层测试 环境 jdk17 springboot版本3.2.1 依赖包 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-mail</artifactId><ver…...

论文阅读——RS DINO
RS DINO: A Novel Panoptic Segmentation Algorithm for High Resolution Remote Sensing Images 基于MASKDINO模型,加了两个模块: BAM:Batch Attention Module 遥感图像切分的时候把一个建筑物整体比如飞机场切分到不同图片中,…...

【即插即用篇】YOLOv8改进实战 | 引入 Involution(内卷),用于视觉识别的新一代神经网络!涨点神器!
YOLOv8专栏导航:点击此处跳转 前言 YOLOv8 是由 YOLOv5 的发布者 Ultralytics 发布的最新版本的 YOLO。它可用于对象检测、分割、分类任务以及大型数据集的学习,并且可以在包括 CPU 和 GPU 在内的各种硬件上执行。 YOLOv8是一种尖端的、最先进的 (SOTA) 模型,它建立在以前成…...

在Excel中,如何简单快速地删除重复项,这里提供详细步骤
当你在Microsoft Excel中使用电子表格时,意外地复制了行,或者如果你正在制作其他几个电子表格的合成电子表格,你将遇到需要删除的重复行。这可能是一项非常无脑、重复、耗时的任务,但有几个技巧可以让它变得更简单。 删除重复项 …...
【Kafka-Eagle】EFAK告警配置与实践
Kafka-Eagle是一个开源的Kafka集群监控与告警系统,可以帮助用户实现对Kafka集群的实时监控、性能指标收集以及异常告警等功能。下面是关于Kafka-Eagle的告警配置和实践的一般步骤: 安装和配置Kafka-Eagle: 下载最新版本的Kafka-Eagle安装包&a…...

机器学习 | 概率图模型
见微知著,睹始知终。 见到细微的苗头就能预知事物的发展方向,能透过微小的现象看到事物的本质,推断结论或者结果。 概率模型为机器学习打开了一扇新的大门,将学习的任务转变为计算变量的概率分布。 实际情况中,各个变量…...

25、新加坡南洋理工、新加坡国立大学提出FBCNet:完美融合FBCSP的CNN,EEG解码SOTA水准![抱歉老师,我太想进步了!]
前言: 阴阳差错,因工作需要,需要查阅有关如何将FBCSP融入CNN中的文献,查阅全网,发现只此一篇文章,心中大喜,心想作者哪家单位,读之,原来是自己大导(新加坡工…...

单调栈分类、封装和总结
作者推荐 map|动态规划|单调栈|LeetCode975:奇偶跳 通过枚举最小(最大)值不重复、不遗漏枚举所有子数组 C算法:美丽塔O(n)解法单调栈左右寻找第一个小于maxHeight[i]的left,right,[left,right]直接的高度都是maxHeight[i] 可以…...

【Amazon 实验①】使用 Amazon CloudFront加速Web内容分发
文章目录 实验架构图1. 准备实验环境2. 创建CloudFront分配、配置动、静态资源分发2.1 创建CloudFront分配,添加S3作为静态资源源站2.2 为CloudFront分配添加动态源站 在本实验——使用CloudFront进行全站加速中,将了解与学习Amazon CloudFront服务&…...
<math.h> 头文件:C语言数学库函数
文章目录 概述基本算术运算sqrt()fabs()pow() 三角函数sin()cos() 对数函数log()log10() 指数函数exp() 其他函数ceil()floor() 结语 概述 math.h 是C语言标准库中的头文件,提供了许多与数学运算相关的函数。在本文中,我们将深入讨论一些 math.h 中常用…...

1.CentOS7网络配置
CentOS7网络配置 查看网络配置信息 ip addr 或者 ifconfig 修改网卡配置信息 vim /etc/sysconfig/network-scripts/ifcfg-ens192 设备类型:TYPEEthernet地址分配模式:BOOTPROTOstatic网卡名称:NAMEens192是否启动:ONBOOTye…...

Prompt-to-Prompt:基于 cross-attention 控制的图像编辑技术
Hertz A, Mokady R, Tenenbaum J, et al. Prompt-to-prompt image editing with cross attention control[J]. arXiv preprint arXiv:2208.01626, 2022. Prompt-to-Prompt 是 Google 提出的一种全新的图像编辑方法,不同于任何传统方法需要用户指定编辑区域ÿ…...

华为云AI开发平台ModelArts
华为云ModelArts:重塑AI开发流程的“智能引擎”与“创新加速器”! 在人工智能浪潮席卷全球的2025年,企业拥抱AI的意愿空前高涨,但技术门槛高、流程复杂、资源投入巨大的现实,却让许多创新构想止步于实验室。数据科学家…...
反向工程与模型迁移:打造未来商品详情API的可持续创新体系
在电商行业蓬勃发展的当下,商品详情API作为连接电商平台与开发者、商家及用户的关键纽带,其重要性日益凸显。传统商品详情API主要聚焦于商品基本信息(如名称、价格、库存等)的获取与展示,已难以满足市场对个性化、智能…...
Qwen3-Embedding-0.6B深度解析:多语言语义检索的轻量级利器
第一章 引言:语义表示的新时代挑战与Qwen3的破局之路 1.1 文本嵌入的核心价值与技术演进 在人工智能领域,文本嵌入技术如同连接自然语言与机器理解的“神经突触”——它将人类语言转化为计算机可计算的语义向量,支撑着搜索引擎、推荐系统、…...

以光量子为例,详解量子获取方式
光量子技术获取量子比特可在室温下进行。该方式有望通过与名为硅光子学(silicon photonics)的光波导(optical waveguide)芯片制造技术和光纤等光通信技术相结合来实现量子计算机。量子力学中,光既是波又是粒子。光子本…...

SiFli 52把Imagie图片,Font字体资源放在指定位置,编译成指定img.bin和font.bin的问题
分区配置 (ptab.json) img 属性介绍: img 属性指定分区存放的 image 名称,指定的 image 名称必须是当前工程生成的 binary 。 如果 binary 有多个文件,则以 proj_name:binary_name 格式指定文件名, proj_name 为工程 名&…...
Java + Spring Boot + Mybatis 实现批量插入
在 Java 中使用 Spring Boot 和 MyBatis 实现批量插入可以通过以下步骤完成。这里提供两种常用方法:使用 MyBatis 的 <foreach> 标签和批处理模式(ExecutorType.BATCH)。 方法一:使用 XML 的 <foreach> 标签ÿ…...

MySQL 知识小结(一)
一、my.cnf配置详解 我们知道安装MySQL有两种方式来安装咱们的MySQL数据库,分别是二进制安装编译数据库或者使用三方yum来进行安装,第三方yum的安装相对于二进制压缩包的安装更快捷,但是文件存放起来数据比较冗余,用二进制能够更好管理咱们M…...
Leetcode33( 搜索旋转排序数组)
题目表述 整数数组 nums 按升序排列,数组中的值 互不相同 。 在传递给函数之前,nums 在预先未知的某个下标 k(0 < k < nums.length)上进行了 旋转,使数组变为 [nums[k], nums[k1], …, nums[n-1], nums[0], nu…...
HybridVLA——让单一LLM同时具备扩散和自回归动作预测能力:训练时既扩散也回归,但推理时则扩散
前言 如上一篇文章《dexcap升级版之DexWild》中的前言部分所说,在叠衣服的过程中,我会带着团队对比各种模型、方法、策略,毕竟针对各个场景始终寻找更优的解决方案,是我个人和我司「七月在线」的职责之一 且个人认为,…...

若依登录用户名和密码加密
/*** 获取公钥:前端用来密码加密* return*/GetMapping("/getPublicKey")public RSAUtil.RSAKeyPair getPublicKey() {return RSAUtil.rsaKeyPair();}新建RSAUti.Java package com.ruoyi.common.utils;import org.apache.commons.codec.binary.Base64; im…...