当前位置: 首页 > news >正文

Python - 搭建 Flask 服务实现图像、视频修复需求

目录

一.引言

二.服务构建

1.主函数 upload_gif

2.文件接收

3.专属目录

4.图像修复

5.gif2mp4

6.mp42gif

7.图像返回

三.服务测试

1.服务启动

2.服务调用

四.总结


一.引言

前面我们介绍了如何使用 Real-ESRGAN 进行图像增强并在原始格式 jpeg、jpg、mp4 的基础上增加了 gif 图像的处理:

◆ 图像修复:  Python - Real-ESRGAN 提升图像、视频清晰度

◆ 动图修复:  Python - Real-ESRGAN 提高 gif 图像质量

为了方便随时随地上传图片即可修图,我们将上面的内容结合,通过 Flask 框架搭建图像修复服务。

二.服务构建

1.主函数 upload_gif

from flask import Flask, request, send_file, abort
from moviepy.editor import VideoFileClip
import os
import subprocess
import shutil
from enhance_frame import enhanceapp = Flask(__name__)output="./server/"@app.route('/upload-gif', methods=['POST'])
def upload_gif():if 'gif' not in request.files:return abort(400, 'No gif file part in the request')file = request.files['gif']# 确保文件名安全if file.filename == '':return abort(400, 'No selected file')if file and file.filename.lower().endswith('.gif'):# 1.创建专属文件夹gif_name = file.filename.split(".")[0]cur_dir = os.path.join(output, gif_name)# 临时测试#shutil.rmtree(cur_dir)if not os.path.isdir(cur_dir):print(f"文件夹 {cur_dir} 不存在,创建中 ...")os.makedirs(cur_dir)#  2.图像转存至本地并切换为 mp4 格式input_path = os.path.join(cur_dir, file.filename)print(f"原始图像保存路径 {input_path}")file.save(input_path)mp4_path, w, h = gif2mp4(input_path, gif_name, cur_dir)print(f"GIF 转 MP4 路径 {mp4_path}")# 3.对图像进行增强行理enhance(mp4_path, cur_dir)enhance_output = os.path.join(cur_dir, gif_name + "_trans_out.mp4")# 4.转换为 gif 并返回final_output = os.path.join(cur_dir, gif_name + "_out.gif")mp42gif(enhance_output, final_output, w, h)else:print(f"文件夹 {cur_dir} 存在 ...")final_output = 'uploaded.gif'return send_file(final_output, mimetype='image/gif')return abort(400, 'The uploaded file is not a GIF')

主函数为 Post 形式,其通过 request.files 接收传入的 gif 图像并对图像进行修复,返回修复后的 gif 图像。下面分步骤对修复过程中的代码进行讲解。

2.文件接收

    if 'gif' not in request.files:return abort(400, 'No gif file part in the request')file = request.files['gif']# 确保文件名安全if file.filename == '':return abort(400, 'No selected file')

首先检查 gif 是否在传入的图像中,随后通过 .files['gif'] 获取传入的 gif 图像,最后检查文件名为空的异常情况。这里只做了简单的异常判断,大家可以根据自己场景进行扩充。

3.专属目录

    if file and file.filename.lower().endswith('.gif'):# 1.创建专属文件夹gif_name = file.filename.split(".")[0]cur_dir = os.path.join(output, gif_name)# 临时测试#shutil.rmtree(cur_dir)if not os.path.isdir(cur_dir):print(f"文件夹 {cur_dir} 不存在,创建中 ...")os.makedirs(cur_dir)

这里通过 file.filename 获取对应 gif 图的名称,并在输出文件中创建该 gif 图的专属文件夹,一方面是可以记录 Post 请求传来的图像以及修复后的状态,另一方面相当于做了一个本地 Cache,如果相同名称的 gif 图像再次 Post 传过来,可以直接在文件夹中找到缓存的返回。

4.图像修复

            #  2.图像转存至本地并切换为 mp4 格式input_path = os.path.join(cur_dir, file.filename)print(f"原始图像保存路径 {input_path}")file.save(input_path)mp4_path, w, h = gif2mp4(input_path, gif_name, cur_dir)print(f"GIF 转 MP4 路径 {mp4_path}")# 3.对图像进行增强行理enhance(mp4_path, cur_dir)enhance_output = os.path.join(cur_dir, gif_name + "_trans_out.mp4")# 4.转换为 gif 并返回final_output = os.path.join(cur_dir, gif_name + "_out.gif")mp42gif(enhance_output, final_output, w, h)

由于原始的 Real-ESRGAN 源码对视频只支持了 flv 和 mp4,因此对于要修复的 gif 我们需要:

◆ gif2mp4

先将其逐帧转换为 mp4 ,这一步由 gif2mp4 函数负责;

◆ enhance

转换为 mp4 后由 enhance 函数进行修复,这里 enhance 函数对应源码中的 inference_realesrgan_video.py ,enhance 函数对应源码中的 main() 函数,只需要修改名称即可;

◆ mp42gif

修复后再将 mp4 转换为 gif,这一步由 mp42gif 负责。

Tips:

如果觉得上述过程比较繁琐,可以直接通过 ffmpeg 在源码中实现对 gif 图像进行转换。

5.gif2mp4

def gif2mp4(file_path, filename, out):# 加载GIF文件clip = VideoFileClip(file_path)# 输出地址output = os.path.join(out, filename + "_trans.mp4")# 将GIF文件写到MP4文件clip.write_videofile(output, fps=clip.fps, codec="libx264", bitrate='8000k')# 关闭clip.close()return output, clip.w, clip.h

通过 moviepy 的 VideoFileClip 函数读取 mp4,随后通过 write_videofile 将 mp4 写出,这里 bitrate 可以控制输出 mp4 的码率,数值越高可以在一定程度提高输出视频的质量。同时为了保证输出的 gif 图像与原始 gif 图像的长宽保持一致,这里我们还返回了 clip.w 和 clip.h。

6.mp42gif

def mp42gif(file_path, out, w, h):# 加载GIF文件clip = VideoFileClip(file_path)# 目标大小resized_clip = clip.resize(width=w).resize(height=h)# 导出GIFresized_clip.write_gif(out, fps=15)  # fps参数可以减少帧数,来进一步降低文件大小# 释放资源clip.close()

还是通过 moviepy 进行 mp4 到 gif 的转换,使用 resize 保证输出的 gif 与原始 gif 尺寸相同,由于增强的缘故,新生成的 gif 会比之前的老图大 5-10 倍,如果有缩减的需要,可以减少 FPS 或者使用 reduction_factor 按百分比减少分辨率。

7.图像返回

        else:print(f"文件夹 {cur_dir} 存在 ...")final_output = 'uploaded.gif'return send_file(final_output, mimetype='image/gif')return abort(400, 'The uploaded file is not a GIF')

else 逻辑其实是该 gif 存在缓存文件夹,直接在文件夹找增强过的图像直接返回就可以了,这里省略了 Cache 的逻辑,有需要的同学也可以自己添加。最后就是通过 send_file 将 final_output 文件写出,作为 Post 的结果回传。

三.服务测试

1.服务启动

if __name__ == '__main__':# 这将允许你在你的开发机上本地运行它ip = "10.196.1.666"app.run(host=ip, port=5000, debug=True)

运行主函数后提示下述信息即代表 Http 服务启动,Running on http: 后面就是对应的 URL。如果显示异常可以尝试切换 port 重新启动: 

2.服务调用

在本地执行下述命令:

#!/bin/bash# gif 路径
gif_path="gif=@/Users/xxx/Desktop/892f4f60de074a7b9c682f744a5cf6f8.gif"
# post 调用 URL
url="http://10.192.1.666:5000/upload-gif"
# 输出地址
out="response.gif"curl -X POST $url -F $gif_path --output $out

◆ 服务端日志

服务端日志会把 Flask 程序里相关的 print 都打印出来,最后 inference 是视频修复的 tqdm 进度条,这里 nb_frames: 12 代表当前 gif 转换的 mp4 共包含 12 帧,程序在单线程的情况下需要逐帧转换,有需要的同学也可以使用多线程实现,分 Frame 处理,最后使用 ffmpeg 进行合并。

◆ 本地日志

本地日志会记录调用的时间以及相关接收数据等信息。 

◆ gif 修复前

 ◆ gif 修复后

四.总结

本文使用 Flask 搭建了轻量级的图像修复服务,可以优化的点还有很多,大家可以多多交流讨论。

相关文章:

Python - 搭建 Flask 服务实现图像、视频修复需求

目录 一.引言 二.服务构建 1.主函数 upload_gif 2.文件接收 3.专属目录 4.图像修复 5.gif2mp4 6.mp42gif 7.图像返回 三.服务测试 1.服务启动 2.服务调用 四.总结 一.引言 前面我们介绍了如何使用 Real-ESRGAN 进行图像增强并在原始格式 jpeg、jpg、mp4 的基础上…...

C#基础——构造函数、析构函数

C#基础——构造函数、析构函数 1、构造函数 构造函数是一种特殊的方法,用于在创建类的实例时进行初始化操作。构造函数与类同名,并且没有返回类型。 构造函数在对象创建时自动调用,可以用来设置对象的初始状态、分配内存、初始化字段等操作…...

jmeter 如何循环使用接口返回的多值?

有同学在用jmeter做接口测试的时候,经常会遇到这样一种情况: 就是一个接口请求返回了多个值,然后下一个接口想循环使用前一个接口的返回值。 这种要怎么做呢? 有一定基础的人,可能第一反应就是先提取前一个接口返回…...

VLAN 详解一(VLAN 基本原理及 VLAN 划分原则)

VLAN 详解一(VLAN 基本原理及 VLAN 划分原则) 在早期的交换网络中,网络中只有 PC、终端和交换机,当某台主机发送一个广播帧或未知单播帧时,该数据帧会被泛洪,甚至传递到整个广播域。而广播域越大&#xff…...

Android - 分区存储 MediaStore、SAF

官方页面 参考文章 一、概念 分区存储(Scoped Storage)的推出是针对 APP 访问外部存储的行为(乱建乱获取文件和文件夹)进行规范和限制,以减少混乱使得用户能更好的控制自己的文件。 公有目录被分为两大类:…...

Shiro框架权限控制

首先去通过配置类的用户认证,在用户认证完成后,进行用户授权,用户通过授权之后再跳转其他的界面时,会进行一个验证,当前账号是否有权限。 前端权限控制显示的原理 在前端中,通常使用用户的角色或权限信息来…...

centOS7 安装tailscale并启用子网路由

1、在centOS7上安装Tailscale客户端 #安装命令所在官网位置:https://tailscale.com/download/linux #具体命令为: curl -fsSL https://tailscale.com/install.sh | sh #命令执行后如下图所示2、设置允许IP转发和IP伪装。 安装后,您可以启动…...

spring 项目中如何处理跨越cors问题

1.使用 CrossOrigin 注解 作用于controller 方法上 示例如下 RestController RequestMapping("/account") public class AccountController {CrossOriginGetMapping("/{id}")public Account retrieve(PathVariable Long id) {// ...}DeleteMapping(&quo…...

importlib --- import 的实现

3.1 新版功能. 源代码 Lib/importlib/__init__.py 概述 importlib 包具有三重目标。 一是在 Python 源代码中提供 import 语句的实现(并且因此而扩展 __import__() 函数)。 这提供了一个可移植到任何 Python 解释器的 import 实现。 与使用 Python 以…...

【PyTorch】现代卷积神经网络

文章目录 1. 理论介绍1.1. 深度卷积神经网络(AlexNet)1.1.1. 概述1.1.2. 模型设计 1.2. 使用块的网络(VGG)1.3. 网络中的网络(NiN)1.4. 含并行连结的网络(GoogLeNet)1.5. 批量规范化…...

用python编写九九乘法表

1 问题 我们在学习一门语言的过程中,都会练习到编写九九乘法表这个代码,下面介绍如何编写九九乘法表的流程。 2 方法 (1)打开pycharm集成开发环境,创建一个python文件,并编写第一行代码,主要构建…...

Google Gemini 模型本地可视化

Google近期发布了Gemini模型,而且开放了Gemini Pro API,Gemini Pro 可免费使用! Gemini Pro支持全球180个国家的38种语言,目前接受文本、图片作为输入并生成文本作为输出。 Gemini Pro的表现超越了其他同类模型,当前版…...

数据修复:.BlackBit勒索病毒来袭,安全应对方法解析

导言: 黑色数字罪犯的新玩具——.BlackBit勒索病毒,近来成为网络安全领域的头号威胁。这种恶意软件以其高度隐秘性和毁灭性而引起广泛关注。下面是关于.BlackBit勒索病毒的详细介绍,如不幸感染这个勒索病毒,您可添加我们的技术服…...

拓扑排序实现循环依赖判断 | 京东云技术团队

本文记录如何通过拓扑排序,实现循环依赖判断 前言 一般提到循环依赖,首先想到的就是Spring框架提供的Bean的循环依赖检测,相关文档可参考: https://blog.csdn.net/cristianoxm/article/details/113246104 本文方案脱离Spring Be…...

Java的NIO工作机制

文章目录 1. 问题引入2. NIO的工作方式3. Buffer的工作方式4. NIO数据访问方式 1. 问题引入 在网络通信中,当连接已经建立成功,服务端和客户端都会拥有一个Socket实例,每个Socket实例都有一个InputStream和OutputStream,并通过这…...

一个简单的光线追踪渲染器

前言 本文参照自raytracing in one weekend教程,地址为:https://raytracing.github.io/books/RayTracingInOneWeekend.html 什么是光线追踪? 光线追踪模拟现实中的成像原理,通过模拟一条条直线在场景内反射折射,最终…...

C++学习笔记(十二)------is_a关系(继承关系)

你好,这里是争做图书馆扫地僧的小白。 个人主页:争做图书馆扫地僧的小白_-CSDN博客 目标:希望通过学习技术,期待着改变世界。 提示:以下是本篇文章正文内容,下面案例可供参考 文章目录 前言 一、继承关系…...

DC电源模块的设计与制造技术创新

BOSHIDA DC电源模块的设计与制造技术创新 DC电源模块的设计与制造技术创新主要涉及以下几个方面: 1. 高效率设计:传统的DC电源模块存在能量转换损耗较大的问题,技术创新可通过采用高效率的电路拓扑结构、使用高性能的功率开关器件和优化控制…...

Sketch for Mac:实现你的创意绘图梦想的矢量绘图软件

随着数字时代的到来,矢量绘图软件成为了广告设计、插画创作和UI设计等领域中必不可少的工具。在众多矢量绘图软件中,Sketch for Mac(矢量绘图软件)以其强大的功能和简洁的界面脱颖而出,成为了众多设计师的首选。 Sket…...

ReactNative0.73发布,架构升级与更好的调试体验

这次更新包含了多种提升开发体验的改进,包括: 更流畅的调试体验: 通过 Hermes 引擎调试支持、控制台日志历史记录和实验性调试器,让调试过程更加高效顺畅。稳定的符号链接支持: 简化您的开发工作流程,轻松将文件或目录链接到其他…...

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道(多模态 OCR → 语义检索 → 答案渲染)、两级检索(倒排 BM25 向量 HNSW)并以大语言模型兜底”的整体框架: 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后,分别用…...

51c自动驾驶~合集58

我自己的原文哦~ https://blog.51cto.com/whaosoft/13967107 #CCA-Attention 全局池化局部保留,CCA-Attention为LLM长文本建模带来突破性进展 琶洲实验室、华南理工大学联合推出关键上下文感知注意力机制(CCA-Attention),…...

Qt/C++开发监控GB28181系统/取流协议/同时支持udp/tcp被动/tcp主动

一、前言说明 在2011版本的gb28181协议中,拉取视频流只要求udp方式,从2016开始要求新增支持tcp被动和tcp主动两种方式,udp理论上会丢包的,所以实际使用过程可能会出现画面花屏的情况,而tcp肯定不丢包,起码…...

UDP(Echoserver)

网络命令 Ping 命令 检测网络是否连通 使用方法: ping -c 次数 网址ping -c 3 www.baidu.comnetstat 命令 netstat 是一个用来查看网络状态的重要工具. 语法:netstat [选项] 功能:查看网络状态 常用选项: n 拒绝显示别名&#…...

《用户共鸣指数(E)驱动品牌大模型种草:如何抢占大模型搜索结果情感高地》

在注意力分散、内容高度同质化的时代,情感连接已成为品牌破圈的关键通道。我们在服务大量品牌客户的过程中发现,消费者对内容的“有感”程度,正日益成为影响品牌传播效率与转化率的核心变量。在生成式AI驱动的内容生成与推荐环境中&#xff0…...

让AI看见世界:MCP协议与服务器的工作原理

让AI看见世界:MCP协议与服务器的工作原理 MCP(Model Context Protocol)是一种创新的通信协议,旨在让大型语言模型能够安全、高效地与外部资源进行交互。在AI技术快速发展的今天,MCP正成为连接AI与现实世界的重要桥梁。…...

项目部署到Linux上时遇到的错误(Redis,MySQL,无法正确连接,地址占用问题)

Redis无法正确连接 在运行jar包时出现了这样的错误 查询得知问题核心在于Redis连接失败,具体原因是客户端发送了密码认证请求,但Redis服务器未设置密码 1.为Redis设置密码(匹配客户端配置) 步骤: 1).修…...

【Nginx】使用 Nginx+Lua 实现基于 IP 的访问频率限制

使用 NginxLua 实现基于 IP 的访问频率限制 在高并发场景下,限制某个 IP 的访问频率是非常重要的,可以有效防止恶意攻击或错误配置导致的服务宕机。以下是一个详细的实现方案,使用 Nginx 和 Lua 脚本结合 Redis 来实现基于 IP 的访问频率限制…...

免费数学几何作图web平台

光锐软件免费数学工具,maths,数学制图,数学作图,几何作图,几何,AR开发,AR教育,增强现实,软件公司,XR,MR,VR,虚拟仿真,虚拟现实,混合现实,教育科技产品,职业模拟培训,高保真VR场景,结构互动课件,元宇宙http://xaglare.c…...

day36-多路IO复用

一、基本概念 (服务器多客户端模型) 定义:单线程或单进程同时监测若干个文件描述符是否可以执行IO操作的能力 作用:应用程序通常需要处理来自多条事件流中的事件,比如我现在用的电脑,需要同时处理键盘鼠标…...