当前位置：首页 > news >正文

使用Flask实现本机的模型部署

news 2026/2/10 23:09:47

前言

模型部署是指将大模型运行在专属的计算资源上，使模型在独立的运行环境中高效、可靠地运行，并为业务应用提供推理服务。其目标是将机器学习模型应用于实际业务中，使最终用户或系统能够利用模型的输出，从而发挥其作用。

一、设置客户端

运行之前要先运行服务端
url里写入本机ip和端口，后面跟上端口名
以二进制形式读取图片创建payload字典
向上面的url服务器发送post请求，传入字典文件
将返回的json文件解析成字典

import requests# url和端口写成自己的端口
flask_url = "http://192.168.24.39:5012/predict"def predict_result(image_path):image = open(image_path, 'rb').read()payload = {'image': image}r = requests.post(flask_url, files=payload).json()# 向flask_url服务发送一个POST请求，并尝试将返回的JSON响应解析为一个字典。# print(r)if r["success"]:# 输出结果for (i, result) in enumerate(r['predictions']):print(f"{i + 1}.预测类别为{result['label']}:{result['probability']}")else:print('Request failed')if __name__ == '__main__':predict_result('./35/image_06975.jpg')

输出：

二、设置服务端

服务端初始化一个Flask对象，命名app
@app.route("/predict", methods=["POST"]) 定义了一个路由以POST方式发送到/predict的请求都会进入下方的函数
下方函数处理完之后返回flask.jsonify(data)，json文件

import io
import flask
import torch
import torch.nn.functional as F
from PIL import Image
from torch import nn
from torchvision import transforms, models, datasets# 初始化Flask app
app = flask.Flask(__name__)  # 创建一个新的Flask应用程序实例
# __name__参数通常被传递给FasK应用程序来定位应用程序的根路径,这样Flask就可以知道在哪里找到模板、静态文件等。
# 总体来说app = flask.Flask(__name__)是FLaSK应用程序的起点。它初始化了一个新的Flask应用程序实例。为后续添加路由、配置等奠定了基础model = None
use_gpu = False# 加载模块进来
def load_model():global model# 加载resnet18网络model = models.resnet18()num_ftrs = model.fc.in_featuresmodel.fc = nn.Sequential(nn.Linear(num_ftrs, 102))  # 输出神经元为类别数checkpoint = torch.load('best.pth')model.load_state_dict(checkpoint['state_dict'])model.eval()if use_gpu:model.cuda()# 数据预处理
def prepare_image(image, target_size):# 针对不同模型 image的格式不同 但需要统一到RGB格式if image.mode != 'RGB':image = image.convert('RGB')# (按照所使用的模型将输入图片的尺寸修改,并转为tensor)image = transforms.Resize(target_size)(image)image = transforms.ToTensor()(image)image = transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])(image)# 增加一个维度  用于batch测试image = image[None]  # torch 的写法if use_gpu:image = image.cuda()return torch.tensor(image)@app.route("/predict", methods=["POST"])
# @app.route("/predict")：
# 这部分定义了一个路由，表示当客户端发送请求到 /predict URL 时，Flask 应用会执行下方的处理函数。也就是说，任何访问 /predict 的请求都会被这个函数处理。
# methods=["POST"]：
# 这部分指定了允许的 HTTP 请求方法。methods=["POST"] 表示这个路由只接受 POST 请求。
def predict():# 做一个标志 刚开始无图像传入时为false 传入图像时为truedata = {'success': False}if flask.request.method == 'POST':  # 如果收到请求if flask.request.files.get("image"):  # 判断是否为图像image = flask.request.files["image"].read()  # 将收到的图像进行读取,内容为二进制image = Image.open(io.BytesIO(image))  # 将接收到的二进制图片转换成16进制  # 将二进制数据转换为图像对象# 利用上面的预处理函数将读入的图像进行预处理image = prepare_image(image, target_size=(224, 224))preds = F.softmax(model(image), dim=1)  # 得到各个类别的概率results = torch.topk(preds.cpu().data, k=3, dim=1)  # 概率最大的前3个结果# torch.topk用于返回输入张量中每行最大的k个元素及其对应的索引results = (results[0].cpu().numpy(), results[1].cpu().numpy())# 将data字典增加一个key,value,其中value为ist格式data['predictions'] = list()for prob, label in zip(results[0][0], results[1][0]):r = {"label": str(label), "probability": float(prob)}# 将预测结果添加至data字典data['predictions'].append(r)data["success"] = Truereturn flask.jsonify(data)  # 将最后结果以json格式文件传出if __name__ == '__main__':load_model()  # 先加载模型app.run(host='192.168.24.41', port='5012')  # 开启服务   服务器进入监听状态 等待用户发送信息# host 参数指定 IP 地址:# host = '127.0.0.1': 仅能从本机访问。# host = '0.0.0.0': 允许来自任何设备（网络）访问。# host = '192.168.24.41': 仅允许来自该特定IP地址的请求（通常是局域网内的某台设备）。# host = '127.0.0.1': 这表示Flask应用仅能在本机上访问。例如,只有在同一台计算机上打开浏览器,才能通过http: // 127.0.0.1: 5012 / 访问Flask应用。其他计算机无法通过这个IP访问。# host = '0.0.0.0': 这表示Flask应用会监听来自任何网络接口的请求,适用于让其他设备（比如局域网内的其他设备）也能访问该应用。通过局域网访问时,其他设备可以使用http: // < 你的局域网IP >: 5012 / 访问。# host = '192.168.24.41': 这意味着Flask仅监听来自该特定IP地址（通常是局域网IP）的请求。如果你在局域网中,其他设备可以使用http: // 192.168.24.41: 5012 / 访问。

输出：

如果最后的状态码是200，证明请求成功

使用Flask实现本机的模型部署

前言模型部署是指将大模型运行在专属的计算资源上，使模型在独立的运行环境中高效、可靠地运行，并为业务应用提供推理服务。其目标是将机器学习模型应用于实际业务中，使最终用户或系统能够利用模型的输出，从而发挥其作用。一、设…...

编程日记 2024/10/22 6:04:45

基于SSM的校园跑腿网站的设计与实现

文未可获取一份本项目的java源码和数据库参考。课题来源及研究的目的和意义随着网络技术的不断完善与发展，各种互联网公司不断如雨后春笋般不断涌现，丰富了人们生活的各个方面。近年来由于 Online To 0ffline即线上到线下(020)模式的发展和兴起&…...

编程日记 2024/10/22 6:03:43

【Java】正则表达式详解

目录引言一、基本概念 1.1 元字符 1.2 预定义字符类 1.3 边界匹配符 1.4 数量标识符 1.5 捕获与非捕获分组二、Java中的正则表达式支持三、正则表达式的使用示例 3.1 匹配字符串 3.2 替换字符串 3.3 分割字符串 3.4 使用Pattern和Matcher 3.5 捕获组和后向…...

编程日记 2024/10/22 6:02:42

Java知识巩固(七)

目录面向对象面向对象三大特征封装继承多态多态深拷贝和浅拷贝区别了解吗?什么是引用拷贝? 浅拷贝深拷贝面向对象万物皆为对象，也就是描述某个事物解决问题的过程中所发生的事情。面向对象三大特征封装封装是指把一个对象的状态信息&…...

编程日记 2024/10/22 5:59:40

Ubuntu22.04 更换网易163源 1、编辑/etc/apt/sources.list文件 1 sudo nano /etc/apt/sources.list 2、清空文件内容，拷贝下列163源到文本。 1 2 3 4 5 6 7 8 deb http://mirrors.163.com/ubuntu/ jammy main restricted universe multiverse deb http://mirro…...

编程日记 2024/10/22 5:58:39

江恩理论和波浪理论的结合

结合波浪理论和江恩理论需要综合考虑市场波动的形态以及时间和价格的关系。这两者都是技术分析中的重要工具，能够帮助投资者更好地理解市场的趋势和未来的走势。波浪理论（Elliott Wave Theory） 波浪理论是由Ralph Nelson Elliott提出的&…...

编程日记 2024/10/22 5:54:35

AJAX——AJAX 取消请求

利用 abort（）方法取消请求本文分享到此结束，欢迎大家评论区相互讨论学习，下一篇继续分享AJAX中请求重复发送问题的学习。...

编程日记 2024/10/22 5:53:34

ruoyi域名跳转缓存冲突问题（解决办法修改：session名修改session的JSESSIONID名称）

编程日记 2024/10/22 5:52:33

嵌入式QT中基本工程模板分析

大家好，今天主要来分享一下，如何分析一下QT的工程代码文件。第一：QT工程分析...

编程日记 2024/10/22 5:47:28

Linux网络：UDP socket - 简单聊天室

Linux网络：UDP socket - 简单聊天室聊天通信架构ServerInetAddrUdpServerMessageRoutermain Client测试聊天通信架构本博客基于Linux实现一个简单的聊天通信服务，以熟悉Linux的网络接口。总代码地址：[UDPsocket-简单聊天通信] 文件结构…...

编程日记 2024/10/22 5:45:26

Codeforces Round 646 (Div. 2) E. Tree Shuffling（树，贪心）

题目链接 Codeforces Round 646 (Div. 2) E. Tree Shuffling 思路考虑一个节点 u u u，显然它子树中的操作可以由它本身和祖先来进行。如果它的祖先有比它花费更小的，直接跳过节点 u u u。我们分别记录每一个子树中位置不对的 0 0 0和 1 1 1的个数&…...

编程日记 2024/10/22 5:44:24

HCIE-Datacom题库_11_IPsecVPN【17道题】

一、单选题 1.IPsecSA(SecurityAssociation，安全联盟)有两种生成方式，分别是手工方式和IKE自动协商方式，以下关于这两种方式的描述中，错误的是哪一项? 手工方式和IKE方式建立的SA都支持动态刷新 IKE方式建立的SA,其生存周期由…...

编程日记 2024/10/22 5:42:21

Dongle Sentinal在Jenkins下访问不了的问题

背景： 工作站部署的jenkins的脚本无法正常打包，定位后发现是本地获取不了license，但是使用usb over network的远程license都能获取并正常打包分析： 获取不了license的原因是本地无法识别dongle。根据提供信息，之前…...

编程日记 2024/10/22 5:39:19

X射线衍射（X-ray Diffraction，XRD）小白版

文章目录实验过程原理晶体构成X射线波长diffraction 干涉效应 Braggs Law晶体间距d散射角度θ半波长λ/2公式公式名称由来应用设备实验过程 In the X-ray experiment , a sample is placed into the center of an instrument and illuminated with a beam of X-rays. 在X射…...

编程日记 2024/10/22 5:38:18

Nordic 定时器系统app timer[获取时间戳]

获取时间戳想要在Nordic 定时器系统中获取时间戳,也就是是在调用app_timer的时候时间戳要有效,我们可以看看定时器系统初始化: ret_code_t app_timer_init(void) {ret_code_t err_code;drv_rtc_config_t config {.prescaler APP_TIMER_CONFIG_RTC_FREQUENCY,.int…...

编程日记 2024/10/22 5:37:17

【Linux】实验：mkdir 命令、 tee 命令

#1024程序员节｜征文# 1.命令说明本文主要实验 linux 的两个命令：mkdir -p 路径、 tee 创建文件。命令：mkdir -p 路径说明：该命令将自动创建路径下的目录及子目录，结尾可以/ 也可以不带/，默认都是建文…...

编程日记 2024/10/22 5:36:16

asp.net core mvc发布时输出视图文件Views

var builder WebApplication.CreateBuilder(args); builder.Services.AddRazorPages();builder.Services.AddControllersWithViews(ops > {//全局异常过滤器，注册ops.Filters.Add<ExceptionFilter>(); })// Views视图文件输出到发布目录，视图文…...

编程日记 2024/10/22 5:34:14

服务器模块测试

目录测试逻辑测试工具测试测试逻辑我们可以使用一个简单的业务处理逻辑来进行测试。最简单的，我们业务逻辑就直接返回一个固定的字符串 void Message(const PtrConnection&con,Buffer* inbuffer) //模拟用户新数据回调 {inbuffer->MoveReadOf…...

编程日记 2024/10/22 5:33:13

ATTCK 框架讲解

摘要 ATT&CK框架作为MITRE公司开发的网络攻击行为知识库，自2015年发布以来，已成为信息安全领域的重要工具。该框架通过提炼和归纳真实世界中的网络威胁事件，以攻击者的视角构建了一套系统化的战术和技术分类体系。本文详细阐述了ATT&…...

编程日记 2024/10/22 5:32:12

ADC在STM32F1系列的使用详解

目录 1. ADC简介 2. 逐次逼近型ADC（ADC0809） 3. ADC框图（STM32） 4. ADC基本结构 5. 输入通道 6. 转换模式 6.1 单次转换 6.1.1 非扫描模式 6.1.2 扫描模式 6.2 连续转换 6.2.1 非扫描模式 6.2.2 扫描模式…...

编程日记 2024/10/22 5:31:10

C++：std::is_convertible

C++标志库中提供is_convertible，可以测试一种类型是否可以转换为另一只类型： template <class From, class To> struct is_convertible; 使用举例： #include <iostream> #include <string>using namespace std;struct A { }; struct B : A { };int main…...

编程新知 2025/6/11 15:23:57

STM32标准库-DMA直接存储器存取

文章目录一、DMA1.1简介1.2存储器映像1.3DMA框图1.4DMA基本结构1.5DMA请求1.6数据宽度与对齐1.7数据转运DMA1.8ADC扫描模式DMA 二、数据转运DMA2.1接线图2.2代码2.3相关API 一、DMA 1.1简介 DMA（Direct Memory Access）直接存储器存取 DMA可以提供外设…...

编程新知 2026/1/26 10:55:51

Qt Http Server模块功能及架构

Qt Http Server 是 Qt 6.0 中引入的一个新模块，它提供了一个轻量级的 HTTP 服务器实现，主要用于构建基于 HTTP 的应用程序和服务。功能介绍： 主要功能 HTTP服务器功能： 支持 HTTP/1.1 协议简单的请求/响应处理模型支持 GET…...

编程新知 2025/10/17 21:16:57

python爬虫：Newspaper3k 的详细使用（好用的新闻网站文章抓取和解析的Python库）

更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录一、Newspaper3k 概述1.1 Newspaper3k 介绍1.2 主要功能1.3 典型应用场景1.4 安装二、基本用法2.2 提取单篇文章的内容2.2 处理多篇文档三、高级选项3.1 自定义配置3.2 分析文章情感四、实战案例4.1 构建新闻摘要聚合器…...

编程新知 2025/10/25 7:51:48

第 86 场周赛：矩阵中的幻方、钥匙和房间、将数组拆分成斐波那契序列、猜猜这个单词

Q1、[中等] 矩阵中的幻方 1、题目描述 3 x 3 的幻方是一个填充有从 1 到 9 的不同数字的 3 x 3 矩阵，其中每行，每列以及两条对角线上的各数之和都相等。给定一个由整数组成的row x col 的 grid，其中有多少个 3 3 的 “幻方” 子矩阵&am…...

编程新知 2026/2/7 13:27:36

网络编程（UDP编程）

思维导图 UDP基础编程（单播） 1.流程图服务器：短信的接收方创建套接字 (socket)-----------------------------------------》有手机指定网络信息-----------------------------------------------》有号码绑定套接字 (bind)--------------…...

编程新知 2026/2/4 17:31:44

Web 架构之 CDN 加速原理与落地实践

文章目录一、思维导图二、正文内容（一）CDN 基础概念1. 定义2. 组成部分 （二）CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 （三）CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 &#xf…...

编程新知 2025/9/13 16:17:01

10-Oracle 23 ai Vector Search 概述和参数

一、Oracle AI Vector Search 概述企业和个人都在尝试各种AI，使用客户端或是内部自己搭建集成大模型的终端，加速与大型语言模型（LLM）的结合，同时使用检索增强生成（Retrieval Augmented Generation &#…...

编程新知 2026/2/9 20:30:28

QT3D学习笔记——圆台、圆锥

类名作用Qt3DWindow3D渲染窗口容器QEntity场景中的实体（对象或容器）QCamera控制观察视角QPointLight点光源QConeMesh圆锥几何网格QTransform控制实体的位置/旋转/缩放QPhongMaterialPhong光照材质（定义颜色、反光等）QFirstPersonC…...

编程新知 2026/1/29 5:26:37

Java求职者面试指南：计算机基础与源码原理深度解析

Java求职者面试指南：计算机基础与源码原理深度解析第一轮提问：基础概念问题 1. 请解释什么是进程和线程的区别？ 面试官：进程是程序的一次执行过程，是系统进行资源分配和调度的基本单位；而线程是进程中的…...

编程新知 2025/12/9 14:22:07

使用Flask实现本机的模型部署

前言

一、设置客户端

二、设置服务端

相关文章：

使用Flask实现本机的模型部署

基于SSM的校园跑腿网站的设计与实现

【Java】正则表达式详解

Java知识巩固(七)

Ubuntu22.04 更换源

江恩理论和波浪理论的结合

AJAX——AJAX 取消请求

ruoyi域名跳转缓存冲突问题（解决办法修改：session名修改session的JSESSIONID名称）

嵌入式QT中基本工程模板分析

Linux网络：UDP socket - 简单聊天室

Codeforces Round 646 (Div. 2) E. Tree Shuffling（树，贪心）

HCIE-Datacom题库_11_IPsecVPN【17道题】

Dongle Sentinal在Jenkins下访问不了的问题

X射线衍射（X-ray Diffraction，XRD）小白版

Nordic 定时器系统app timer[获取时间戳]

【Linux】实验：mkdir 命令、 tee 命令

asp.net core mvc发布时输出视图文件Views

服务器模块测试

ATTCK 框架讲解

ADC在STM32F1系列的使用详解

C++：std::is_convertible

STM32标准库-DMA直接存储器存取

Qt Http Server模块功能及架构

python爬虫：Newspaper3k 的详细使用（好用的新闻网站文章抓取和解析的Python库）

第 86 场周赛：矩阵中的幻方、钥匙和房间、将数组拆分成斐波那契序列、猜猜这个单词

网络编程（UDP编程）

Web 架构之 CDN 加速原理与落地实践

10-Oracle 23 ai Vector Search 概述和参数

QT3D学习笔记——圆台、圆锥

Java求职者面试指南：计算机基础与源码原理深度解析