当前位置：首页 > article >正文

要完成使用MLflow比较模型运行、选择模型并将其部署到REST API的教程

article 2026/5/6 21:02:49

要完成使用MLflow比较模型运行、选择模型并将其部署到REST API的教程，请按照以下有序步骤操作：

设置环境
- 导出MLflow跟踪URI：设置环境变量以指向您的MLflow跟踪服务。
- export MLFLOW_TRACKING_URI=your-organization's-MLflow-server-url

加载数据和预处理

读取数据集：使用pandas读取包含数据集的CSV文件。

import pandas as pd
data = pd.read_csv('https://raw.githubusercontent.com/mlflow/tutorials/main/quickstarts/lf/mm%2Ecsv', sep=';')

划分数据：将数据集分为训练集、验证集和测试集。

from sklearn.model_selection import train_test_split
train_ratio = 0.7
val_ratio = 0.2
test_ratio = 0.1
train, temp = train_test_split(data, test_size=(val_ratio + test_ratio), random_state=42)
train_x, train_y = train.drop(['quality'], axis=1).values, train['quality'].values.ravel()
valid_x, valid_y = temp.drop(['quality'], axis=1).values, temp['quality'].values.ravel()
X_train, y_train = train_x, train_y
X_valid, y_valid = valid_x, valid_y
# 注意：X_test, y_test在示例中未直接定义，应从temp中进一步划分得到

定义模型架构

神经网络模型：创建一个具有适当层的顺序模型并进行编译。

import keras
from keras.layers import Dense, Normalization
from tensorflow.keras.optimizers import SGDdef create_model(hp):model = keras.Sequential([keras.Input(shape=(len(X_train[0], ))),keras.layers.Normalization(axis=-1),keras.layers.Dense(units=hp.get('units'), activation='relu'),keras.layers.Dense(1)])model.compile(optimizer=SGD(learning_rate=hp.get('learning_rate'), momentum=hp.get('momentum')),loss='mse',metrics=[keras.metrics.RootMeanSquareError()])return model

超参数搜索的目标函数

函数定义：将模型训练包装在MLflow的start_run()上下文管理器内。

def objective(params):with mlflow.start_run(nested=True):model = create_model(params)history = model.fit(X_train, y_train, epochs=params['epochs'], validation_data=(X_valid, y_valid))score = model.evaluate(X_test, y_test, verbose=0)return {'loss': float(score[1]), 'params': params}

执行超参数搜索

使用HyperOpt：利用hypertune模块执行搜索。

import hpbandster as hp
import numpy as npspace = {'learning_rate': hp.uniform('lr', 0.001, 0.1),'momentum': hp.uniform('mom', 0.0, 1.0),'epoch': hp.randint('epoch', low=2, high=10, qstep=1)
}
study = hp.BayesStudy(space, objective)
results = []
max_trials = 10
for i in range(max_trials):print(f'Trial {i+1}/{max_trials}')config = study.suggest()# 注意：study trial i+1 应该是 study.evaluate(objective, config) 或类似调用，示例中存在笔误res = objective(config)results.append(res)

选择最佳模型运行

分析结果：根据记录的指标确定表现最佳的运行。

min_loss = min([res['loss'] for res in results])
best_index = [idx for idx, res in enumerate(results) if res['loss'] == min_loss][0]
best_config = results[best_index]['params']
print(f'Best configuration: {best_config}')

记录和部署最佳模型

记录参数和指标：捕获最佳运行的关键见解。

with mlflow.start_run():mlflow.set_params(best_config)mlflow.log_metrics({'rmse': min_loss})

保存和容器化：构建封装最终模型的Docker镜像。

mlflow models build-docker --model-uri=models:/wine_quality/1 --name=qsp

创建REST API端点：使用Docker容器将模型对外提供服务。

docker run -e MODEL_NAME=wine_quality --env Leasing:1000 qsp:latest -p 5002:8080
curl -d '{}' -H "Content-Type: application/json" -X POST localhost:5002/invocations

最终步骤
- 评估性能：使用样本输入测试端点，确保预测结果与预期输出一致。
- 记录与分享：为利益相关者提供详细解释和更新。

通过系统地应用这些步骤，您可以有效地利用MLflow来简化实验、自动化模型开发，并促进可扩展的部署流程。

要完成使用MLflow比较模型运行、选择模型并将其部署到REST API的教程

要完成使用MLflow比较模型运行、选择模型并将其部署到REST API的教程，请按照以下有序步骤操作： 设置环境导出MLflow跟踪URI：设置环境变量以指向您的MLflow跟踪服务。export MLFLOW_TRACKING_URIyour-organizations-MLflow-server-url 加载数…...

编程日记 2026/3/22 7:00:23

Windows Docker笔记-简介摘录

Docker是一个开源的容器化平台，可以帮助开发人员将应用程序与其依赖项打包在一个独立的容器中，然后在任何安装的Docker的环境中快速、可靠地运行。几个基本概念和优势： 容器：容器是一个轻量级、独立的运行环境，包含了…...

编程日记 2026/4/11 17:44:17

MVC 文件夹：架构之美与实际应用

MVC 文件夹：架构之美与实际应用引言 MVC（Model-View-Controller）是一种设计模式，它将应用程序分为三个核心组件：模型（Model）、视图（View）和控制器（Controller）。这种架构模式不仅提高了代码的可维护性和可扩展性，而且使得开发流程更加清晰。本文将深入探讨MVC文…...

编程日记 2026/4/8 4:56:14

AI透明化与全球政治格局的发展：如何避免AI被人为操控

在现代社会，人工智能（AI）已经逐渐渗透到我们的日常生活中，尤其是在社交平台和信息传播领域。虽然AI可以极大地推动社会发展，但也潜藏着被恶意操控的风险。最令人担忧的是，某些势力可能通过操控AI来操控公众…...

编程日记 2026/4/11 4:15:10

ubuntu 网络管理--wpa_supplicant、udhcpc

ubuntu 网络管理--wpa_supplicant 1 介绍wpa_supplicant 无线认证wpa_passphrase 配置工具 NetworkManager 网络管理udhcpc 与 dhclient对比dhclient概述主要功能 udhcpc概述主要功能 2 联系依赖关系配置文件 3 区别4 如何选择5 示例使用 wpa_supplicant 手动连接无线网络使用 …...

编程日记 2026/3/12 6:56:53

熟练掌握Http协议

目录基本概念请求数据Get请求方式和Post请求方式响应数据响应状态码基本概念 Http协议全称超文本传输协议(HyperText Transfer Protocol)，是网络通信中应用层的协议，规定了浏览器和web服务器数据传输的格式和规则 Http应用层协议具有以下特点&#…...

编程日记 2026/4/26 12:01:55

C++的 I/O 流

本文把复杂的基类和派生类的作用和关系捋出来，具体的接口请参考相关文档 C的 I/O 流相关的类，继承关系如下图所示 https://zh.cppreference.com/w/cpp/io I / O 的概念：内存和外设进行数据交互称为 I / O ，例如：把数…...

编程日记 2026/4/30 23:34:26

寒假刷题Day22

一、2570. 合并两个二维数组 - 求和法 class Solution { public:vector<vector<int>> mergeArrays(vector<vector<int>>& nums1, vector<vector<int>>& nums2) {int i 0, j 0, n1 nums1.size(), n2 nums2.size();int tmp 0;…...

编程日记 2025/12/18 8:53:42

【PDF多区域识别】如何批量PDF指定多个区域识别改名，基于Windows自带的UWP的文字识别实现方案

海关在对进口货物进行查验时，需要核对报关单上的各项信息。对报关单 PDF 批量指定区域识别改名后，海关工作人员可以更高效地从文件名中获取关键信息，如货物来源地、申报价值等。例如文件名 “[原产国]_[申报价值].pdf”，有助于海关快速筛选重点查验对象，提高查验效率和监管…...

编程日记 2026/5/4 9:50:55

【大数据技术】本机PyCharm远程连接虚拟机Python

本机PyCharm远程连接虚拟机Python 注意：本文需要使用PyCharm专业版。 pycharm-professional-2024.1.4VMware Workstation Pro 16CentOS-Stream-10-latest-x86_64-dvd1.iso写在前面本文主要介绍如何使用本地PyCharm远程连接虚拟机，运行Python脚本，提高编程效率。注意： …...

编程日记 2026/4/26 12:00:08

Windows图形界面(GUI)-QT-C/C++ - Qt Combo Box

公开视频 -> 链接点击跳转公开课程博客首页 -> 链接点击跳转博客主页目录一、概述 1.1 基本概念 1.2 应用场景对比二、核心属性详解 2.1 行为控制 2.2 显示配置三、数据操作与访问 3.1 基础数据管理 3.2 高级数据访问四、用户交互处理 4.1 信号处…...

编程日记 2026/4/7 6:18:54

数字化转型：概念性名词浅谈（第四讲）

大家好，本篇文章是在新年之际写的，所以在这里先给大家拜个年。今天要介绍的名词为ETL: ETL，是英文Extract-Transform-Load的缩写，用来描述将数据从来源端经过抽取（extract）、转换（transfor…...

编程日记 2026/4/28 16:06:31

标题：市场波动中的价格趋势分析与策略优化

在市场投资中，价格的波动不仅是常态，更是影响投资决策的关键因素。市场价格的变化受多种因素影响，包括供需关系、政策调整、国际市场动态等。如何理解价格走势，并在其中寻找合适的交易机会，是投资者需要长期研究的课题…...

编程日记 2026/4/10 8:20:53

【HarmonyOS之旅】基于ArkTS开发(三) -＞兼容JS的类Web开发(四) -＞常见组件(一)

目录 1 -> List 1.1 -> 创建List组件 1.2 -> 添加滚动条 1.3 -> 添加侧边索引栏 1.4 -> 实现列表折叠和展开 1.5 -> 场景示例 2 -> dialog 2.1 -> 创建Dialog组件 2.2 -> 设置弹窗响应 2.3 -> 场景示例 3 -> form 3.1 -> 创建…...

编程日记 2026/4/25 15:31:29

Linux：文件系统（软硬链接）

目录 inode ext2文件系统 Block Group 超级块（Super Block） GDT（Group Descriptor Table） 块位图（Block Bitmap） inode位图（Inode Bitmap） i节点表（inode Tabl…...

编程日记 2026/4/30 13:13:19

深度学习系列--01.入门

一.深度学习概念深度学习（Deep Learning）是机器学习的分支，是指使用多层的神经网络进行机器学习的一种手法抖音百科。它学习样本数据的内在规律和表示层次，最终目标是让机器能够像人一样具有分析学习能力，能够识别文字…...

编程日记 2026/4/26 12:00:09

如何抓取酒店列表：揭开秘密

搜索酒店列表是一种强大的工具，可以从各种在线资源中收集有关住宿、价格和可用性的综合数据。无论您是要比较价格、分析市场趋势，还是要创建个性化的旅行计划，搜索都能让您有效地汇编所需的信息。在本文中，我们将介绍如何搜索酒店…...

编程日记 2026/5/4 16:02:12

深度剖析 C++17 中的 std::byte：解锁字节级编程新境界

文章目录一、引入背景二、基本定义三、特性详解不可隐式转换为整型显式转换为unsigned char位运算支持字面量支持四、使用场景内存操作数据序列化与反序列化网络通信文件读写操作五、与其他数据类型的交互与字符类型的交互与整数类型的交互与指针类型的交互六、注意事项避免混…...

编程日记 2026/5/5 5:04:00

【多线程】线程池核心数到底如何配置？

🥰🥰🥰来都来了，不妨点个关注叭！ 👉博客主页：欢迎各位大佬!👈 文章目录 1. 前置回顾2. 动态线程池2.1 JMX 的介绍2.1.1 MBeans 介绍 2.2 使用 JMX jconsole 实现动态修改线程池2.2.…...

编程日记 2026/5/4 23:45:03

Lecture 6 SH for diffuse transport Lecture 7关于 SH for glossy transport 三维空间全局光照 diffuse case和glossy case的区别在Lambertian模型中，BRDF是一个常数 diffuse case 跟outgoing point无关 glossy case 跟outgoing point有关 （Gloss…...

编程日记 2026/5/6 13:29:45

通过C/C++编程语言实现“数据结构”课程中的链表

引言链表（Linked List）是数据结构中最基础且最重要的线性存储结构之一。与数组的连续内存分配不同，链表通过指针将分散的内存块串联起来，具有动态扩展和高效插入/删除的特性。本文将以C/C++语言为例，从底层原理到代码实现，手把手教你构建完整的链表结构，并深入探讨其应…...

编程日记 2026/2/25 2:36:02

Polardb三节点集群部署安装--附虚拟机

1. 架构 PolarDB-X 采用 Shared-nothing 与存储计算分离架构进行设计，系统由4个核心组件组成。计算节点（CN, Compute Node） 计算节点是系统的入口，采用无状态设计，包括 SQL 解析器、优化器、执行器等模块。负责数据…...

编程日记 2026/5/2 15:50:17

java s7接收Byte字节，接收word转16位二进制

1图： 2.图： try {List list getNameList();//接收base64S7Connector s7Connector S7ConnectorFactory.buildTCPConnector().withHost("192.168.46.52").withPort(102).withTimeout(1000) //连接超时时间.withRack(0).withSlot(3).build()…...

编程日记 2026/4/26 12:00:24