当前位置: 首页 > article >正文

要完成使用MLflow比较模型运行、选择模型并将其部署到REST API的教程

要完成使用MLflow比较模型运行、选择模型并将其部署到REST API的教程,请按照以下有序步骤操作:

  1. 设置环境

    • 导出MLflow跟踪URI:设置环境变量以指向您的MLflow跟踪服务。
    • export MLFLOW_TRACKING_URI=your-organization's-MLflow-server-url
  2. 加载数据和预处理

    • 读取数据集:使用pandas读取包含数据集的CSV文件。
      import pandas as pd
      data = pd.read_csv('https://raw.githubusercontent.com/mlflow/tutorials/main/quickstarts/lf/mm%2Ecsv', sep=';')
      
    • 划分数据:将数据集分为训练集、验证集和测试集。
      from sklearn.model_selection import train_test_split
      train_ratio = 0.7
      val_ratio = 0.2
      test_ratio = 0.1
      train, temp = train_test_split(data, test_size=(val_ratio + test_ratio), random_state=42)
      train_x, train_y = train.drop(['quality'], axis=1).values, train['quality'].values.ravel()
      valid_x, valid_y = temp.drop(['quality'], axis=1).values, temp['quality'].values.ravel()
      X_train, y_train = train_x, train_y
      X_valid, y_valid = valid_x, valid_y
      # 注意:X_test, y_test在示例中未直接定义,应从temp中进一步划分得到
      
  3. 定义模型架构

    • 神经网络模型:创建一个具有适当层的顺序模型并进行编译。
      import keras
      from keras.layers import Dense, Normalization
      from tensorflow.keras.optimizers import SGDdef create_model(hp):model = keras.Sequential([keras.Input(shape=(len(X_train[0], ))),keras.layers.Normalization(axis=-1),keras.layers.Dense(units=hp.get('units'), activation='relu'),keras.layers.Dense(1)])model.compile(optimizer=SGD(learning_rate=hp.get('learning_rate'), momentum=hp.get('momentum')),loss='mse',metrics=[keras.metrics.RootMeanSquareError()])return model
      
  4. 超参数搜索的目标函数

    • 函数定义:将模型训练包装在MLflow的start_run()上下文管理器内。
      def objective(params):with mlflow.start_run(nested=True):model = create_model(params)history = model.fit(X_train, y_train, epochs=params['epochs'], validation_data=(X_valid, y_valid))score = model.evaluate(X_test, y_test, verbose=0)return {'loss': float(score[1]), 'params': params}
      
  5. 执行超参数搜索

    • 使用HyperOpt:利用hypertune模块执行搜索。
      import hpbandster as hp
      import numpy as npspace = {'learning_rate': hp.uniform('lr', 0.001, 0.1),'momentum': hp.uniform('mom', 0.0, 1.0),'epoch': hp.randint('epoch', low=2, high=10, qstep=1)
      }
      study = hp.BayesStudy(space, objective)
      results = []
      max_trials = 10
      for i in range(max_trials):print(f'Trial {i+1}/{max_trials}')config = study.suggest()# 注意:study trial i+1 应该是 study.evaluate(objective, config) 或类似调用,示例中存在笔误res = objective(config)results.append(res)
      
  6. 选择最佳模型运行

    • 分析结果:根据记录的指标确定表现最佳的运行。
      min_loss = min([res['loss'] for res in results])
      best_index = [idx for idx, res in enumerate(results) if res['loss'] == min_loss][0]
      best_config = results[best_index]['params']
      print(f'Best configuration: {best_config}')
      
  7. 记录和部署最佳模型

    • 记录参数和指标:捕获最佳运行的关键见解。
      with mlflow.start_run():mlflow.set_params(best_config)mlflow.log_metrics({'rmse': min_loss})
      
    • 保存和容器化:构建封装最终模型的Docker镜像。
      mlflow models build-docker --model-uri=models:/wine_quality/1 --name=qsp
      
    • 创建REST API端点:使用Docker容器将模型对外提供服务。
      docker run -e MODEL_NAME=wine_quality --env Leasing:1000 qsp:latest -p 5002:8080
      curl -d '{}' -H "Content-Type: application/json" -X POST localhost:5002/invocations
      
  8. 最终步骤

    • 评估性能:使用样本输入测试端点,确保预测结果与预期输出一致。
    • 记录与分享:为利益相关者提供详细解释和更新。

通过系统地应用这些步骤,您可以有效地利用MLflow来简化实验、自动化模型开发,并促进可扩展的部署流程。

相关文章:

要完成使用MLflow比较模型运行、选择模型并将其部署到REST API的教程

要完成使用MLflow比较模型运行、选择模型并将其部署到REST API的教程,请按照以下有序步骤操作: 设置环境 导出MLflow跟踪URI:设置环境变量以指向您的MLflow跟踪服务。export MLFLOW_TRACKING_URIyour-organizations-MLflow-server-url 加载数…...

Windows Docker笔记-简介摘录

Docker是一个开源的容器化平台,可以帮助开发人员将应用程序与其依赖项打包在一个独立的容器中,然后在任何安装的Docker的环境中快速、可靠地运行。 几个基本概念和优势: 容器:容器是一个轻量级、独立的运行环境,包含了…...

MVC 文件夹:架构之美与实际应用

MVC 文件夹:架构之美与实际应用 引言 MVC(Model-View-Controller)是一种设计模式,它将应用程序分为三个核心组件:模型(Model)、视图(View)和控制器(Controller)。这种架构模式不仅提高了代码的可维护性和可扩展性,而且使得开发流程更加清晰。本文将深入探讨MVC文…...

AI透明化与全球政治格局的发展:如何避免AI被人为操控

在现代社会,人工智能(AI)已经逐渐渗透到我们的日常生活中,尤其是在社交平台和信息传播领域。虽然AI可以极大地推动社会发展,但也潜藏着被恶意操控的风险。最令人担忧的是,某些势力可能通过操控AI来操控公众…...

ubuntu 网络管理--wpa_supplicant、udhcpc

ubuntu 网络管理--wpa_supplicant 1 介绍wpa_supplicant 无线认证wpa_passphrase 配置工具 NetworkManager 网络管理udhcpc 与 dhclient对比dhclient概述主要功能 udhcpc概述主要功能 2 联系依赖关系配置文件 3 区别4 如何选择5 示例使用 wpa_supplicant 手动连接无线网络使用 …...

熟练掌握Http协议

目录 基本概念请求数据Get请求方式和Post请求方式 响应数据响应状态码 基本概念 Http协议全称超文本传输协议(HyperText Transfer Protocol),是网络通信中应用层的协议,规定了浏览器和web服务器数据传输的格式和规则 Http应用层协议具有以下特点&#…...

C++的 I/O 流

本文把复杂的基类和派生类的作用和关系捋出来,具体的接口请参考相关文档 C的 I/O 流相关的类,继承关系如下图所示 https://zh.cppreference.com/w/cpp/io I / O 的概念:内存和外设进行数据交互称为 I / O ,例如:把数…...

寒假刷题Day22

一、2570. 合并两个二维数组 - 求和法 class Solution { public:vector<vector<int>> mergeArrays(vector<vector<int>>& nums1, vector<vector<int>>& nums2) {int i 0, j 0, n1 nums1.size(), n2 nums2.size();int tmp 0;…...

【PDF多区域识别】如何批量PDF指定多个区域识别改名,基于Windows自带的UWP的文字识别实现方案

海关在对进口货物进行查验时,需要核对报关单上的各项信息。对报关单 PDF 批量指定区域识别改名后,海关工作人员可以更高效地从文件名中获取关键信息,如货物来源地、申报价值等。例如文件名 “[原产国]_[申报价值].pdf”,有助于海关快速筛选重点查验对象,提高查验效率和监管…...

【大数据技术】本机PyCharm远程连接虚拟机Python

本机PyCharm远程连接虚拟机Python 注意:本文需要使用PyCharm专业版。 pycharm-professional-2024.1.4VMware Workstation Pro 16CentOS-Stream-10-latest-x86_64-dvd1.iso写在前面 本文主要介绍如何使用本地PyCharm远程连接虚拟机,运行Python脚本,提高编程效率。 注意: …...

Windows图形界面(GUI)-QT-C/C++ - Qt Combo Box

公开视频 -> 链接点击跳转公开课程博客首页 -> ​​​链接点击跳转博客主页 目录 一、概述 1.1 基本概念 1.2 应用场景对比 二、核心属性详解 2.1 行为控制 2.2 显示配置 三、数据操作与访问 3.1 基础数据管理 3.2 高级数据访问 四、用户交互处理 4.1 信号处…...

数字化转型:概念性名词浅谈(第四讲)

​大家好&#xff0c;本篇文章是在新年之际写的&#xff0c;所以在这里先给大家拜个年。 今天要介绍的名词为ETL: ETL&#xff0c;是英文Extract-Transform-Load的缩写&#xff0c;用来描述将数据从来源端经过抽取&#xff08;extract&#xff09;、转换&#xff08;transfor…...

标题:市场波动中的价格趋势分析与策略优化

在市场投资中&#xff0c;价格的波动不仅是常态&#xff0c;更是影响投资决策的关键因素。市场价格的变化受多种因素影响&#xff0c;包括供需关系、政策调整、国际市场动态等。如何理解价格走势&#xff0c;并在其中寻找合适的交易机会&#xff0c;是投资者需要长期研究的课题…...

【HarmonyOS之旅】基于ArkTS开发(三) -> 兼容JS的类Web开发(四) -> 常见组件(一)

目录 1 -> List 1.1 -> 创建List组件 1.2 -> 添加滚动条 1.3 -> 添加侧边索引栏 1.4 -> 实现列表折叠和展开 1.5 -> 场景示例 2 -> dialog 2.1 -> 创建Dialog组件 2.2 -> 设置弹窗响应 2.3 -> 场景示例 3 -> form 3.1 -> 创建…...

Linux:文件系统(软硬链接)

目录 inode ext2文件系统 Block Group 超级块&#xff08;Super Block&#xff09; GDT&#xff08;Group Descriptor Table&#xff09; 块位图&#xff08;Block Bitmap&#xff09; inode位图&#xff08;Inode Bitmap&#xff09; i节点表&#xff08;inode Tabl…...

深度学习系列--01.入门

一.深度学习概念 深度学习&#xff08;Deep Learning&#xff09;是机器学习的分支&#xff0c;是指使用多层的神经网络进行机器学习的一种手法抖音百科。它学习样本数据的内在规律和表示层次&#xff0c;最终目标是让机器能够像人一样具有分析学习能力&#xff0c;能够识别文字…...

如何抓取酒店列表: 揭开秘密

搜索酒店列表是一种强大的工具&#xff0c;可以从各种在线资源中收集有关住宿、价格和可用性的综合数据。无论您是要比较价格、分析市场趋势&#xff0c;还是要创建个性化的旅行计划&#xff0c;搜索都能让您有效地汇编所需的信息。在本文中&#xff0c;我们将介绍如何搜索酒店…...

深度剖析 C++17 中的 std::byte:解锁字节级编程新境界

文章目录 一、引入背景二、基本定义三、特性详解不可隐式转换为整型显式转换为unsigned char位运算支持字面量支持四、使用场景内存操作数据序列化与反序列化网络通信文件读写操作五、与其他数据类型的交互与字符类型的交互与整数类型的交互与指针类型的交互六、注意事项避免混…...

【多线程】线程池核心数到底如何配置?

&#x1f970;&#x1f970;&#x1f970;来都来了&#xff0c;不妨点个关注叭&#xff01; &#x1f449;博客主页&#xff1a;欢迎各位大佬!&#x1f448; 文章目录 1. 前置回顾2. 动态线程池2.1 JMX 的介绍2.1.1 MBeans 介绍 2.2 使用 JMX jconsole 实现动态修改线程池2.2.…...

三维空间全局光照 | 及各种扫盲

Lecture 6 SH for diffuse transport Lecture 7关于 SH for glossy transport 三维空间全局光照 diffuse case和glossy case的区别 在Lambertian模型中&#xff0c;BRDF是一个常数 diffuse case 跟outgoing point无关 glossy case 跟outgoing point有关 &#xff08;Gloss…...

通过C/C++编程语言实现“数据结构”课程中的链表

引言 链表(Linked List)是数据结构中最基础且最重要的线性存储结构之一。与数组的连续内存分配不同,链表通过指针将分散的内存块串联起来,具有动态扩展和高效插入/删除的特性。本文将以C/C++语言为例,从底层原理到代码实现,手把手教你构建完整的链表结构,并深入探讨其应…...

Polardb三节点集群部署安装--附虚拟机

1. 架构 PolarDB-X 采用 Shared-nothing 与存储计算分离架构进行设计&#xff0c;系统由4个核心组件组成。 计算节点&#xff08;CN, Compute Node&#xff09; 计算节点是系统的入口&#xff0c;采用无状态设计&#xff0c;包括 SQL 解析器、优化器、执行器等模块。负责数据…...

java s7接收Byte字节,接收word转16位二进制

1图&#xff1a; 2.图&#xff1a; try {List list getNameList();//接收base64S7Connector s7Connector S7ConnectorFactory.buildTCPConnector().withHost("192.168.46.52").withPort(102).withTimeout(1000) //连接超时时间.withRack(0).withSlot(3).build()…...

挑战项目 --- 微服务编程测评系统(在线OJ系统)

一、前言 1.为什么要做项目 面试官要问项目&#xff0c;考察你到底是理论派还是实战派&#xff1f; 1.希望从你的项目中看到你的真实能力和对知识的灵活运用。 2.展示你在面对问题和需求时的思考方式及解决问题的能力。 3.面试官会就你项目提出一些问题&#xff0c;或扩展需求…...

基于springboot的体质测试数据分析及可视化设计

作者&#xff1a;学姐 开发技术&#xff1a;SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等 文末获取“源码数据库万字文档PPT”&#xff0c;支持远程部署调试、运行安装。 项目包含&#xff1a; 完整源码数据库功能演示视频万字文档PPT 项目编码&#xff1…...

java-重载与重写

介绍 在 Java 中&#xff0c;重载&#xff08;Overloading&#xff09; 和 重写&#xff08;Overriding&#xff09; 是两个重要的概念&#xff0c;它们都与方法有关&#xff0c;但它们的应用场景和行为完全不同。 通过理解重载和重写的区别&#xff0c;可以更好地设计类的继承…...

使用C++构建一个优先级队列

1.优先级队列的介绍 优先级队列是一种特殊的队列数据结构&#xff0c;它是队列&#xff0c;但又不完全是&#xff0c;因为它要将装载的数据进行优先级排序&#xff0c;找到一个最大或者最小优先级的元素&#xff0c;下一次出队列的元素就是这个元素&#xff0c;所以说它不完全是…...

linux驱动开发之字符设备与总线设备驱动模型的区别与联系

Linux驱动开发核心概念解析 1. 字符设备&#xff08;Character Device&#xff09; 定义与特点&#xff1a; 以字节流形式进行数据交换&#xff0c;适用于顺序访问的设备&#xff08;如键盘、鼠标、串口&#xff09;。 用户空间通过设备文件&#xff08;如/dev/xxx&#xff0…...

AI deepseek对数据治理的影响

DEEPSEEK作为智能一款助手&#xff0c;在数据治理体系中具有深远的影响。它通过提供智能化、自动化和高效化的解决方案&#xff0c;推动企业在数据治理变革与领域的优化。以下是EPSEEK对数据治理体系影响的多角度分析&#xff1a; 一、战略层面&#xff1a;推动数据治理目标的…...

DeepSeek各版本说明与优缺点分析

DeepSeek各版本说明与优缺点分析 DeepSeek是最近人工智能领域备受瞩目的一个语言模型系列&#xff0c;其在不同版本的发布过程中&#xff0c;逐步加强了对多种任务的处理能力。本文将详细介绍DeepSeek的各版本&#xff0c;从版本的发布时间、特点、优势以及不足之处&#xff0…...