Azure 机器学习 - 无代码自动机器学习的预测需求
了解如何在 Azure 机器学习工作室中使用自动化机器学习在不编写任何代码行的情况下创建时序预测模型。 此模型将预测自行车共享服务的租赁需求。
关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人。
一、环境准备
-
Azure 机器学习工作区。 请参阅创建工作区资源。
-
下载 bike-no.csv 数据文件
二、登录到工作室
本教程将在 Azure 机器学习工作室中创建自动化 ML 试验运行。机器学习工作室是一个整合的 Web 界面,其中包含的机器学习工具可让各种技能水平的数据科学实践者执行数据科学方案。 Internet Explorer 浏览器不支持此工作室。
-
登录到 Azure 机器学习工作室。
-
选择创建的订阅和工作区。
-
选择“开始”。
-
在左窗格的“创作”部分,选择“自动化 ML” 。
-
选择“+新建自动化 ML 作业”。
三、创建并加载数据集
在配置试验之前,请以 Azure 机器学习数据集的形式将数据文件上传到工作区。 这可以确保数据格式适合在试验中使用。
-
在“选择数据集”窗体中,从“+ 创建数据集”下拉列表中选择“从本地文件”。
-
在“基本信息”窗体中,为数据集指定名称,并提供可选的说明。 数据集类型默认为“表格”,因为 Azure 机器学习工作室中的自动化 ML 目前仅支持表格数据集。
-
在左下角选择“下一步”
-
在“数据存储和文件选择”窗体中,选择在创建工作区期间自动设置的默认数据存储“workspaceblobstore (Azure Blob 存储)”。 这是要将数据文件上传到的存储位置。
-
在“上传”下拉菜单中,选择“上传文件”。
-
在本地计算机上选择“bike-no.csv”文件。 这是作为必备组件下载的文件。
-
选择“下一步”
上传完成后,系统会根据文件类型预先填充“设置和预览”窗体。
-
验证“设置和预览”窗体是否已填充如下,然后选择“下一步”。
字段 说明 教程的值 文件格式 定义文件中存储的数据的布局和类型。 带分隔符 分隔符 一个或多个字符,用于指定纯文本或其他数据流中不同的独立区域之间的边界。 逗号 编码 指定字符架构表中用于读取数据集的位。 UTF-8 列标题 指示如何处理数据集的标头(如果有)。 仅第一个文件包含标头 跳过行 指示要跳过数据集中的多少行(如果有)。 无 -
通过“架构”窗体,可以进一步为此试验配置数据。
-
对于本示例,请选择忽略 casual 和 registered 列。 这些列是 cnt 列的细目,因此我们不会包含这些列。
-
此外,对于本示例,请保留“属性”和“类型”的默认值。
-
选择“下一页”。
-
-
在“确认详细信息”窗体上,确认信息与先前在“基本信息”和“设置和预览”窗体上填充的内容匹配。
-
选择“创建”以完成数据集的创建。
-
当数据集出现在列表中时,则选择它。
-
选择“下一页”。
-
四、配置作业
加载并配置数据后,请设置远程计算目标,并在数据中选择要预测的列。
- 按如下所述填充“配置作业”窗体:
-
输入试验名称:
automl-bikeshare
-
选择“cnt”作为要预测的目标列。 此列指示共享单车的租赁总次数。
-
选择“计算群集”作为计算类型。
-
选择“+ 新建”以配置计算目标。 自动 ML 仅支持 Azure 机器学习计算。
-
填充“选择虚拟机”窗体以设置计算。
字段 说明 教程的值 虚拟机层 选择试验应具有的优先级 专用 虚拟机类型 选择计算的虚拟机大小。 CPU(中央处理单元) 虚拟机大小 指定计算资源的虚拟机大小。 根据数据和试验类型提供了建议的大小列表。 Standard_DS12_V2 -
选择“下一步”以填充“配置设置窗体”。
字段 说明 教程的值 计算名称 用于标识计算上下文的唯一名称。 bike-compute 最小/最大节点数 若要分析数据,必须指定一个或多个节点。 最小节点数:1 最大节点数:6 缩减前的空闲秒数 群集自动缩减到最小节点数之前的空闲时间。 120(默认值) 高级设置 用于为试验配置虚拟网络并对其进行授权的设置。 无 -
选择“创建”,获取计算目标。
完成此操作需要数分钟的时间。
-
创建后,从下拉列表中选择新的计算目标。
-
-
选择“下一页”。
-
五、选择预测设置
通过指定机器学习任务类型和配置设置来完成自动化 ML 试验的设置。
-
在“任务类型和设置”窗体中,选择“时序预测”作为机器学习任务类型。
-
选择“日期”作为时间列,将“时序标识符”留空。
-
“频率”是指收集历史数据的频率。 保留选择“自动检测”。
-
“预测范围”是要预测的未来时间长短。 取消选择“自动检测”,并在字段中键入 14。
-
选择“查看其他配置设置”并按如下所示填充字段。 这些设置旨在更好地控制训练作业以及指定预测设置。 否则,将会根据试验选择和数据应用默认设置。
其他配置 说明 教程的值 主要指标 对机器学习算法进行度量时依据的评估指标。 规范化均方根误差 解释最佳模型 自动显示有关自动化 ML 创建的最佳模型的可解释性。 启用 阻止的算法 要从训练作业中排除的算法 极端随机树 其他预测设置 这些设置有助于提高模型的准确度。 预测目标滞后:要将目标变量的滞后往后推多久 目标滚动窗口:指定滚动窗口的大小(例如 max, min 和 sum),将基于此大小生成特征。 |
预测目标延隔:无
目标滚动窗口大小:无|
| 退出条件 | 如果符合某个条件,则会停止训练作业。 | 训练作业时间(小时):3
指标分数阈值:无 |
| 并发 | 每次迭代执行的并行迭代的最大数目 | 最大并发迭代数:6 |选择“保存”。
-
选择“下一步” 。
-
在“[可选]验证和测试”窗体上,
- 选择“k-折交叉验证”作为“验证类型”。
- 选择“5”作为“交叉验证次数”。
六、运行试验
若要运行试验,请选择“完成”。 此时会打开“作业详细信息”屏幕,其顶部的作业编号旁边显示了“作业状态”。 此状态随着试验的进行而更新。 通知也会显示在工作室的右上角,以告知你试验的状态。
重要
准备试验作业时,准备需要 10-15 分钟。 运行以后,每个迭代还需要 2-3 分钟。
在生产环境中,此过程需要一段时间,因此不妨干点其他的事。 在等待过程中,我们建议在“模型”选项卡上开始浏览已完成测试的算法。
七、浏览模型
导航到“模型”选项卡,以查看测试的算法(模型)。 默认情况下,这些模型在完成后按指标分数排序。 对于本教程,列表中首先显示评分最高的模型(评分根据所选的“规范化均方根误差”指标给出)。
在等待所有试验模型完成的时候,可以选择已完成模型的“算法名称”,以便浏览其性能详细信息。
以下示例进行导航,从作业创建的模型列表中选择模型。 然后,选择“概述”和“指标”选项卡,查看选定模型的属性、指标和性能图表。
八、部署模型
Azure 机器学习工作室中的自动化机器学习可以通过几个步骤将最佳模型部署为 Web 服务。 部署是模型的集成,因此它可以对新数据进行预测并识别潜在的机会领域。
在此试验中部署到 Web 服务后,单车共享公司即会获得一个迭代且可缩放的 Web 解决方案,可以预测共享单车的租赁需求。
作业完成后,选择屏幕顶部的“作业 1”导航回父作业页。
在“最佳模型摘要”部分中,根据“标准化均方根误差”指标,选择此试验背景下的最佳模型。
我们将部署此模型,但请注意,部署需要大约 20 分钟才能完成。 部署过程需要几个步骤,包括注册模型、生成资源和为 Web 服务配置资源。
-
选择该最佳模型,以打开特定于模型的页。
-
选择位于屏幕左上角的“部署”按钮。
-
按如下所示填充“部署模型”窗格:
字段 值 部署名称 bikeshare-deploy 部署说明 单车共享需求部署 计算类型 选择“Azure 计算实例(ACI)” 启用身份验证 禁用。 使用自定义部署资产 禁用。 禁用此选项可以自动生成默认驱动程序文件(评分脚本)和环境文件。 本示例使用“高级”菜单中提供的默认值。
-
选择“部署”。
“作业”屏幕的顶部会以绿色字体显示一条成功消息,指出部署已成功启动。 可以在“部署状态”下的“模型摘要”窗格中找到部署进度。
部署成功后,即会获得一个正常运行的、可以生成预测结果的 Web 服务。
九、清理资源
部署文件比数据文件和试验文件更大,因此它们的存储成本也更大。 仅当你想要最大程度地降低帐户成本,或者想要保留工作区和试验文件时,才删除部署文件。 否则,如果你不打算使用任何文件,请删除整个资源组。
删除部署实例
若要保留资源组和工作区以便在其他教程和探索中使用,请仅从 Azure 机器学习工作室中删除部署实例。
-
转到 Azure 机器学习工作室。 导航到你的工作区,然后在“资产”窗格的左下角选择“终结点”。
-
选择要删除的部署,然后选择“删除”。
-
选择“继续”。
删除资源组
重要
已创建的资源可用作其他 Azure 机器学习教程和操作方法文章的先决条件。
如果你不打算使用已创建的任何资源,请删除它们,以免产生任何费用:
-
在 Azure 门户中,选择最左侧的“资源组” 。
-
从列表中选择你创建的资源组。
-
选择“删除资源组”。
- 输入资源组名称。 然后选择“删除”。
关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人。
相关文章:

Azure 机器学习 - 无代码自动机器学习的预测需求
了解如何在 Azure 机器学习工作室中使用自动化机器学习在不编写任何代码行的情况下创建时序预测模型。 此模型将预测自行车共享服务的租赁需求。 关注TechLead,分享AI全维度知识。作者拥有10年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕…...

Ansible中的变量及加密
目录 一、变量的设定 二、变量的使用方式 1、在playbook中直接定义变量 2、在文件中定义变量 3、设定主机变量和清单变量 4、目录设定变量 5、用命令覆盖变量 6、使用数组设定变量 7、注册变量 8、事实变量 9、魔法变量 三、JINJA2模板 四、加密控制 1、创建加…...

Java 性能优化之直接使用成员变量 VS 拷贝副本
背景 刷到一个大佬的 CSDN 博客,仔细看了一下性能优化专栏。联想到我们的日常开发工作,由于业务比较简单,很容就忽略性能问题。但是,性能优化的一下常见思路,也早有耳闻。看了一个 Java 性能优化的方法 「减少操作指令…...

「专题速递」数据驱动赋能、赛事直播优化、RTC技术、低延时传输引擎、多媒体处理框架、GPU加速...
点击文末阅读原文, 免费报名【抖音背后的体验增长实战揭秘】专场 随着全行业视频化的演进,营销、知识、商业和空间的交互体验正在被重塑。这种变化不仅仅是一种抽象的趋势,更是关系到用户留存和业务增长的关键因素。面对这样的挑战࿰…...
【书籍篇】Spring实战第4版 第1部分 Spring的核心
Spring实战第4版 第1部分 Spring的核心 一. 简化Java开发1. 四大关键策略2. spring容器2.1 bean工厂2.2 应用上下文 二. 装配Bean1. spring配置2. 混合配置 三. 高级装配1. profile配置2. 激活profile3. 条件化的Bean4. 处理自动装配的歧义性4.1 设置首选4.2 限定符4.3 自定义限…...

【AI视野·今日Sound 声学论文速览 第八期】Wed, 20 Sep 2023
AI视野今日CS.Sound 声学论文速览 Wed, 20 Sep 2023 Totally 1 papers 👉上期速览✈更多精彩请移步主页 Daily Sound Papers Accelerating Diffusion-Based Text-to-Audio Generation with Consistency Distillation Authors Yatong Bai, Trung Dang, Dung Tran, K…...

【HSPICE仿真】输入网表文件(6)用户自定义分析输出(.measure)
.measure语句的基本用法 1. 语句顺序2. 测量参数类型3. Rise, Fall, Delay, and Power Measurements4. FIND 和 WHEN 函数5. Equation Evaluation/Arithmetic Expression6. AVG, EM_AVG, INTEG, MIN, MAX, PP, and RMS基本语法示例 7. 输出文件格式MEASFORMMEASOUTMEASFILEMEAS…...

安装Oracle 11g Error in invoking target报错
在redhat7.5上安装Oracle 11g,安装过程中到86%时出现Error in invoking target报错 原因是由于操作系统版本过高,导致lib链接报错 [oracleemrtest ~]$ cd O R A C L E H O M E / s y s m a n / l i b / [ o r a c l e e m r t e s t l i b ] ORACLE…...
AlarmManager闹钟管理者
AlarmManager是Android提供的一个全局定时器,利用系统闹钟定时发送广播。这样做的好处是:如果App提前注册闹钟的广播接收器,即使App退出了,只要定时到达,App就会被唤醒响应广播事件。 AlarmManager设置的PendingInten…...
Opencv实现的三次样条曲线(Cubic Spline)插值
1.样条曲线简介 样条曲线(Spline)本质是分段多项式实函数,在实数范围内有: S:[a,b]→R ,在区间 [a,b] 上包含 k 个子区间[ti−1,ti],且有: at0<t1<⋯<tk−1<tkb(1) 对应每一段区间 i 的存在多项式&…...

【ElasticSearch系列-03】ElasticSearch的高级句法查询Query DSL
ElasticSearch系列整体栏目 内容链接地址【一】ElasticSearch下载和安装https://zhenghuisheng.blog.csdn.net/article/details/129260827【二】ElasticSearch概念和基本操作https://blog.csdn.net/zhenghuishengq/article/details/134121631【二】ElasticSearch的高级查询Quer…...

【C++ 系列文章 -- 程序员考试 201811 下午场 C++ 专题 】
1.1 C 题目六 阅读下列说明和C代码,填写程序中的空(1) ~(5),将解答写入答题纸的对应栏内。 【说明】 以下C代码实现一个简单乐器系统,音乐类(Music)可以使用…...

javaEE -15( 13000字 JavaScript入门 - 2)
一:JavaScript(WebAPI) JS 分成三个大的部分 ECMAScript: 基础语法部分DOM API: 操作页面结构BOM API: 操作浏览器 WebAPI 就包含了 DOM BOM,这个是 W3C 组织规定的. (和制定 ECMAScript 标准的大佬们不是一伙人). 前面学的 JS 基础语法主要学的是 …...

AWS SAP-C02教程11-解决方案
本章中,会根据一些常见场景的解决方案或者AWS的某一方面的总结,带你了解AWS各个组件之间的配合使用、如何在解决方案中选择组件以及如何避开其本身限制实现需求。 目录 1 处理高并发解决方案(Handing Extreme Rates)2 日志管理(AWS Managed Logs)3 部署解决方案(Deploy…...
ClickHouse Java多参UDF
一、环境版本 环境版本docker clickhouse22.3.10.22 docker pull clickhouse/clickhouse-server:22.3.10.22二、XML配置 2.1 配置文件 # 创建udf配置文件 vim /etc/clickhouse-server/demo_function.xml<functions><function><type>executable</type&…...

修改Typora默认微软雅黑字体
修改Typora字体 写在前面 我最近在折腾windows电脑,从macos转像windows不容易啊,因为键盘快捷键经常弄错,这篇文章就是修改Typora中字体显示的问题。 正文内容 我发现在windows中,字体非常的难看,微软雅黑也太丑了…...

ESP32网络开发实例-Web服务器显示LM35传感器数据
Web服务器显示LM35传感器数据 文章目录 Web服务器显示LM35传感器数据1、LM35介绍2、软件准备3、硬件准备4、代码实现4.1 LM35与ADS1115驱动4.2 Web服务器显示LM35传感器数据本文将介绍有关如何在ESP32的Web服务器中显示LM35 温度传感器数据。 1、LM35介绍 LM35 用于测量物体或…...

ATFX汇市:美联储11月利率决议再暂停加息,紧缩货币政策或已接近尾声
ATFX汇市:11月美联储利率决议结果在今日2:00公布,其中提到:美联储寻求以2%的速度实现最大的就业和通胀率,为了达成这些目标,美联储决定将联邦基金利率的目标区间维持在5.25%~5.5%;委员会将会考虑货币政策的…...

g.Grafana之Gauge的图形说明
直接上操作截图 1. 创建一个新的Dashboard 2.为Dashboard创建变量 【General】下的Name与Label的名称自定义 【Query options】 下的Group可以填写Zabbix内的所有组/.*/ , 然后通过Regex正则过滤需要的组名 3.设置Dashboard的图形 我使用文字来描述下这个图 1.我们在dash…...

MySQL笔记--Ubuntu安装MySQL并基于C++测试API
目录 1--安装MySQL 2--MySQL连接 3--代码案例 1--安装MySQL # 安装MySQL-Server sudo apt install mysql-server# 设置系统启动时自动开启 sudo systemctl start mysql # sudo systemctl enable mysql# 检查MySQL运行状态 sudo systemctl status mysql# 进入MySQL终端 sudo…...
Java 语言特性(面试系列2)
一、SQL 基础 1. 复杂查询 (1)连接查询(JOIN) 内连接(INNER JOIN):返回两表匹配的记录。 SELECT e.name, d.dept_name FROM employees e INNER JOIN departments d ON e.dept_id d.dept_id; 左…...
设计模式和设计原则回顾
设计模式和设计原则回顾 23种设计模式是设计原则的完美体现,设计原则设计原则是设计模式的理论基石, 设计模式 在经典的设计模式分类中(如《设计模式:可复用面向对象软件的基础》一书中),总共有23种设计模式,分为三大类: 一、创建型模式(5种) 1. 单例模式(Sing…...
Java 8 Stream API 入门到实践详解
一、告别 for 循环! 传统痛点: Java 8 之前,集合操作离不开冗长的 for 循环和匿名类。例如,过滤列表中的偶数: List<Integer> list Arrays.asList(1, 2, 3, 4, 5); List<Integer> evens new ArrayList…...

2025 后端自学UNIAPP【项目实战:旅游项目】6、我的收藏页面
代码框架视图 1、先添加一个获取收藏景点的列表请求 【在文件my_api.js文件中添加】 // 引入公共的请求封装 import http from ./my_http.js// 登录接口(适配服务端返回 Token) export const login async (code, avatar) > {const res await http…...
拉力测试cuda pytorch 把 4070显卡拉满
import torch import timedef stress_test_gpu(matrix_size16384, duration300):"""对GPU进行压力测试,通过持续的矩阵乘法来最大化GPU利用率参数:matrix_size: 矩阵维度大小,增大可提高计算复杂度duration: 测试持续时间(秒&…...

Android15默认授权浮窗权限
我们经常有那种需求,客户需要定制的apk集成在ROM中,并且默认授予其【显示在其他应用的上层】权限,也就是我们常说的浮窗权限,那么我们就可以通过以下方法在wms、ams等系统服务的systemReady()方法中调用即可实现预置应用默认授权浮…...
高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数
高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数 在软件开发中,单例模式(Singleton Pattern)是一种常见的设计模式,确保一个类仅有一个实例,并提供一个全局访问点。在多线程环境下,实现单例模式时需要注意线程安全问题,以防止多个线程同时创建实例,导致…...

如何应对敏捷转型中的团队阻力
应对敏捷转型中的团队阻力需要明确沟通敏捷转型目的、提升团队参与感、提供充分的培训与支持、逐步推进敏捷实践、建立清晰的奖励和反馈机制。其中,明确沟通敏捷转型目的尤为关键,团队成员只有清晰理解转型背后的原因和利益,才能降低对变化的…...

springboot 日志类切面,接口成功记录日志,失败不记录
springboot 日志类切面,接口成功记录日志,失败不记录 自定义一个注解方法 import java.lang.annotation.ElementType; import java.lang.annotation.Retention; import java.lang.annotation.RetentionPolicy; import java.lang.annotation.Target;/***…...
【Kafka】Kafka从入门到实战:构建高吞吐量分布式消息系统
Kafka从入门到实战:构建高吞吐量分布式消息系统 一、Kafka概述 Apache Kafka是一个分布式流处理平台,最初由LinkedIn开发,后成为Apache顶级项目。它被设计用于高吞吐量、低延迟的消息处理,能够处理来自多个生产者的海量数据,并将这些数据实时传递给消费者。 Kafka核心特…...