当前位置: 首页 > article >正文

助睿实验作业1-订单利润分流数据加工

一、实验背景1.1 实验目的本次实验旨在掌握零代码数据集成平台的核心操作与 ETL 基础方法具体包括• 熟悉数据转换任务的创建、组件添加与任务执行的完整流程• 掌握数据读取、多表关联、字段筛选、条件分流与文件输出等常用功能的配置• 理解数据关联、过滤与分支处理的设计逻辑。通过本次实验能够独立完成订单数据的利润计算与分类处理为后续数据加工任务打下基础。1.2 实验环境实验平台助睿数智Uniplore一站式数据科学平台https://lab.guilan.cn/数据库MySQL数据表订单表、产品表1.3 业务场景企业经营分析中常需要关联订单与产品数据计算利润并按利润正负对订单进行分类存储。本实验以此场景为例用零代码方式完成数据处理。1.4处理流程将订单明细表与产品信息表进行左外连接合并订单与产品数据清洗数据、去除冗余字段后按订单利润是否大于等于零进行分流最终将盈利订单和亏损订单分别导出为两个独立的 Excel 文件。二 实验步骤2.1登录助睿实验平台https://www.guilan.cn/home进入我的学习后点击进入实训平台2.2创建实验项目然后点击右上角进入项目2.3获取数据打开后在项目页面中我们能看见左侧包含 3 个核心菜单资源库、文件库、元数据管理。• 资源库用于工作流的全生命周期管理包括新建、删除、修改和查看工作流信息也支持工作空间的导入导出、任务调度管理等操作。• 文件库用于存储工作流运行所需的源文件以及工作流执行过程中生成的输出文件。• 元数据管理是数据集成的基础支撑模块可为工作流配置运行环境、数据库连接、Flink 集群等底层参数。本次实验中我们主要使用到资源库和文件库两大模块。首先我们点击右键同步数据随即进入文件夹后再切换回到元数据就可以看到成功同步的数据库“线上公共数据源(Readonly)”2.4新建转换流切换到资料库然后点击右键新建转换流输入名字然后进入转换流进入后要先点击锁解锁才能进行下一步操作2.5添加组件1 添加表输入组件在搜索输入框中输入“表输入”即可查询到“表输入”组件。通过拖拽添加表述瑞组件重复以上操作再次添加。然后右键点击进行表组件编辑。将名字编辑为我们想要的。2添加记录集连接组件​使用表输入组件读取数据后需要通过记录集连接组件将表输入组件的数据进行关联。​在搜索输入框中输入“记录集连接”将记录集连接组件拖拽至画布中。再将两个组件之间用箭头连接起来3添加字段选择组件然后右键编辑组件填写名字再将组件之间连接起来4添加过滤记录组件​本次实验是根据订单的利润情况对订单进行分流。使用“过滤记录”组件可以根据记录中某个字段的值进行记录分流。​在搜索输入框中输入“过滤记录”将过滤记录组件拖拽至画布中再将其宇前一个组件连接起来会有弹窗提示选择主输出步骤即可5添加 excel 输出组件​记录经过“过滤记录”组件后会被分成2个记录流。我们可以根据业务需求将2个记录流输出到指定位置文件、数据库表。在本次实验中我们选择将记录输出到 Excel 文件中。​在搜索输入框中输入“excel 输出”将2个表输出组件拖拽至画布中再右键编辑他们的名字将其与前一个组件连接时出现弹窗当连接的是盈利订单时选择true当连接的是亏损订单时选择false2.6配置组件信息1表输入组件配置​双击订单_详细订单表输入组件弹出组件配置页面。在数据库连接下拉框中选择“线上公共数据源(Readonly)”再点击“获取SQL查询语句”自动生成SQL查询语句。点击后出现弹窗选择表。下滑找到“business_anaylsis.order_detail”并点击它再点击“确定”我们想要的sql语句自动生成了另外一个表组件使用相同的操作配置“business_anaylsis.product”的SQL查询语句。2 记录集连接组件配置​编辑记录集连接组件在下拉列表中选择需要连接的数据来源​第一个Transform选择详细订单第二个Transform选择产品信息连接类型选择LEFT OUTER然后点击获取连接字段另外一列相同操作第一个Transform字段保留 produc_id第二个Transform的字段保留 id连接类型选择LEFT OUTER第一个Transform字段中除了 produc_id 外的其他字段右键点击“删除选中的行”第一个Transform字段中除了id 外的其他字段右键点击“删除选中的行”3字段选择组件配置记录集连接后produc_id与id字段内容重复需移除id字段。操作双击 “移除产品 ID_1 字段” 组件选择 “移除” 模式点击 “获取字段” 并移除id字段即可。右键获取字段然后删除除了id以外的其他字段再点击确认4编辑配置过滤记录双击“过滤记录”选择字段利润profit选中“profit(Number)”后点击“确定”再在中间字段选择点击“value”值类型选择“Integer”值输入“0”5 编辑excel输出组件配置双击“盈利订单”excel表输出组件出现弹窗将文件名修改为“盈利订单”选择文件拓展名“xlsx [Excel 2007 and above]”​另外一个excel组件进行相同的配置操作。再切换输出字段获取字段后2.7输出结果点击按钮进行转换执行成功三 实验结果获得两个表格输出文件内容说明盈利订单.xlsxprofit ≥ 0 的订单可进一步分析高利润产品亏损订单.xlsxprofit 0 的订单可用于亏损原因追踪四 问题与解决1. 当编辑过滤记录时发现没有profit选项解决方案往前寻找前面组件配置有没有出错发现在前一个组件中应在移除中保留id字段结果误在选择与修改中保留id导致出错五 实验总结本次实验基于助睿零代码 ETL 平台完成了订单数据的关联、清洗与分流处理。实验中我掌握了新建转换任务、配置表输入与 Excel 输出组件的操作流程熟练运用字段选择、记录集连接、过滤记录等组件实现了订单明细表与产品信息表的左外连接完成重复字段移除并按利润正负将数据分流导出为盈利与亏损订单文件。通过实验我理解了多表关联与数据分流的 ETL 设计思路提升了零代码数据处理的实践能力为后续复杂数据加工任务打下了基础

相关文章:

助睿实验作业1-订单利润分流数据加工

一、实验背景1.1 实验目的本次实验旨在掌握零代码数据集成平台的核心操作与 ETL 基础方法,具体包括:• 熟悉数据转换任务的创建、组件添加与任务执行的完整流程;• 掌握数据读取、多表关联、字段筛选、条件分流与文件输出等常用功能的配置&am…...

Vim集成LLM智能代理:打造沉浸式AI编程助手

1. 项目概述:当Vim遇上LLM,一个开发者的效率革命 如果你和我一样,是一个常年泡在终端和Vim里的开发者,那么你一定经历过这样的时刻:面对一段复杂的正则表达式,或者一个不熟悉的API调用,你不得不…...

AVRCP 1.6的隐藏技能:手把手教你实现蓝牙音乐封面传输(基于BIP/OBEX)

AVRCP 1.6的隐藏技能:手把手教你实现蓝牙音乐封面传输(基于BIP/OBEX) 在蓝牙音频设备的使用体验中,音乐封面传输一直是个被低估的功能。想象一下,当你用高端蓝牙耳机听歌时,耳机上的小屏幕不仅能显示歌曲信…...

【LangChain】使用 LangChain 快速实现 RAG

写在前面公司内部的技术文档、产品手册、运营报告——这些资料积累多了,想让人工智能基于它们回答问题,直接丢给 ChatGPT 不现实。文档量一大,就超出了模型的上下文窗口。RAG(检索增强生成)技术解决的就是这个问题。RA…...

2026年Python+AI工具链环境搭建指南:从零到可用的完整配置

AI辅助创作 | 专栏《2026 AI编程效率革命》第02篇 前言 很多朋友问我:"你用AI写代码效率那么高,是不是有什么秘诀?"说实话,真正的秘诀不在模型本身,而在于环境配置。一个标准化的AI开发环境能让你少踩80%的…...

SAKE基准:音频语言模型听觉属性评估与编辑新方法

1. 项目背景与核心价值音频语言模型正在成为AI领域的新前沿,但如何系统评估和编辑这类模型的听觉属性知识,一直是行业痛点。SAKE基准的提出,相当于给这个领域装上了"调试器"——它首次构建了覆盖音高、音色、响度、节奏等核心听觉维…...

告别黑窗口:用MobaXterm+VSCode搞定服务器上Matplotlib/OpenCV的可视化调试

告别黑窗口:用MobaXtermVSCode搞定服务器上Matplotlib/OpenCV的可视化调试 远程服务器上的机器学习开发常常面临一个尴尬局面:代码能跑通,但图像输出却成了"黑箱操作"。想象一下,你正在调试一个复杂的计算机视觉模型&a…...

撕开AI落地的遮羞布:大模型到底跟什么在死磕?(附架构级深度剖析)

撕开AI落地的遮羞布:大模型到底跟什么在死磕?标题:撕开AI落地的遮羞布:大模型到底跟什么在死磕?(附架构级深度剖析)标签: 架构设计、大模型应用、AI工程化、组织变革、技术商业化 咱…...

基于CPU+GPU架构的雷达信号处理快速实现CUDA【附代码】

✨ 本团队擅长数据搜集与处理、建模仿真、程序设计、仿真代码、EI、SCI写作与指导,毕业论文、期刊论文经验交流。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流,查看文章底部二维码(1)基于CUDA流与共享内存的脉压并行化:雷达…...

为什么.NET 8.0.3 SDK悄悄禁用了主构造函数的隐式字段捕获?微软内部邮件首次公开解读

更多请点击: https://intelliparadigm.com 第一章:C# 13 主构造函数增强实战教程 C# 13 引入了主构造函数(Primary Constructor)的显著增强,允许在类和结构体声明中直接定义参数并自动参与成员初始化,大幅…...

Perseus:面向移动游戏的零偏移原生脚本补丁架构设计

Perseus:面向移动游戏的零偏移原生脚本补丁架构设计 【免费下载链接】Perseus Azur Lane scripts patcher. 项目地址: https://gitcode.com/gh_mirrors/pers/Perseus 在移动游戏生态中,脚本补丁技术的核心挑战在于如何平衡兼容性、稳定性与维护成…...

10B参数多模态模型STEP3-VL的技术突破与应用实践

1. 项目背景与核心突破在计算机视觉与自然语言处理交叉领域,多模态模型通常需要庞大的参数量才能实现高质量的跨模态理解。我们团队开发的STEP3-VL-10B模型,首次在10B参数规模下实现了接近百亿参数模型的性能表现。这个突破性进展来自三个关键技术革新&a…...

从L1d缓存未命中率飙升190%说起:C++27原子变量布局对齐调优——Intel Ice Lake vs AMD Zen4实测对比(附objdump反汇编验证)

更多请点击: https://intelliparadigm.com 第一章:C27原子操作性能调优的底层动因与问题定位 现代多核处理器的缓存一致性协议(如 MESI、MOESI)与内存序模型的复杂交互,正成为 C27 原子操作性能瓶颈的核心根源。随着硬…...

别再搞混了!QT Creator新建QML项目时,选qmake和CMake对资源管理的影响

QML项目构建系统选择指南:qmake与CMake在资源管理中的关键差异 当你在Qt Creator中新建一个QML项目时,第一个重要决策就是选择构建系统——这个看似简单的选择会深刻影响整个项目的资源管理方式。本文将深入剖析qmake和CMake两种构建系统在QML项目中的表…...

性能暴涨47%?揭秘.NET 9容器运行时新特性,80%开发者尚未启用的GC优化开关

更多请点击: https://intelliparadigm.com 第一章:性能暴涨47%?揭秘.NET 9容器运行时新特性,80%开发者尚未启用的GC优化开关 .NET 9 首次为容器环境深度定制了垃圾回收(GC)策略,引入 DOTNET_G…...

告别信号干扰!用Xilinx FPGA的LVDS接口实现高速稳定传输(附DPA配置避坑)

告别信号干扰!用Xilinx FPGA的LVDS接口实现高速稳定传输(附DPA配置避坑) 在高速数字系统设计中,信号完整性问题往往成为工程师的噩梦。当数据速率突破Gbps门槛时,传统的单端信号传输方式已难以满足需求——时钟抖动、串…...

PHP低代码表单引擎国产化“黑盒”拆解:AST语法树重构、ZTS线程安全补丁、国密算法内核注入(仅限首批200家信创伙伴获取的架构白皮书)

更多请点击: https://kaifayun.com 第一章:PHP低代码表单引擎国产化战略定位与信创合规基线 在信创产业纵深推进的背景下,PHP低代码表单引擎不再仅是开发提效工具,而是承载操作系统适配、数据库自主可控、中间件兼容性验证及密码…...

Node.js爬虫框架NodeClaw:模块化设计与工程化实践指南

1. 项目概述与核心价值最近在折腾一些自动化工具时,发现了一个挺有意思的项目,叫NodeClaw。乍一看这个名字,可能会联想到“节点”和“抓取”,没错,它的核心功能就是围绕Node.js环境进行数据抓取和自动化操作。这个项目…...

5分钟上手PiliPlus:开源B站客户端的跨平台终极指南

5分钟上手PiliPlus:开源B站客户端的跨平台终极指南 【免费下载链接】PiliPlus PiliPlus 项目地址: https://gitcode.com/gh_mirrors/pi/PiliPlus 你是否厌倦了官方B站客户端的广告干扰和功能限制?想要一个纯净、高效、支持全平台的B站观影体验&am…...

Squirrel-RIFE:让你的视频从卡顿到丝滑的终极补帧神器

Squirrel-RIFE:让你的视频从卡顿到丝滑的终极补帧神器 【免费下载链接】Squirrel-RIFE 效果更好的补帧软件,显存占用更小,是DAIN速度的10-25倍,包含抽帧处理,去除动漫卡顿感 项目地址: https://gitcode.com/gh_mirro…...

PVZ Toolkit终极指南:免费解锁植物大战僵尸无限阳光和金币

PVZ Toolkit终极指南:免费解锁植物大战僵尸无限阳光和金币 【免费下载链接】pvztoolkit 植物大战僵尸 PC 版综合修改器 项目地址: https://gitcode.com/gh_mirrors/pv/pvztoolkit PVZ Toolkit是一款专为经典游戏《植物大战僵尸》PC版设计的开源修改器&#x…...

从“谁先来谁先用”到“大家轮流来”:手把手教你用Verilog实现Round Robin轮询仲裁(含公平性分析)

从“谁先来谁先用”到“大家轮流来”:手把手教你用Verilog实现Round Robin轮询仲裁(含公平性分析) 在多核处理器任务调度、网络交换机端口仲裁或共享外设访问等场景中,如何公平地分配资源是一个永恒的话题。想象一下,如…...

StatEval:统计推理评估框架的设计与实践

1. 项目背景与核心价值StatEval的出现填补了统计推理领域系统性评估工具的空白。过去十年间,虽然统计学习方法在学术界和工业界都取得了显著进展,但关于这些方法在实际推理任务中的表现评估却始终缺乏统一标准。研究者们通常需要自行构建测试集&#xff…...

为你的物联网项目‘瘦身’:用Processing自定义TFT_eSPI小字库,大幅节省ESP32存储空间

为物联网项目瘦身:ProcessingTFT_eSPI定制中文字库的工程实践 在ESP32等资源受限设备上开发中文交互界面时,开发者常面临一个经典矛盾:完整中文字库动辄占用数百KB存储空间,而实际项目可能只需要显示"温度"、"湿度…...

Gerrit集成AI代码审查插件:ChatGPT自动化审查实战指南

1. 项目概述:当Gerrit遇上AI代码审查在团队协作开发中,代码审查是保证代码质量、统一编码风格、传播知识的关键环节。但人工审查耗时耗力,尤其是在面对大量琐碎的、重复性的代码风格问题时,审查者容易疲劳,导致疏漏。我…...

【稀缺首发】C++23 std::configurable_constexpr提案内参解读(仅限前500名C++高级工程师获取的编译期配置演进路线图)

更多请点击: https://intelliparadigm.com 第一章:C23 std::configurable_constexpr提案的演进背景与核心定位 C23 中引入的 std::configurable_constexpr 并非标准库正式组件,而是一个广为误传的概念——它实际源自 P2448RX 系列提案&#…...

执行无关验证器架构设计与性能优化实践

1. 项目背景与核心价值在软件工程领域,验证器(Verifier)作为确保代码质量和功能正确性的关键组件,其性能直接影响着开发效率和系统稳定性。传统验证器通常与具体执行环境深度耦合,导致验证过程存在资源占用高、响应延迟…...

为什么你的DoIP消息丢包率超8.3%?——车载以太网PHY/MAC/Socket三层协同调优手册

更多请点击: https://intelliparadigm.com 第一章:DoIP协议栈丢包率超8.3%的系统性归因分析 DoIP(Diagnostics over Internet Protocol)在车载以太网诊断场景中对实时性与可靠性要求极高。当实测丢包率持续超过8.3%这一关键阈值时…...

SCAN框架:自去噪强化学习奖励模型优化实践

1. 项目背景与核心价值在强化学习领域,奖励模型的质量直接决定了智能体最终的表现上限。传统基于人类标注的奖励模型构建方式存在两个致命瓶颈:标注成本高昂且难以规模化,标注噪声会随着训练过程被放大。SCAN(Self-Cleaning Annot…...

RT-DETR的‘混合编码器’拆解:为什么只给高层特征用注意力?

RT-DETR混合编码器设计哲学:高层特征注意力计算的最优解 在目标检测领域,实时性与准确性始终是一对难以调和的矛盾。RT-DETR作为首个实时端到端检测器,其创新性的混合编码器设计打破了这一僵局——特别是它那看似反直觉的决策:仅对…...