当前位置: 首页 > article >正文

ETL助睿实验入门 - 订单利润分流数据加工(保姆级步骤 + 踩坑记录)

一、实验背景1.1 实验目的本次实验的核心目标是熟悉助睿零代码数据集成平台ETL 平台的核心功能与操作方法具体来说你将掌握以下技能掌握新建转换、添加组件、执行转换等 ETL 基本操作流程熟悉表输入、记录集连接、字段选择、过滤记录、Excel 输出等常用组件的配置方法理解多表关联、数据过滤与分流处理的 ETL 设计思路通过本次实验你能够独立使用助睿平台完成常见的数据加工任务为后续更复杂的数据分析场景打下坚实基础。1.2 实验环境本次实验基于助睿数智Uniplore一站式数据科学实验平台完成平台定位为覆盖数据接入、ETL 处理、机器学习建模到可视化分析的全链路 Agentic 零代码数据智能平台。产品官网https://www.uniplore.com/本次实验访问地址https://lab.guilian.cn/数据库公开数据集数据准备订单明细表business_analysis.order_detail产品信息表business_analysis.product1.3 业务场景在企业经营分析场景中我们经常需要将订单明细表与产品信息表关联起来计算订单利润并按利润正负对订单进行分类存储。本次实验以订单利润分流为例通过零代码拖拽的方式完成这一数据处理任务为后续的盈利分析、亏损原因追踪提供规范的数据基础。1.4 数据加工流程订单明细表与产品信息表进行左外连接 → 移除重复字段 → 按利润是否大于等于 0 进行分流 → 分别输出盈利订单和亏损订单到两个独立的 Excel 文件中。二、实验步骤2.1 登录实验平台打开贵兰在线课程学习页面找到 “实验课 1助睿 ETL 入门实验”。点击课程实训说明中的 “大数据实训平台”访问https://lab.guilian.cn/并登录从贵兰在线进入实验平台可以自动登录登录成功后进入实验平台首页。2.2 基本概念了解助睿一站式大数据平台中的数据集成平台通过可视化方式做数据 ETL抽取、转换、加载核心概念如下表格概念说明Pipeline转换面向数据流处理数据的一个功能单元由多个 Transform 组成Workflow作业面向任务完成一件完整的事由多个 Action 组成必须包含开始项Transform步骤转换内的最小单元如 “Excel 输入”“字段选择”每个步骤独立线程运行Action任务项作业的执行单位如 “启动”“发送邮件”Hops节点连接数据传输通道连接步骤或任务项2.3 团队管理可选在该环节每个小组的组长可以创建该小组的团队方便团队实验作业的管理进入实验平台后选择数据集成 / ETL进入数据集成页面。点击 “团队管理” 菜单并点击 “新增团队”。在弹出的窗口中输入团队名称和团队描述点击 “确认”。创建成功后点击团队卡片右上角的 “更多”选择 “添加成员”输入手机号查询组员勾选后点击 “添加” 即可。个人用户可直接跳过此步骤使用默认团队即可。2.4 创建实验项目平台提供默认项目也可以为课程创建专属项目选择创建的项目所属团队为 “商业数据分析小组 1”也可以是个人。点击 “新建项目”输入项目名称如 “订单利润分流处理”点击确认。创建成功后即可在数据集成页面看到新创建的项目。在项目页面可以看到左侧有 “数据集、资源库、文件、元数据” 等菜单本次实验主要用到资源库和文件库。2.5 同步数据源首先获取本次的实验数据集点击 “元数据”右键 “关系数据库”点击 “同步数据源”。切换 “文件库” 菜单再切换回到元数据可以看到成功同步的数据库 “线上公共数据源 (read-only)”。c2.6 新建转换流本次实验将订单明细和产品信息两张表关联实现订单数据与产品信息的关联并根据利润正负将数据分流为盈利订单和亏损订单分别输出到两个 Excel 文件。切换到 “资源库”同样在根目录下右键 “新建转换流”。输入转换流名字 “订单利润分流处理”点击 “确定”。创建成功后进入转换流设计页面转换设计页面每次打开都是锁定状态需要解锁后才可编辑转换流点击右上角的解锁图标进行解锁。2.7 添加组件在建立转换任务后可添加相应操作组件到转换任务中按以下顺序向转换流中添加组件1添加两个「表输入」组件在搜索框中输入 “表输入”将组件拖拽到画布中重复两次添加两个表输入组件。双击第一个表输入组件修改名称为 “订单_详细订单”双击第二个修改为 “订单_产品信息”。2添加「记录集连接」组件在搜索框中输入 “记录集连接”将组件拖拽到画布中。创建两个表输入组件到记录集连接组件的连接线将两个表输入的输出端连接到记录集连接的输入端。3添加「字段选择」组件在搜索框中输入 “字段选择”将组件拖拽到画布中修改名称为 “移除产品 ID 字段”。创建记录集连接组件到字段选择组件的连接线。4添加「过滤记录」组件在搜索框中输入 “过滤记录”将组件拖拽到画布中。创建字段选择组件到过滤记录组件的连接线。在选择连接线的弹窗中点击 “主输出步骤”。由于在进行字段选择操作时可能有记录不满足要求导致记录数据记为错误。主输出步骤表示满足要求的记录通过该连接线传输数据。5添加两个「Excel 输出」组件在搜索框中输入 “Excel”将组件拖拽到画布中重复两次添加两个 Excel 输出组件。2 个 excel 输出组件分别命名为 “盈利订单” 和 “亏损订单”并创建过滤记录组件到两个 excel 输出组件的连接线在选择连接线类型的弹窗中分别选择 “True 输出” 和 “False 输出”“True 输出” 表示满足过滤条件的记录输出。“False 输出” 表示不满足过滤条件的记录输出。至此一个完整的转换任务流程构建完毕。三、组件配置超详细步骤3.1 表输入组件配置双击 “订单_详细订单” 表输入组件弹出配置页面。在数据库连接下拉框中选择已同步的 “线上公共数据源 (read-only)”。点击 “获取 SQL 查询语句”系统会自动生成 SQL 查询语句点击确认。打开 “线上公共数据源 (read-only)” 目录下拉找到business_analysis.order_detail并点击它再点击 “确定”。用同样的方法配置 “订单_产品信息” 组件选择business_analysis.product表获取 SQL 并确认。3.2 记录集连接组件配置双击记录集连接组件在下拉列表中第一个 Transform 选择 “订单_详细订单”第二个 Transform 选择 “订单_产品信息”连接类型选择LEFT OUTER左外连接点击第一个 Transform 的 “获得连接字段” 按钮获取订单明细表的字段同样获取第二个 Transform 的字段。配置连接条件第一个 Transform 字段选produc_id第二个 Transform 字段选id删除其余字段只保留连接字段点击确认。删除多个字段可以按crtl并同时选中多个字段右键删除3.3 字段选择组件配置双击字段选择组件点击 “移除”再点击 “获取字段”。在获取的字段中选中重复的id字段产品表的 id和订单表的produc_id重复右键删除选中的行。确认后id字段就被移除了只保留订单表的字段点击确认。3.4 过滤记录组件配置据业务需求需要将盈利订单和亏损订单分开存储两个订单可以使用字段利润来区分。双击 “过滤记录” 组件在弹窗中的下拉列表中选择将结果发送给不同的后续处理步骤如下图双击过滤记录组件配置过滤条件字段选择profit利润条件选择大于等于值输入0配置完成后过滤记录的两个输出端条件为true利润≥0连接 “盈利订单” Excel 组件条件为false利润 0连接 “亏损订单” Excel 组件点击确认过滤条件配置完成。3.5 Excel 输出组件配置双击 “盈利订单” Excel 组件在配置弹窗中文件名称修改为 “盈利订单”文件格式选择Excel 2007 and above后缀名为.xlsx点击 “输出字段”右键选择 “获取字段”系统会自动获取所有字段点击确认。用同样的方法配置 “亏损订单” 组件文件名改为 “亏损订单.xlsx”获取字段后确认。四、执行转换与查看结果4.1 执行转换所有组件配置完成后点击画布上方的「启动」按钮在弹出窗口中点击 “启动”等待转换执行完成执行成功后会显示 “执行成功” 提示。4.2 查看执行日志任务执行过程中会自动记录日志执行完成后点击「日志」按钮可以查看执行结果和报错信息确认数据读取、关联、过滤、输出的每一步是否正常。4.3 查看结果回到项目页面右键刷新文件目录可以看到转换任务生成的两个 Excel 文件盈利订单.xlsx和亏损订单.xlsx。下载文件并打开后验证数据结果盈利订单文件中所有记录的利润值均≥0亏损订单文件中所有记录的利润值均 0两张表的关联字段匹配正确无重复字段或缺失数据的情况五、问题与解决问题 1Excel 输出获取不到字段问题现象配置 Excel 输出时点击 “获取字段” 没有反应。问题原因过滤记录到 Excel 输出的连接线类型选错了盈利订单应连接 “True 输出”亏损订单应连接 “False 输出”连接错误导致没有数据流入 Excel 组件。解决方法重新创建连接线并正确选择输出端修改后获取字段恢复正常。问题 2Excel 输出组件因文件名相同导致执行报错问题现象配置完两个 Excel 输出组件后执行转换系统报错。问题原因两个组件的默认输出文件名都是 “file”没有修改导致平台无法区分两个输出文件。解决方法将盈利订单和亏损订单的 “文件名” 分别修改为 “盈利订单” 和 “亏损订单”重新执行转换后成功生成文件。问题 3记录集连接后数据为空问题现象配置记录集连接组件后后续组件获取不到数据数据为空。问题原因连接字段配置错误将订单明细表的produc_id字段写错为product_id导致关联条件不匹配。解决方法重新检查并修改连接字段确保订单明细表的字段为produc_id与产品信息表的id字段对应修改后数据恢复正常。六、实验总结通过本次实验你能完整掌握助睿数智平台零代码 ETL 的核心操作流程从数据源同步、多表关联、字段处理到数据过滤与分流输出每一步都亲自动手完成对 ETL 数据处理的逻辑有了更直观的理解。助睿数智平台的零代码可视化操作方式降低了 ETL 任务的学习门槛无需编写复杂的 SQL 语句通过拖拽组件即可完成数据处理任务组件之间的数据流向清晰可见便于理解和调试。对于初学者来说这种方式降低了学习门槛能够快速上手完成常见的数据加工任务。

相关文章:

ETL助睿实验入门 - 订单利润分流数据加工(保姆级步骤 + 踩坑记录)

一、实验背景 1.1 实验目的 本次实验的核心目标是熟悉助睿零代码数据集成平台(ETL 平台)的核心功能与操作方法,具体来说,你将掌握以下技能: 掌握新建转换、添加组件、执行转换等 ETL 基本操作流程熟悉表输入、记录集…...

2026最权威的AI辅助写作网站解析与推荐

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 使AI生成内容比率得以降低的关键所在是对人类写作具备的随机性以及个性化特性予以模拟&#…...

使用nodejs与taotoken快速构建一个ai客服原型接口

使用 Node.js 与 Taotoken 快速构建一个 AI 客服原型接口 1. 准备工作 在开始编码前,需要完成两项准备工作。首先登录 Taotoken 控制台,在「API 密钥」页面创建一个新的密钥并妥善保存。接着在「模型广场」选择适合客服场景的模型,例如 cla…...

C++17 std::variant实战避坑:std::get和std::holds_alternative的正确打开方式

C17 std::variant实战避坑指南:安全访问与类型检查的最佳实践 在C17引入的众多现代特性中,std::variant无疑是最具实用价值的工具之一。这个类型安全的联合体(union)替代方案,允许开发者在一个变量中存储多种可能类型的…...

抖音批量下载工具架构深度解析:从URL解析到多线程下载的完整实现

抖音批量下载工具架构深度解析:从URL解析到多线程下载的完整实现 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fall…...

HSTracker:macOS炉石传说玩家的终极免费套牌追踪器指南

HSTracker:macOS炉石传说玩家的终极免费套牌追踪器指南 【免费下载链接】HSTracker A deck tracker and deck manager for Hearthstone on macOS 项目地址: https://gitcode.com/gh_mirrors/hs/HSTracker 你是否在炉石传说对战中常常忘记对手还剩什么牌&…...

如何3步快速定位Windows热键冲突的终极解决方案:热键侦探完整指南

如何3步快速定位Windows热键冲突的终极解决方案:热键侦探完整指南 【免费下载链接】hotkey-detective A small program for investigating stolen key combinations under Windows 7 and later. 项目地址: https://gitcode.com/gh_mirrors/ho/hotkey-detective …...

基于Next.js与Prisma的自动化签到平台GameClaw全栈开发实践

1. 项目概述:一个为米哈游玩家打造的自动化签到工具 如果你和我一样,是《原神》、《崩坏:星穹铁道》或者《绝区零》的玩家,那你肯定对米哈游旗下HoYoLAB社区里的每日签到不陌生。每天打开网页或者App,点一下签到按钮&…...

告别IIC通信故障:一份给STM32/ESP32开发者的硬件测试自查清单(含标准/快速/高速模式差异)

告别IIC通信故障:STM32/ESP32开发者的硬件测试实战指南 当你在调试STM32或ESP32的IIC设备时,是否遇到过这些场景:传感器偶尔无响应、数据读取出现乱码、通信在高速模式下完全失败?作为嵌入式开发者,我们往往第一时间怀…...

对比直接使用原厂 API 观察 Taotoken 在账单追溯与用量分析上的差异

对比直接使用原厂 API 观察 Taotoken 在账单追溯与用量分析上的差异 1. 多厂商账单分散的痛点 在直接使用原厂 API 的开发实践中,团队常面临账单数据分散的问题。每个厂商提供独立的计费后台,需要分别登录 OpenAI、Anthropic 等不同平台查看消耗情况。这…...

Claude Chat / Code / Cowork 40个隐藏功能全拆解

99% 用户只用了20%,这篇让你直接把 Claude 用成生产力核武器 你每月付钱给 Claude,却只用了它 20% 的功能——这可能是当前最普遍的“付费却浪费”的现象。我花了几百小时在 Claude 的三个界面(Chat、Code、Cowork)里反复实验&…...

重新定义地形创作:从数字地图到三维世界的创意革命

重新定义地形创作:从数字地图到三维世界的创意革命 【免费下载链接】heightmapper interactive heightmaps from terrain data 项目地址: https://gitcode.com/gh_mirrors/he/heightmapper 想象一下,你站在虚拟的喜马拉雅之巅,指尖轻触…...

Taotoken 用量看板如何帮助团队清晰管理 AI 调用成本

Taotoken 用量看板如何帮助团队清晰管理 AI 调用成本 1. 用量看板的核心功能 Taotoken 用量看板为团队提供了多维度的 AI 调用数据可视化能力。在控制台的「用量分析」模块中,管理者可以按时间范围筛选查看总消耗 token 数、各项目调用占比以及不同模型的调用分布…...

从Maya转Blender?这份快捷键映射与效率配置指南帮你无缝切换

从Maya转Blender?这份快捷键映射与效率配置指南帮你无缝切换 当习惯了Maya行云流水般的操作节奏后,初次打开Blender时那种手足无措的感觉,相信很多3D艺术家都深有体会。明明脑海中已经有了完整的创作流程,手指却总在键盘上方犹豫不…...

创业团队如何借助 Taotoken 的透明计费有效控制早期 AI 实验成本

创业团队如何借助 Taotoken 的透明计费有效控制早期 AI 实验成本 1. 早期 AI 实验的成本挑战 初创团队在产品原型阶段往往需要快速验证各类 AI 能力,但直接对接多个厂商 API 会面临复杂的成本管理问题。不同模型的计费规则、调用方式和用量统计分散在多个平台&…...

微信防撤回插件终极指南:Mac用户必备的消息保护神器

微信防撤回插件终极指南:Mac用户必备的消息保护神器 【免费下载链接】WeChatIntercept 微信防撤回插件,一键安装,仅MAC可用,支持v3.7.0微信 项目地址: https://gitcode.com/gh_mirrors/we/WeChatIntercept 你是否经常遇到重…...

避开DID模型三大坑:你的‘平行趋势’检验真的做对了吗?(以Stata为例)

避开DID模型三大坑:你的‘平行趋势’检验真的做对了吗?(以Stata为例) 如果你已经用DID模型跑出了显著结果,却在投稿时被审稿人质疑"识别策略有问题"或"平行趋势假设不成立",这篇文章就…...

R语言药敏分析避坑指南:oncoPredict包从安装到实战(含600M训练数据下载)

R语言药敏分析实战:oncoPredict包从安装到结果解读全流程解析 在肿瘤精准医疗领域,药物敏感性预测已成为连接基因组数据与临床决策的重要桥梁。作为生物信息学分析中的关键环节,药敏分析能帮助研究人员从海量分子数据中筛选出潜在的有效治疗药…...

别再只看1A!用AMS1117-3.3(SOT-223)时,你的实际输出电流可能只有265mA?

别再只看1A!用AMS1117-3.3(SOT-223)时,你的实际输出电流可能只有265mA? 1. 揭开LDO标称电流的真相 第一次拿到AMS1117-3.3的数据手册时,1A的输出电流参数让我眼前一亮——这么小的封装居然能承载如此大的电流?直到某次…...

跨平台数位板驱动终极指南:告别系统束缚,开启创作自由

跨平台数位板驱动终极指南:告别系统束缚,开启创作自由 【免费下载链接】OpenTabletDriver Open source, cross-platform, user-mode tablet driver 项目地址: https://gitcode.com/gh_mirrors/op/OpenTabletDriver 还在为不同操作系统下的数位板兼…...

独立开发者如何利用Taotoken快速实验不同模型的产品创意

独立开发者如何利用Taotoken快速实验不同模型的产品创意 1. 模型选型与快速接入 对于独立开发者或小型工作室而言,验证AI产品创意的第一步往往是选择合适的模型。传统方式需要逐个注册不同厂商的账号、申请API权限并学习各家的接入规范,这一过程可能消…...

Claude Code多设备同步终极指南:如何让AI助手在所有电脑上保持一致体验

Claude Code多设备同步终极指南:如何让AI助手在所有电脑上保持一致体验 【免费下载链接】claude-code Claude Code is an agentic coding tool that lives in your terminal, understands your codebase, and helps you code faster by executing routine tasks, ex…...

你的旧iPhone还能再战三年吗?让Legacy iOS Kit告诉你答案

你的旧iPhone还能再战三年吗?让Legacy iOS Kit告诉你答案 【免费下载链接】Legacy-iOS-Kit An all-in-one tool to restore/downgrade, save SHSH blobs, jailbreak legacy iOS devices, and more 项目地址: https://gitcode.com/gh_mirrors/le/Legacy-iOS-Kit …...

AI Workspace:解决团队AI编程上下文割裂的配置管理平台

1. 项目概述:AI Workspace 是什么,以及它解决了什么痛点如果你和你的团队已经开始在日常开发中大量使用 Cursor、Claude Code、GitHub Copilot 这类 AI 编程工具,那你大概率已经遇到了一个非常具体且恼人的问题:上下文割裂。想象一…...

MASA模组全家桶中文汉化包:7大实用模组一键中文化指南

MASA模组全家桶中文汉化包:7大实用模组一键中文化指南 【免费下载链接】masa-mods-chinese 一个masa mods的汉化资源包 项目地址: https://gitcode.com/gh_mirrors/ma/masa-mods-chinese 还在为Minecraft中复杂的英文模组界面而烦恼吗?MASA模组全…...

观察大模型API调用的延迟表现与路由稳定性体感

观察大模型API调用的延迟表现与路由稳定性体感 1. 日常调用中的响应速度感知 在实际开发过程中,通过Taotoken平台调用不同模型API时,响应速度是开发者最直观的体验指标之一。我们观察到,平台提供的聚合端点能够根据请求的模型类型自动选择最…...

A-MOS数字生命框架:基于本地大模型与Git记忆库的智能体实践

1. 项目整体设计与思路拆解当我第一次在GitHub上看到A-MOS这个项目时,坦白说,我被它那套“灵肉分离”的架构和“数字生命”的叙事深深吸引了。这不像是一个普通的AI工具库,更像是一个技术极客写给未来的情书。它试图回答一个非常本质的问题&a…...

暗黑破坏神2存档编辑器:5分钟掌握终极存档修改技巧

暗黑破坏神2存档编辑器:5分钟掌握终极存档修改技巧 【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 你是否曾经在暗黑破坏神2中花费数小时刷装备,却始终无法获得心仪的装备?或者想要重新体验剧…...

2026年GPT-5.5一键生成PPT教程:从零到完整演示文稿

概要在2026年的办公场景中,利用AI工具快速生成专业演示文稿已成为提升效率的关键。GPT-5.5作为当前先进的语言模型,能够理解复杂指令并生成结构化的PPT内容大纲与设计建议。对于国内用户,若想便捷地体验这一功能,推荐使用聚合平台…...

ComfyUI Manager高级配置与优化指南:专业级插件管理深度解析

ComfyUI Manager高级配置与优化指南:专业级插件管理深度解析 【免费下载链接】ComfyUI-Manager ComfyUI-Manager is an extension designed to enhance the usability of ComfyUI. It offers management functions to install, remove, disable, and enable various…...