当前位置: 首页 > news >正文

[Kettle] Excel输入

Excel文件采用表格的形式,数据显示直观,操作方便

Excel文件采用工作表存储数据,一个文件有多张不同名称的工作表,分别存放相同字段或不同字段的数据

数据源

物理成绩(Kettle数据集2).xls icon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88509178?spm=1001.2014.3001.5501

1. 建立【Excel输入】转换工程

使用Ctrl+N快捷键,创建【转换1】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,如下图所示

2. 设置【Excel输入】组件参数

双击【Excel输入】组件,弹出【Excel输入】对话框,其中显示默认的【文件】对话框,如下图所示

需要注意的是,【Excel输入】对话框下方的【预览记录】按钮是灰色的,表示不能单击该按钮

在【Excel输入】对话框中,包含组件的基础参数,以及【文件】【工作表】【内容】【错误处理】【字段】【其他输出字段】6个选项卡的参数

【文件】【工作表】【字段】选项卡的参数是必填项 (没有设置参数时,选项卡名称前面会显示""符号,表示是必填项,设置参数后""符号会消失),并且必须按照【文件】【工作表】【字段】选项卡的顺序设置,其他为可选项

【文件】选项卡参数

在【文件】选项卡参数的说明如下表所示

参数名称

说明

表格类型(引擎)

表示Excel文件的表格类型,类型如下
Excel 97-2003 XLS:JXL软件后端提供向后兼容类型
Excel 2007 XLSX (Apache POI):读取所有已知的Excel文件类型
Excel 2007 XLSX (Apache POI流):读取大型Excel文件
Open Office ODS:使用ODFDOM引擎读取OpenOffice电子表格
默认为Excel 97-2003 XLS

文件或目录

表示要输入的Excel文件或所在的目录,可以单击【浏览】按钮获取Excel文件或目录。默认值为空

正则表达式

表示使用正则表达式,获取文件相应的Excel文件。使用正则表达式,可以动态匹配获取多个Excel文件。默认值为空
正则表达式(排除)

表示排除型的正则表达式,与正则表达式相反,使用排除型的正则表达式,排除掉匹配文件,而获取不匹配的Excel文件。默认值为空

password

表示读取Excel文件的密码。一些Excel文件有读取密码,因此要输入密码才能获取,默认值为空

文件和目录

表示选中的Excel文件或目录,单击【增加】按钮,读入经过浏览获取的文件和目录
通配符号表示使用通配符号选中Excel文件或目录。配置符合通配符号规则的多个Excel文件
通配符号(排除)表示使用排除性通配符号选中Excel文件或目录。配置符合通配符号(排除)规则外的其他多个Excel文件
要求表示配置所需的源文件的位置
包括子目录表示是否包括子目录的文件
选中的文件

表示选中的Excel文件列表。通过单击【增加】按钮将文件或目录添加到列表中,并进行参数设置,参数有:【文件/目录】【通配符号】【通配符号(排除)】【要求】【包括子目录】等参数,有关参数的说明如下表所示。至少要有一个选中的Excel文件,默认值为空

从前面的步骤获取文件名表示是否从前面组件(步骤)读取文件名,如果选择是,则不用本组件获取Excel文件,而是从前面步骤的组件中读取文件、并保存文件的字段名。默认值为空

在【文件】选项卡中,设置参数,并导入“物理成绩.xls”文件,步骤如下所示

(1) 浏览导入Excel文件

单击【浏览(B)…】按钮,在计算机上浏览并导入“物理成绩.xls”文件,如下图所示

(2) 添加并编辑Excel文件

单击【增加】按钮,将【文件或目录】输入框中的"C:\Users\HP\Desktop\物理成绩.xls"文件,添加至【选中的文件】表中,如下图所示

如果选中的文件有问题,那么单击【删除】或【编辑】按钮,即可对选中的Excel文件进行编辑。其中,单击【选中的文件】表的行号,再单击【删除】按钮,即可删除选中所在行的文件 

(3) 查看被选中的文件名称

单击【显示文件名称…】按钮,弹出【文件读取】对话框,查看被选中读取的文件,如下图所示

重复步骤(1)~(3),可以添加多个Excel文件,并查看读取的文件名称 

提示Tips

另外,如果需要导入同一个目录下的多份名称类似的文件,如导入同一个目录下名称分别为“物理成绩.xls”“物理成绩1.xls”和“物理成绩2.xls”的文件

我们可以使用通配符的方式导入,具体操作是在【选中的文件】参数表中,在【文件/目录】输入框中键入“C:\Users\HP\Desktop\”,在【通配符号】输入框中键入“物理成绩*.\.xls”,可以一次性读入这3个文件,如图所示

【工作表】选项卡参数 

单击【工作表】选项卡,如下图所示

在【要读取的工作表列表】表中设置工作表参数,获取导入的Excel文件的工作表,【工作表】选项卡参数的说明如下表所示

参数名称说明
工作表名称

表示Excel文件的工作表名称。可以是一个Excel文件、多个工作表,也可以是多个Excel文件、多个工作表。不同的文件,工作表名称可以相同。默认值为空

起始行表示要读取的工作表中的开始行,行号是从0开始。默认值为空
起始列表示要读取的工作表中的开始列,列号是从0开始。默认值为空

在【工作表】选项卡中,设置导入的Excel文件的工作表参数,步骤如下所示

(1) 获取选中文件的工作表

单击【获取工作表名称…】按钮,弹出【输入列表】对话框,左边【可用项目】列表列出选中文件的所有工作表,如"物理成绩.xls"文件的"Sheet1"工作表,而右边【你的选择】列表列出被选中的工作表,如图所示

(2)选择工作表

在【输入列表】对话框中,单击中间的【>】【>>】【<】【<<】按钮,可以在左、右列表中,选中或移除工作表,有关按钮说明如下表所示

按钮说明
>表示右移按钮,选择左边【可用项目】列表中一个工作表,移到右边【你的选择】列表中

<

表示左移按钮,将右边【你的选择】列表中的一个工作表移回到左边【可用项目】列表中,与【>】按钮操作相反
>>表示右移批处理按钮,将左边【可用项目】列表中的所有工作表,移到右边【你的选择】列表中
<<表示左移批处理按钮,将右边【你的选择】列表中的所有工作表,移回到左边【可用项目】列表中,与【>>】按钮操作相反

在【输入列表】对话框中,将左边【可用项目】工作表"Sheet1"选中移到右边【你的选择】表中 

(3) 设置选中的工作表参数

单击【确定】按钮,将【你的选择】列表选中的“Sheet1”工作表添加至【要读取的工作表列表】表中进行参数设置,【起始行】和【起始列】参数都设置为"0",此时完成【工作表】选项卡参数的设置,如下图所示

提示Tips

如果导入的Excel文件中的每个工作表的字段结构都相同,那么在【要读取的工作表列表】表中的第1行,不设置任何工作表名称(即【工作表名称】输入栏留空),只需设置第1行的【起始行】和【起始列】输入栏参数,这样的设置是读取所有的工作表,即第1行将用于所有工作表

【字段】选项卡参数

单击【字段】选项卡,如下图所示

在【字段】选项卡中,设置"物理成绩.xls"文件中字段的参数,步骤如下所示

(1) 获取字段

单击【获取头部数据的字段…】按钮,添加字段到【字段】表中设置字段参数,如下图所示

(2) 设置字段参数

对字段参数进行设置,如下图所示,此时完成【字段】选项卡参数的设置

当获取字段后,【Excel输入】对话框下方【预览记录】按键的字体显示为黑色,说明此时可以预览数据

提示Tips

需要说明的是,如果有些Excel文件的文件头部没有字段数据,那么系统会自动生成默认的字段名称,也可以重新编辑字段名称,字段的类型、长度等字段属性

【内容】选项卡参数

单击【内容】选项卡,如下图所示

对读取Excel文件内容进行参数设置,一般按照缺省值配置,参数的说明如下表所示

参数名称说明
头部表示对选中的工作表是否包含表头行。默认值为√
非空记录表示是否在输出中不出现空行(记录)。默认值为√
停在空记录表示当读取记录遇到空行时,选择是否停止读取文件的当前工作表。默认值为空
限制表示限制生成的记录数量。当设置为0时,结果不受限制。默认值为0
编码表示读入的文本文件编码。第一次使用时,Kettle会在系统中搜索可用的编码。使用Unicode的,请指定UTF-8或UTF-16。默认值为Kettle系统的编码

【错误处理】选项卡参数 

单击【错误处理】选项卡,如下图所示,可对获取Excel文件时产生的错误处理参数进行设置,检查和定位错误位置,一般按照缺省值配置

【其他输出字段】选项卡参数

单击【其他输出字段】选项卡,如下图所示

对Excel文件的其他输出字段参数进行设置,用于指定处理文件的附加信息,默认值为空,一般按照缺省值配置,有关参数的说明如下表所示

字段参数说明
文件名称字段表示指定完整的文件名称和扩展名的字段。默认值为空
工作表名称字段表示指定要使用的工作表名称的字段。默认值为空
表单的行号列表示指定要使用的当前工作表行号字段。默认值为空
行号列表示指定写入行数的字段。默认值为空
文件名字段表示指定文件名但没有路径信息、但有扩展名的字段。默认值为空
扩展字段表示指定文件名扩展名的字段。默认值为空
路径字段表示指定以操作系统格式包含路径的字段。默认值为空
文件大小字段表示指定文件数据大小的字段。默认值为空
是否为文件隐藏字段表示文件是否为隐藏的字段(布尔值)。默认值为空
Uri字段表示指定包含Uri的字段。默认值为空
Root Uri字段表示指定仅包含uri的根部分的字段。默认值为空

3. 预览结果数据

设置好字段参数后,单击【预览记录】按钮,弹出【预览数据数量】对话框,要预览的行数采用默认值,并单击【确定】按钮

弹出【预览数据】对话框,展示Excel输入的数据,如下图所示

相关文章:

[Kettle] Excel输入

Excel文件采用表格的形式&#xff0c;数据显示直观&#xff0c;操作方便 Excel文件采用工作表存储数据&#xff0c;一个文件有多张不同名称的工作表&#xff0c;分别存放相同字段或不同字段的数据 数据源 物理成绩(Kettle数据集2).xls https://download.csdn.net/download/H…...

vue3+ts 项目遇到的问题和bug

1.router中使用pinia报错 pinia.mjs:1709 Uncaught Error: [&#x1f34d;]: "getActivePinia()" was called but there was no active Pinia. Are you trying to use a store before calling "app.use(pinia)"? See https://pinia.vuejs.org/core-concep…...

【Linux】补充:进程管理之手动控制进程,以及计划任务

目录 一、手动启动进程 1、理解前台启动与后台启动 2、如何完成前台启动后台启动的切换 3、完成并行执行多个任务 4、结束进程 1、kill 2、killall 2、pkill 二、计划任务 1、at一次性计划任务 2、实操 2、周期性计划任务 1、关于设置周期性任务的配置文件以及格式…...

听说,工作能力强的项目经理都有这几个特征

大家好&#xff0c;我是老原。 很多项目经理每天忙忙碌碌&#xff0c;但是一看结果&#xff0c;团队业绩没有完成、人才没有培养起来、自己的管理水平和个人领导力也没有得到提升。 明明付出了很多时间和精力&#xff0c;结果却只收获了团队的抱怨&#xff0c;以及老板对你管…...

合并两个有序链表OJ

合并两个有序链表OJ 文章目录 合并两个有序链表OJ一、题目及要求二、思路分析三、代码实现 一、题目及要求 二、思路分析 其次&#xff0c;题目里说了新链表是通过拼接原来的结点形成的&#xff0c;所以说我们不需要开辟新的空间。 三、代码实现 if (list1 NULL) {return li…...

2023NOIP A层联测27 A.kotori

2023NOIP A层联测27 A.kotori 文章目录 2023NOIP A层联测27 A.kotori题目大意思路code 题目大意 琴里的飞船中有 n n n 个人&#xff0c;其中有 n − 1 n - 1 n−1 个通道&#xff0c;所以飞船的内部是一个树形结构。每个人从 1 − n 1-n 1−n 编号&#xff0c;编号越小代表…...

循环生成el-descriptions-item

0 后端返回数据格式 {"msg": "操作成功","code": 200,"data": {"id": 42,"contactInfo": [{"contactPerson": "张三","contactPhone": "13688888888"},{"contactP…...

【原创】java+swing+mysql爱心捐赠管理系统设计与实现

摘要&#xff1a; 爱心捐赠管理系统旨在管理和优化捐赠过程&#xff0c;提高效率&#xff0c;增强透明度&#xff0c;并鼓励更多的个人和企业参与公益捐赠&#xff0c;用户可以捐款或者捐物。本系统采用javaswing界面可视化技术&#xff0c;数据库使用mysql。 功能分析&#…...

【小技巧】WPS统计纯汉字(不计标点符号)

【小技巧】WPS统计纯汉字&#xff08;不计标点符号&#xff09; 首先&#xff0c;CtrlF打开查找页面&#xff1a; 选择“高级搜索”&#xff0c;然后勾选“使用通配符”&#xff0c;然后在“查找内容”后面输入&#xff1a;[一-﨩]。注意&#xff1a;一定要带“[]”和“-”且…...

【押题】24考研押题

数二选手来押24数一考研大题 1.大题必有级数。级数出在压轴题&#xff0c;考级数敛散性与数列极限的结合 2.数一倒数第二题65%考画不出图的三重积分&#xff0c;参考19年出法&#xff1b;35%考第一类曲面积分与空间解析几何的结合。大题不会考第二类线面积分 3.概率大题会考参数…...

前端设计模式

前端设计模式 &#x1f3a8; 设计模式是在软件开发中&#xff0c;针对常见问题的解决方案的经验总结。在前端开发中&#xff0c;设计模式可以帮助我们组织和管理代码&#xff0c;提高代码的可维护性和可扩展性。下面列举一些常见的前端设计模式&#xff1a; 1. 单例模式 (Sin…...

Tomcat的类加载器

详情可以参考&#xff1a;https://tomcat.apache.org/tomcat-10.1-doc/class-loader-howto.html 简要说明 Tomcat安装了多种类加载器&#xff0c;以便容器的不同部分、容器中的应用访问能够不同的类和资源。 在Java环境中&#xff0c;类加载器被组织为父-子树的形式。通常情况…...

汽车驾驶智能座舱太阳光模拟器老化试验

一、太阳光模拟器老化试验目的 太阳光模拟器氙光灯老化试验是一种常用的材料老化测试方法&#xff0c;通过模拟自然光照条件下的老化过程&#xff0c;评估材料的耐光性能和耐候性能其主要目的有: 1.评估材料在长时间暴露于自然光照条件下的耐久性能: 2.比较不同材料的耐光性…...

记录一次校园CTF--wp

一.第一题简单nc 这题直接nc 地址端口即可得到flags没有套路 二.第二题pwn:ezstack 这是一题栈溢出题目&#xff0c;查看保护&#xff1a; 没有开启PIE&#xff0c;运行下查看效果&#xff1a; 题目是一个文字购物游戏。 接着扔进IDA中分析&#xff1a; 在主函数中我们找到…...

基于减法平均算法的无人机航迹规划-附代码

基于减法平均算法的无人机航迹规划 文章目录 基于减法平均算法的无人机航迹规划1.减法平均搜索算法2.无人机飞行环境建模3.无人机航迹规划建模4.实验结果4.1地图创建4.2 航迹规划 5.参考文献6.Matlab代码 摘要&#xff1a;本文主要介绍利用减法平均算法来优化无人机航迹规划。 …...

C语言--每日五道选择题--Day4

第一题 1、如果 x2014 &#xff0c;下面函数的返回值是&#xff08; &#xff09; int fun(unsigned int x) {int n 0;while(x 1){n;x x | (x 1);}return n; } A: 20 B: 21 C: 23 D: 25 答案及解析 C 这个函数的作用是对整型中0的个数进行统计 x x | (x1) 的作用是每次…...

OpenCV图片验证码识别与滑块验证码识别

目录 图片验证码识别&#xff1a; 一、百度OCR文字识别云服务 二、维普网获取图片验证码 三、维普网opencvocr识别验证码 四、维普网selenium登录并获取数据 滑块验证码&#xff1a; 五、猎聘网获取滑块验证码 六、猎聘网opencv计算滑动距离 七、猎聘网selenium模拟滑…...

网络安全深入学习第八课——代理与端口转发

文章目录 一、什么是代理二、正向代理三、反向代理四、正向和反向代理模拟复现 一、什么是代理 代理服务器英文全称是Proxy Server&#xff0c;其功能就是代理网络用户去取得网络信息。 形象的说&#xff1a;它是网络信息的中转站。在一般情况下&#xff0c;我们使用网络浏览…...

11月7日,每日信息差

今天是2023年11月07日&#xff0c;以下是为您准备的17条信息差 第一、五粮液否认内部讨论提价传闻 第二、雷军证实小米14销量已超百万台 第三、支付宝生活号全面开放UGC入口。据了解&#xff0c;今年以来&#xff0c;支付宝生活号陆续上线了创作者中心、热点榜单等多个内容产…...

sql异常Encountered unexpected token BINARY

1.出现错误 2023-11-06 10:48:19.604 [http-nio-8091-exec-3] WARN c.b.m.e.p.i.PaginationInnerInterceptor - [autoCountSql,343] - [e322891e-de87-4d98-8456-f6448d3c165e] - optimize this sql to a count sql has exception, sql:"selects.id,s.command,s.catego…...

【JavaEE】-- HTTP

1. HTTP是什么&#xff1f; HTTP&#xff08;全称为"超文本传输协议"&#xff09;是一种应用非常广泛的应用层协议&#xff0c;HTTP是基于TCP协议的一种应用层协议。 应用层协议&#xff1a;是计算机网络协议栈中最高层的协议&#xff0c;它定义了运行在不同主机上…...

在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能

下面我将详细介绍如何使用HarmonyOS SDK在HarmonyOS 5中实现类似抖音的点赞功能&#xff0c;包括动画效果、数据同步和交互优化。 1. 基础点赞功能实现 1.1 创建数据模型 // VideoModel.ets export class VideoModel {id: string "";title: string ""…...

23-Oracle 23 ai 区块链表(Blockchain Table)

小伙伴有没有在金融强合规的领域中遇见&#xff0c;必须要保持数据不可变&#xff0c;管理员都无法修改和留痕的要求。比如医疗的电子病历中&#xff0c;影像检查检验结果不可篡改行的&#xff0c;药品追溯过程中数据只可插入无法删除的特性需求&#xff1b;登录日志、修改日志…...

【HarmonyOS 5.0】DevEco Testing:鸿蒙应用质量保障的终极武器

——全方位测试解决方案与代码实战 一、工具定位与核心能力 DevEco Testing是HarmonyOS官方推出的​​一体化测试平台​​&#xff0c;覆盖应用全生命周期测试需求&#xff0c;主要提供五大核心能力&#xff1a; ​​测试类型​​​​检测目标​​​​关键指标​​功能体验基…...

【大模型RAG】Docker 一键部署 Milvus 完整攻略

本文概要 Milvus 2.5 Stand-alone 版可通过 Docker 在几分钟内完成安装&#xff1b;只需暴露 19530&#xff08;gRPC&#xff09;与 9091&#xff08;HTTP/WebUI&#xff09;两个端口&#xff0c;即可让本地电脑通过 PyMilvus 或浏览器访问远程 Linux 服务器上的 Milvus。下面…...

【论文笔记】若干矿井粉尘检测算法概述

总的来说&#xff0c;传统机器学习、传统机器学习与深度学习的结合、LSTM等算法所需要的数据集来源于矿井传感器测量的粉尘浓度&#xff0c;通过建立回归模型来预测未来矿井的粉尘浓度。传统机器学习算法性能易受数据中极端值的影响。YOLO等计算机视觉算法所需要的数据集来源于…...

TRS收益互换:跨境资本流动的金融创新工具与系统化解决方案

一、TRS收益互换的本质与业务逻辑 &#xff08;一&#xff09;概念解析 TRS&#xff08;Total Return Swap&#xff09;收益互换是一种金融衍生工具&#xff0c;指交易双方约定在未来一定期限内&#xff0c;基于特定资产或指数的表现进行现金流交换的协议。其核心特征包括&am…...

土地利用/土地覆盖遥感解译与基于CLUE模型未来变化情景预测;从基础到高级,涵盖ArcGIS数据处理、ENVI遥感解译与CLUE模型情景模拟等

&#x1f50d; 土地利用/土地覆盖数据是生态、环境和气象等诸多领域模型的关键输入参数。通过遥感影像解译技术&#xff0c;可以精准获取历史或当前任何一个区域的土地利用/土地覆盖情况。这些数据不仅能够用于评估区域生态环境的变化趋势&#xff0c;还能有效评价重大生态工程…...

智能仓储的未来:自动化、AI与数据分析如何重塑物流中心

当仓库学会“思考”&#xff0c;物流的终极形态正在诞生 想象这样的场景&#xff1a; 凌晨3点&#xff0c;某物流中心灯火通明却空无一人。AGV机器人集群根据实时订单动态规划路径&#xff1b;AI视觉系统在0.1秒内扫描包裹信息&#xff1b;数字孪生平台正模拟次日峰值流量压力…...

Spring Cloud Gateway 中自定义验证码接口返回 404 的排查与解决

Spring Cloud Gateway 中自定义验证码接口返回 404 的排查与解决 问题背景 在一个基于 Spring Cloud Gateway WebFlux 构建的微服务项目中&#xff0c;新增了一个本地验证码接口 /code&#xff0c;使用函数式路由&#xff08;RouterFunction&#xff09;和 Hutool 的 Circle…...