浏览器网站建设的步骤过程,oppo商城,wordpress编辑主页,东莞定制网页设计Pentaho Data Integration (PDI, also called Kettle),是pentaho的etl工具.虽然etl工具一般都用在数据仓库环境中,可是,PDI还是可以做以下事情: 1)在数据库或应用系统间迁移数据. 2)把数据导成为检系统 3)大数据的批量倒入数据库。 4#xff09;系统整合。 5#xff09;数据清…Pentaho Data Integration (PDI, also called Kettle),是pentaho的etl工具.虽然etl工具一般都用在数据仓库环境中,可是,PDI还是可以做以下事情: 1)在数据库或应用系统间迁移数据. 2)把数据导成为检系统 3)大数据的批量倒入数据库。 4系统整合。 5数据清洗。 PDI的使用非常简单每一步基本上都可以听过图形化的工具来完成而不需要写代码。从这个意义上说PDI是面向元数据的。 PDI既可以作为一个单独工具使用也可以作为pentaho的整个软件包的一部分使用。作为一个单独的工具PDI支持各种数据源的输入和输出包括 文本文件数据表各种商业化的数据库引擎。PDI允许你对数据进行各种精细的控制。 现在我们通过传统的“Hello world”的例子来展示使用PDI是多么的简单。 1下载PDI 2spoon的简介 spoon是一个图形化的工具用来设计和测试PDI要使用的过程等。设计测试完毕后可以在终端窗口运行。 In Spoon, you build Jobs and Transformations. PDI offers two methods to save them: Database repositoryFiles3例子 a)源数据是一个csv文件内容如下 last_name, nameSuarez,MariaGuimaraes,JoaoRush,JenniferOrtiz,CamilaRodriguez,Carmenda Silva,Zoe b)经过转换后变为xml文件期望值如下 - Rows - row msgHello, Maria!/msg /row - row msgHello, Joao!/msg /row - row msgHello, Jennifer!/msg /row - row msgHello, Camila!/msg /row - row msgHello, Carmen!/msg /row - row msgHello, Zoe!/msg /row /Rows 下面是具体操作 第一步菜单选择文件--〉新建--〉转换 第二步设置。对转换过程进行设置。如上图。 命名并保存。 使用 Steps and Hops构建转换的骨架。 在转换里面step是最小的单元步骤。step的种类非常繁多基本上可以归纳成几类比如input和output还有其他归类。每一个step都认为是 完成一个工作比如恢复数据集合等。 而hop是在两个step之间数据转换流动的图示。包含数据的起始和传递方向。 我们这次转换例子包含三个步骤 1读取csv文件。 2加入问候语句。 3存成xml文件。 To the left of the workspace is the Steps Palette. Select the Input category.Drag the CSV file onto the workspace on the right.Select the Scripting category.Drag the Modified JavaScript Value icon to the workspace.Select the Output category.Drag the XML Output icon to the workspace. 下面选择第一个step按住shift键拖到第二个step上。 同样操作第二个到第三个。 现在配置第一个step双击它。可以看到 这里还有2个步骤get fields和preview。 转载于:https://www.cnblogs.com/aomi/archive/2013/05/16/3082505.html