ETL数据库迁移工具Kettle的安装配置详解

介绍: Kettle简介:Kettle 是 PDI 以前的名称,PDI 的全称是Pentaho Data Integeration,Kettle 本意是水壶的意思,表达了数据流的含义 。Kettle是一款国外开源的ETL工具,纯JAVA编写,可以在Window、linux、Unix上运行,绿色无需安装,数据抽取高效稳定 。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做 。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制 。作为Pentaho的一个重要组成部分,现在在国内项目应用上逐渐增多 。
 ETL(Extract-Transform-Load的缩写),即数据抽取、转换、装载的过程 。对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少,这里我介绍一个我在工作中使用了很久的ETL工具Kettle,本着好东西不独享的想法,跟大家分享碰撞交流一下!在使用中我感觉这个工具真的很强大,支持图形化的GUI设计界面,然后可以以工作流的形式流转,在做一些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等方面有着比较稳定的表现,其中最主要的我们通过熟练的应用它,减少了非常多的工作量,提高了我们的工作效率 。
特点免费开源


    推荐阅读