看到网上关于kettle的大多是老的版本,所以打算自己写一个最新版的怎么来使用kettle的。

什么是kettle?

在现在大数据的时代,必然少不了ETL工具,市面上有很多的ETL工具,有收费的,免费的,开源的。我这里使用的是比较方面的kettle

解释一下ETL

 ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、交互转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。

下面是百度给出的解释。

Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定。

Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。

外文名     Kettle

中文名   水壶

产    品     Spoon、Pan、CHEF、Kitchen

脚本文件

transformation和job

特    点

绿色无需安装   最新版本8.2

介绍

KETTLE图KETTLE图 [1]

Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。

Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

作为Pentaho的一个重要组成部分,现在在国内项目应用上逐渐增

多。

运行平台支持

kettle 8.2版本可以支持windows、linux和mac os操作系统

产品家族

Kettle家族目前包括4个产品:Spoon、Pan、CHEF、Kitchen。

SPOON 允许你通过图形界面来设计ETL转换过程(Transformation)。

PAN 允许你批量运行由Spoon设计的ETL转换 (例如使用一个时间调度器)。Pan是一个后台执行的程序,没有图形界面。

CHEF 允许你创建任务(Job)。 任务通过允许每个转换,任务,脚本等等,更有利于自动化更新数据仓库的复杂工作。任务通过允许每个转换,任务,脚本等等。任务将会被检查,看看是否正确地运行了。

KITCHEN 允许你批量使用由Chef设计的任务 (例如使用一个时间调度器)。KITCHEN也是一个后台运行的程序。

 

首先下载

百度进入kettle的官网

https://community.hitachivantara.com/docs/DOC-1009855

点击打开,往下面翻滚,点击8.2Stable 稳定版,在弹出的页面进行下载保存。

可能官网的下载有点慢,所以我已经下载了,保存到了百度网盘

链接:https://pan.baidu.com/s/1uaZ6Wp0OYyAF91P7qa4Qzg 
提取码:w8h4 

由于kettle使用的是java编写的,所以需要安装java环境。

下载后进行解压,由于kettle是绿色无安装板的,所以解压后找到如下图的文件,点击运行即可。

下一节讲kettle的基本使用

GitHub 加速计划 / in / integration
4.97 K
1.24 K
下载
HACS gives you a powerful UI to handle downloads of all your custom needs.
最近提交(Master分支:2 个月前 )
8d999fb4 3 个月前
3cfbe3da Co-authored-by: Erik Montnemery <erik@montnemery.com> 3 个月前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐