最近公司一个同事离职,由我来接手他手上的一个项目,我负责开发后台,因为设计到脚本统计数据,需要做定时任务将日表数据统计到月表或者年表。于是该项目用到了Kettle,用了之后才发现,这是个好东西啊。

一.了解Kettle工具

Kettle最早是一个开源的ETL工具,以Java开发,支持跨平台运行,其特性包括:支持100%无编码、拖拽方式开发ETL数据管道;可对接包括传统数据库、文件、大数据平台、接口、流数据等数据源;支持ETL数据管道加入机器学习算法。

二.Kettle下载和安装

1.官网下载地址:https://sourceforge.net/projects/pentaho/files/Data%20Integration/
2.Kettle是纯JAVA编程的开源软件,本地环境配置JDK1.7以上即可运行,解压后直接使用无需安装。
3.准备连接数据库的驱动
数据库驱动,驱动一般放在kettle根目录的bin或者lib下面,然后到服务中启动mysql,重启kettle。

三.Kettle使用

1.运行Spoon.bat,打开spoon图形工具

在这里插入图片描述
在这里插入图片描述

2.创建连接资源库

这里测试,用我本地两个不同的数据库(mysql,oracle)做一个数据的转换

a.新建–转换

在这里插入图片描述

b.添加db数据源

在这里插入图片描述

c.添加一个表输入和表输出

在这里插入图片描述

d.表输入 编辑

在这里插入图片描述

e.表输出 编辑

在这里插入图片描述

f.运行这个转换

在这里插入图片描述

g.查看表数据是否已经成功转换过来

在这里插入图片描述

h.最后将这个文件保存的时候,生成一个ktr文件。

在这里插入图片描述

再我的日常开发中,将这个ktr脚本文件放在主机目录上,通过的命令定时每月一号零点运行,就可以将日表统计的数据,导入到月表中。

后续还有很多值得研究和学习的地方,可以慢慢挖掘,这里只是做个简单的测试。

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐