Kettle实现SQL Server数据到GreenPlum的每日同步调度
linux-dash
A beautiful web dashboard for Linux
项目地址:https://gitcode.com/gh_mirrors/li/linux-dash
·
1.总的调度流程,通过linux下的crontab定时执行一个包含kjb执行信息的shell脚本
2.XXXX_0_Execute_Judge转换下有两个作业,通过获取每天的同步状态值来判断是否执行同步工作,如果同步状态不满足,会发邮件告知
3.XXXX_A0_Connect_Next作业下含有四个并行执行的作业,Message_Prepare_Yes作业负责的获取到同步状态OK的Email邮件通知
4.四个并行执行的作业分别负责同步不同的模块数据(整个同步原则是小表直接同步,大表通过BCP导出,映射成GP对应的utf-8的txt外部表)
5.在所有的模块成功执行完成后,会发送同步完成的邮件通知
以上只是记录ETL项目的整理框架流程,整个过程比较复杂的地方在于超过十几个G的大表压缩传送,GBK到UTF-8的转码。
由于CSDN不能正常显示图片的问题,可以参考本人的博客园:
A beautiful web dashboard for Linux
最近提交(Master分支:3 个月前 )
186a802e
added ecosystem file for PM2 5 年前
5def40a3
Add host customization support for the NodeJS version 5 年前
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)