0


基于Kettle开发的web版数据集成开源工具(data-integration)-应用篇

目录

🔼上一集:基于Kettle开发的web版数据集成开源工具(data-integration)-介绍篇

*️⃣主目录:ETL&ELT专栏

📚第一章 基本流程梳理

📗页面基本操作

登录开始->新建项目->保存项目->运行项目

开始(问题还是挺多的,不过主要还是借鉴任务编排这一块,无伤大雅)
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

select role_name,`describe`from dp_portal_role

📗对应后台服务流程

参照页面基本操作,梳理后台对应的服务及表等
在这里插入图片描述

  • 项目主要对应两种表 - 项目信息表dp_portal_project :项目编号、名称、描述、类型、状态,分组编号、名称- 项目附件信息表dp_portal_project_file :项目编号、项目文件内容project_file、项目版本号;其中project_file字段通过JSON串存放项目内容
  • 运行项目 - 调用更新项目信息接口 ProjectServiceApiController.updateSelective- 前端通过调用websocket服务,调用运行接口 ProjectExecutorController.executeById- @MessageMapping@SendToUser注解是用来处理WebSocket消息并实现广播或点对点消息推送的: 1. WebSocket客户端向服务器发送一条指向/executeById路径的消息。2. 服务器端通过@MessageMapping找到并执行executeById方法。3. 方法内部完成业务逻辑处理后,返回的结果会被自动通过WebSocket协议推送给对应用户,即在每个已认证用户的特定通道上发布结果。在这里插入图片描述在这里插入图片描述- projectExecutorService.asyncExecuteByFile- executeByFile.execute.start()- 构建TransMeta 对象,buildTransMeta(jsonxml)- 设置本地引擎执行- 创建执行器- 启动- 调用Kettle本地引擎在这里插入图片描述

📚第二章 二开思路

通过上面的流程梳理,发现任务编排工作流主要在前端,各种字段属性和

kettle

对应都是前端传给后台的,后台直接保存的

JSON

串,我这里只需要任务编排这块功能,

springcloud

也用不到,后面如果借鉴该项目,大概要做哪些事?

📗前端

应该可以直接复用,我们用的也是

vue2+element

架构

📗后端

该项目涉及的技术组件比较多,用到了

springcloud

,相对来说有点麻烦,到了具体开发阶段,涉及的就比较多了,下一步可以先简单点,就导出一个作业文件,提取相关代码,能够成功执行作业之后,在开始大刀阔斧的开展工作,一步一步推进:

  • kettle本地引擎执行代码
  • 作业文件组装、转换代码

📗后续补充:Kettle Local引擎源码使用记录


本文转载自: https://blog.csdn.net/qq_36434219/article/details/135378698
版权归原作者 韧小钊 所有, 如有侵权,请联系我们删除。

“基于Kettle开发的web版数据集成开源工具(data-integration)-应用篇”的评论:

还没有评论