0


真香,美柚大数据研发的分布式计算任务调度系统

Big Whale

巨鲸任务调度平台为美柚大数据研发的分布式计算任务调度系统,提供Spark、Flink等批处理任务的DAG调度和流处理任务的运行管理和状态监控,并具有Yarn应用管理、重复应用检测、大内存应用检测等功能。服务基于Spring Boot 2.0开发,打包后即可运行。

概述

1.架构图

图片

2.特性

  • 基于SSH的脚本执行机制,部署简单快捷,仅需单个服务
  • 基于Yarn Rest Api的任务状态同步机制,对Spark、Flink无版本限制
  • 支持失败重试
  • 支持任务依赖
  • 支持复杂任务编排(DAG)
  • 支持流处理任务运行管理和监控
  • 支持Yarn应用管理

部署

1.准备

  • Java 1.8+
  • Mysql 5.1.0+
  • 下载项目或git clone项目
  • 为解决 github README.md 图片无法正常加载的问题,请在hosts文件中加入相关域名解析规则,参考:hosts

2.安装

  • 创建数据库:big-whale
  • 运行数据库脚本:big-whale.sql
  • 根据Spring Boot环境,配置相关数据库账号密码,以及SMTP信息
  • 配置:big-whale.properties- ssh.user: 拥有脚本执行权限的ssh远程登录用户名(平台会将该用户作为统一的脚本执行用户)- ssh.password: ssh远程登录用户密码- dingding.enabled: 是否开启钉钉告警- dingding.watcher-token: 钉钉公共群机器人Token- yarn.app-memory-threshold: Yarn应用内存上限(单位:MB),-1禁用检测- yarn.app-white-list: Yarn应用白名单列表(列表中的应用申请的内存超
标签: 大数据

本文转载自: https://blog.csdn.net/qq_33856597/article/details/139428369
版权归原作者 大牛撸码 所有, 如有侵权,请联系我们删除。

“真香,美柚大数据研发的分布式计算任务调度系统”的评论:

还没有评论