集群配置
集群配置
- 集群配置按照
公共组件
-->资源调度组件
-->存储组件
-->计算组件
的顺序进行配置 - 不同厂商Hadoop集群环境各不一样,遇到适配问题,可以尝试修改Taier源码支持
环境依赖
- SFTP服务器
组件依赖
配置组件 | 依赖组件 |
---|---|
SFTP | |
YARN | SFTP |
HDFS | SFTP、YARN |
Spark | SFTP、YARN、HDFS |
Script(on-yarn) | SFTP、YARN、HDFS |
Script(on-standalone) | SFTP |
Flink(on-yarn) | SFTP、YARN、HDFS |
Flink(on-standalone) | SFTP |
组件任务支持关系
任务类型 | 依赖组件 | 支持向导模式 | 支持脚本模式 |
---|---|---|---|
数据同步 | Flink | ✅ | ✅ |
Flink SQL | Flink | ✅ | ✅ |
Flink Jar | Flink | ||
实时采集 | Flink | ✅ | ✅ |
Spark SQL | Spark、Spark-Thrift | ||
Spark Jar | Spark | ||
Python | Script | ||
Shell | Script | ||
DataX | DataX | ✅ |
tip
组件类型的任务 需要先在集群配置好对应的组件才能使用
向导模式可以通过页面交互的方式来完成任务的配置,不需要关心不同任务的json信息如何配置,但强依赖Taier开发支持
脚本模式可以直接使用对应任务的json
来执行