Mysql Sink
一、介绍
mysql sink
二、支持版本
mysql5.x
三、插件名称
Sync | mysqlsink、mysqlwriter |
---|---|
SQL | mysql-x |
四、参数说明
1、Sync
connection
- 描述:数据库连接参数,包含 jdbcUrl、schema、table 等参数
- 必选:是
- 参数类型:List
- 默认值:无
"connection": [{
"jdbcUrl": ["jdbc:mysql://0.0.0.1:3306/database?useSSL=false"],
"table": ["table"],
"schema":"public"
}]
jdbcUrl
- 描述:针对关系型数据库的 jdbc 连接字符串,jdbcUrl 参考文档:MySQL 官方文档
- 必选:是
- 参数类型:string
- 默认值:无
schema
- 描述:数据库 schema 名
- 必选:否
- 参数类型:string
- 默认值:无
table
- 描述:目的表的表名称。目前只支持配置单个表,后续会支持多表
- 必选:是
- 参数类型:List
- 默认值:无
username
- 描述:数据源的用户名
- 必选:是
- 参数类型:String
- 默认值:无
password
- 描述:数据源指定用户名的密码
- 必选:是
- 参数类型:String
- 默认值:无
column
- 描述:目的表需要写入数据的字段。例如: "column": [{"name":"id",type:"varchar"}]
- 必选:是
- 参数类型:List
- 默认值:无
fullColumn
- 描述:目的表中的所有字段,字段之间用英文逗号分隔。例如: "column": ["id","name","age","hobby"],如果不配置,将在系统表中获取
- 必选:否
- 参数类型:List
- 默认值:无
preSql
- 描述:写入数据到目的表前,会先执行这里的一组标准语句
- 必选:否
- 参数类型:List
- 默认值:无
postSql
- 描述:写入数据到目的表后,会执行这里的一组标准语句
- 必选:否
- 参数类型:List
- 默认值:无
mode
- 描述:控制写入数据到目标表采用 insert into 或者 replace into 或者 ON DUPLICATE KEY UPDATE 语句
- 必选:是
- 所有选项:insert/replace/update
- 参数类型:String
- 默认值:insert
batchSize
- 描述:一次性批量提交的记录数大小,该值可以极大减少 FlinkX 与数据库的网络交互次数,并提升整体吞吐量。但是该值设置过大可能会造成 FlinkX 运行进程 OOM 情况
- 必选:否
- 参数类型:int
- 默认值:1
updateKey
- 描述:当写入模式为 update 和 replace 时,需要指定此参数的值为唯一索引字段
- 注意:
- 如果此参数为空,并且写入模式为 update 和 replace 时,应用会自动获取数据库中的唯一索引;
- 如果数据表没有唯一索引,但是写入模式配置为 update 和 replace,应用会以 insert 的方式写入数据;
- 必选:否
- 参数类型:List< String >
- 示例:"updateKey": ["id"]
- 默认值:无
semantic
- 描述:sink 端是否支持二阶段提交
- 注意:
- 如果此参数为空,默认不开启二阶段提交,即 sink 端不支持 exactly_once 语义;
- 当前只支持 exactly-once 和 at-least-once
- 必选:否
- 参数类型:String
- 示例:"semantic": "exactly-once"
- 默认值:at-least-once
2、SQL
connector
- 描述:mysql-x
- 必选:是
- 参数类型:String
- 默认值:无
url
- 描述:jdbc:mysql://localhost:3306/test
- 必选:是
- 参数类型:String
- 默认值:无
schema
- 描述:数据库 schema 名
- 必选:否
- 参数类型:string
- 默认值:无
table-name
- 描述:表名
- 必选:是
- 参数类型:String
- 默认值:无:
username
- 描述:username
- 必选:是
- 参数类型:String
- 默认值:无
password
- 描述:password
- 必选:是
- 参数类型:String
- 默认值:无
sink.buffer-flush.max-rows
- 描述:批量写数据条数,单位:条
- 必选:否
- 参数类型:String
- 默认值:1024
sink.buffer-flush.interval
- 描述:批量写时间间隔,单位:毫秒
- 必选:否
- 参数类型:String
- 默认值:10000
sink.all-replace
- 描述:是否全部替换数据库中的数据(如果数据库中原值不为 null,新值为 null,如果为 true 则会替换为 null)
- 必选:否
- 参数类型:String
- 默认值:false
sink.parallelism
- 描述:写入结果的并行度
- 必选:否
- 参数类型:String
- 默认值:无
sink.semantic
- 描述:sink 端是否支持二阶段提交
- 注意:
- 如果此参数为空,默认不开启二阶段提交,即 sink 端不支持 exactly_once 语义;
- 当前只支持 exactly-once 和 at-least-once
- 必选:否
- 参数类型:String
- 示例:"semantic": "exactly-once"
- 默认值:at-least-once
五、数据类型
是否支持 | 类型名称 |
---|---|
支持 | BOOLEAN、BIT、TINYINT、TINYINT UNSIGNED、SMALLINT、SMALLINT UNSIGNED、MEDIUMINT、MEDIUMINT UNSIGNED、 INT、INT UNSIGNED、INTEGER、INT UNSIGNED、BIGINT、BIGINT UNSIGNED、REAL、FLOAT、FLOAT UNSIGNED、DECIMAL、DECIMAL UNSIGNED、NUMERIC、DOUBLE、DOUBLE UNSIGNED、STRING、VARCHAR、CHAR、TIMESTAMP 、DATETIME、DATE、TIME、YEAR、TINYBLOB、BLOB、MEDIUMBLOB、LONGBLOB、TINYTEXT、TEXT、MEDIUMTEXT、LONGTEXT、BINARY、VARBINARY、JSON、ENUM、SET、GEOMETRY |
不支持 | ARRAY、MAP、STRUCT、UNION |
六、脚本示例
见项目内flinkx-examples
文件夹。