承接上篇《Flink学习系列(五)如何自定义实现一个flink的connector》。前几篇文章我们介绍了flink的datasource。我们介绍过flink是一个分布式计算处理框架。他重在的是计算。但是他又需要依托数据源,所以有了flink的datasource。那么当flink把数据处理完毕之后,这些数据又怎么办呢?我们前面的例子就是把数据处理完了直接打印出来。这其实就是flink的sink操作。即把处理完的数据进行下沉。
前面的print输出是一种sink,真实的业务中,我们往往需要把处理完的数据写入存储中,例如(redis,mysql,hdfs,消息队列等)。这些都可以称之为sink。
备注:对于sink来说,目前flink有提供一些常见的存储sink,但是根据实际的业务中,我们还是需要自定义去实现一个sink。下一篇我们介绍下如何自定实现一个sink。
还没有评论,来说两句吧...