Flink应用开发系列(二十二)数据集转换之rebalance函数 在flink的Dataset开发中,我们可以从外部读取数据源,此时在线上的集群运行中,读取数据源之后,会为任务拆分多个task任务,此时有的task可能拿到的数据比较多,计算时间比较久,有的task可能拿到的数据比较... Rae /flink系列 /2023-08-10 /0 评论 /377 阅读
Flink应用开发系列(二十一)数据集转换之union函数 在flink的开发中,我们经常还会涉及到这样一个函数,就是union函数,他主要是把两个数据源合并到1个新的数据源里面去,如果这两个数据源里面有相同的数据,合并后的数据就会出现两份,下面我们用案例来演示下,完整代码示... Rae /flink系列 /2023-08-10 /0 评论 /380 阅读
Flink应用开发系列(二十)数据集转换之join函数 在flink开发中,我们经常也会涉及到多数据源,此时我们需要把多数据源的数据进行join操作,合并到一起,所以本文的话,我们介绍下join函数。join函数需要根据某个key进行join,两边数据源都要有对应的key... Rae /flink系列 /2023-08-08 /0 评论 /353 阅读
Flink应用开发系列(十九)数据集转换之Distinct函数 在flink开发中,如果我们想要去重的话,也会使用到distinct函数,这个distinct函数和sql是一个效果,下面我们用代码演示一下,完整代码示例如下:package org.example;i... Rae /flink系列 /2023-08-08 /0 评论 /366 阅读
Flink应用开发系列(十八)数据集转换之Reduce函数 在flink的开发中,还有一个比较常用的函数就是reduce函数,这个reduce函数是一个聚合函数,他就是mapreduce的思想,map是拆分转换,reduce就是聚合转换。在使用reduce的时候,接收到的ke... Rae /flink系列 /2023-08-08 /0 评论 /336 阅读
Flink应用开发系列(十七)数据集转换之project函数 本文的话,我们介绍dataset数据集转换常用的project函数。在开发中,有时候我们会给定一个数据集,例如:张三 16李四 17王五 18这个数据集代表的含义是用户的姓名和年龄,... Rae /flink系列 /2023-08-08 /0 评论 /354 阅读
Flink应用开发系列(十六)数据集转换之FilterFunction 本文的话,我们再介绍下FilterFunction。这里的FilterFunction主要是用于过滤数据的,当匹配的条件为true的话,就会保留数据,匹配条件为false的话,就会丢掉数据。实现FilterFunct... Rae /flink系列 /2023-08-04 /0 评论 /425 阅读
Flink应用开发系列(十五)数据集转换之MapPartitionFunction 在前面《Flink应用开发系列(十三)数据集转换之MapFunction》我们介绍了mapfunction,本文的话我们再介绍下这个mappartitionFunction。这里的mappartition和map是差... Rae /flink系列 /2023-08-04 /0 评论 /354 阅读
Flink应用开发系列(十四)数据集转换之FlatMapFunction 上一篇文章《Flink应用开发系列(十三)数据集转换之MapFunction》我们介绍了mapfunction,本文的话我们介绍flatmapfunction。mapfunction对数据转换是1对1的,本文的fla... Rae /flink系列 /2023-08-04 /0 评论 /353 阅读
Flink应用开发系列(十三)数据集转换之MapFunction 相信大家跟着前面的应用开发系列的文章进行充分的自行编码之后,对于flink应用开发都比较熟悉了。本文我们介绍下数据集转换中的mapfunction。mapfunction主要应用于map函数,这里我们可以通过mapf... Rae /flink系列 /2023-08-04 /0 评论 /456 阅读