Flink应用开发系列(二十二)数据集转换之rebalance函数 在flink的Dataset开发中,我们可以从外部读取数据源,此时在线上的集群运行中,读取数据源之后,会为任务拆分多个task任务,此时有的task可能拿到的数据比较多,计算时间比较久,有的task可能拿到的数据比较... Raeflink系列2023-08-10947 阅读0 评论
热文Flink应用开发系列(二十一)数据集转换之union函数 在flink的开发中,我们经常还会涉及到这样一个函数,就是union函数,他主要是把两个数据源合并到1个新的数据源里面去,如果这两个数据源里面有相同的数据,合并后的数据就会出现两份,下面我们用案例来演示下,完整代码示... Raeflink系列2023-08-101062 阅读0 评论
Flink应用开发系列(二十)数据集转换之join函数 在flink开发中,我们经常也会涉及到多数据源,此时我们需要把多数据源的数据进行join操作,合并到一起,所以本文的话,我们介绍下join函数。join函数需要根据某个key进行join,两边数据源都要有对应的key... Raeflink系列2023-08-08867 阅读0 评论
Flink应用开发系列(十九)数据集转换之Distinct函数 在flink开发中,如果我们想要去重的话,也会使用到distinct函数,这个distinct函数和sql是一个效果,下面我们用代码演示一下,完整代码示例如下:package org.example; import ... Raeflink系列2023-08-08824 阅读0 评论
热文Flink应用开发系列(十八)数据集转换之Reduce函数 在flink的开发中,还有一个比较常用的函数就是reduce函数,这个reduce函数是一个聚合函数,他就是mapreduce的思想,map是拆分转换,reduce就是聚合转换。在使用reduce的时候,接收到的ke... Raeflink系列2023-08-081045 阅读0 评论
Flink应用开发系列(十七)数据集转换之project函数 本文的话,我们介绍dataset数据集转换常用的project函数。在开发中,有时候我们会给定一个数据集,例如:张三 16 李四 17 王五 18这个数据集代表的含义是用户的姓名和年龄,但是此时我们有这样一个需求,我... Raeflink系列2023-08-08966 阅读0 评论
热文Flink应用开发系列(十六)数据集转换之FilterFunction 本文的话,我们再介绍下FilterFunction。这里的FilterFunction主要是用于过滤数据的,当匹配的条件为true的话,就会保留数据,匹配条件为false的话,就会丢掉数据。实现FilterFunct... Raeflink系列2023-08-041261 阅读0 评论
热文Flink应用开发系列(十五)数据集转换之MapPartitionFunction 在前面《Flink应用开发系列(十三)数据集转换之MapFunction》我们介绍了mapfunction,本文的话我们再介绍下这个mappartitionFunction。这里的mappartition和map是差... Raeflink系列2023-08-041056 阅读0 评论
热文Flink应用开发系列(十四)数据集转换之FlatMapFunction 上一篇文章《Flink应用开发系列(十三)数据集转换之MapFunction》我们介绍了mapfunction,本文的话我们介绍flatmapfunction。mapfunction对数据转换是1对1的,本文的fla... Raeflink系列2023-08-041051 阅读0 评论
热文Flink应用开发系列(十三)数据集转换之MapFunction 相信大家跟着前面的应用开发系列的文章进行充分的自行编码之后,对于flink应用开发都比较熟悉了。本文我们介绍下数据集转换中的mapfunction。mapfunction主要应用于map函数,这里我们可以通过mapf... Raeflink系列2023-08-041421 阅读0 评论
Flink应用开发系列(十二)DataSet开发之将参数传递给函数 在实际的flink开发中,我们还会涉及到自定义一些参数,然后把这些参数的值传递给某些方法,这样子在这些方法里面就可以获取到对应配置的自定义参数了。在日常的java开发中,我们经常会涉及到使用构造函数向某个类函数传递参... Raeflink系列2023-08-04936 阅读0 评论
热文Flink应用开发系列(十一)DataSet开发之分布式缓存 我们知道flink这块是属于分布式计算框架,因此在实际计算的时候,会把整个job切分成很多的task,然后把一部分task聚集到A worker节点上执行,某些task聚集到B worker节点上执行。这就是整个分布... Raeflink系列2023-08-041046 阅读0 评论
Flink应用开发系列(八)DataSet开发之排序输出 上文《Flink应用开发系列(七)DataSet开发之自带的写入存储函数》我们介绍了flink开发中Dataset中写入存储的函数,但是在实际情况中,我们会涉及到排序的输出,也就是在最后的输出结果中,我们需要根据某个... Raeflink系列2023-08-02893 阅读0 评论
Flink应用开发系列(七)DataSet开发之自带的写入存储函数 上文《Flink应用开发系列(六)DataSet开发之自带的读取数据源函数》我们介绍了Flink读取数据源的自带函数,本文的话,我们介绍下Flink写入存储的自带函数。序号函数说明示例1writeAsText()按字... Raeflink系列2023-08-02845 阅读0 评论
Flink应用开发系列(六)DataSet开发之自带的读取数据源函数 在前面的文章里面,我们介绍过Dataset是从固定的数据源里面读取数据的,所以这里的话,我们列巨额下Flink自带的读取数据源相关的函数,同时也是以表格的事项列举。序号函数说明示例1readTextFile(path... Raeflink系列2023-08-02835 阅读0 评论