Flink应用开发系列(二十三)DataStream概念介绍 前面的文章我们大致的介绍完了flink中关于Dataset部分的应用开发知识点,从本文开始我们来介绍下Flink的DataStream相关的内容。DataStream API在flink应用开发中属于一种流式处理,他... Raeflink系列2023-08-14927 阅读0 评论
Flink应用开发系列(二十二)数据集转换之rebalance函数 在flink的Dataset开发中,我们可以从外部读取数据源,此时在线上的集群运行中,读取数据源之后,会为任务拆分多个task任务,此时有的task可能拿到的数据比较多,计算时间比较久,有的task可能拿到的数据比较... Raeflink系列2023-08-10941 阅读0 评论
热文Flink应用开发系列(二十一)数据集转换之union函数 在flink的开发中,我们经常还会涉及到这样一个函数,就是union函数,他主要是把两个数据源合并到1个新的数据源里面去,如果这两个数据源里面有相同的数据,合并后的数据就会出现两份,下面我们用案例来演示下,完整代码示... Raeflink系列2023-08-101048 阅读0 评论
Flink应用开发系列(二十)数据集转换之join函数 在flink开发中,我们经常也会涉及到多数据源,此时我们需要把多数据源的数据进行join操作,合并到一起,所以本文的话,我们介绍下join函数。join函数需要根据某个key进行join,两边数据源都要有对应的key... Raeflink系列2023-08-08861 阅读0 评论
Flink应用开发系列(十九)数据集转换之Distinct函数 在flink开发中,如果我们想要去重的话,也会使用到distinct函数,这个distinct函数和sql是一个效果,下面我们用代码演示一下,完整代码示例如下:package org.example; import ... Raeflink系列2023-08-08815 阅读0 评论
热文Flink应用开发系列(十八)数据集转换之Reduce函数 在flink的开发中,还有一个比较常用的函数就是reduce函数,这个reduce函数是一个聚合函数,他就是mapreduce的思想,map是拆分转换,reduce就是聚合转换。在使用reduce的时候,接收到的ke... Raeflink系列2023-08-081028 阅读0 评论
Flink应用开发系列(十七)数据集转换之project函数 本文的话,我们介绍dataset数据集转换常用的project函数。在开发中,有时候我们会给定一个数据集,例如:张三 16 李四 17 王五 18这个数据集代表的含义是用户的姓名和年龄,但是此时我们有这样一个需求,我... Raeflink系列2023-08-08952 阅读0 评论
热文Flink应用开发系列(十六)数据集转换之FilterFunction 本文的话,我们再介绍下FilterFunction。这里的FilterFunction主要是用于过滤数据的,当匹配的条件为true的话,就会保留数据,匹配条件为false的话,就会丢掉数据。实现FilterFunct... Raeflink系列2023-08-041243 阅读0 评论
热文Flink应用开发系列(十五)数据集转换之MapPartitionFunction 在前面《Flink应用开发系列(十三)数据集转换之MapFunction》我们介绍了mapfunction,本文的话我们再介绍下这个mappartitionFunction。这里的mappartition和map是差... Raeflink系列2023-08-041050 阅读0 评论
热文Flink应用开发系列(十四)数据集转换之FlatMapFunction 上一篇文章《Flink应用开发系列(十三)数据集转换之MapFunction》我们介绍了mapfunction,本文的话我们介绍flatmapfunction。mapfunction对数据转换是1对1的,本文的fla... Raeflink系列2023-08-041043 阅读0 评论
热文Flink应用开发系列(十三)数据集转换之MapFunction 相信大家跟着前面的应用开发系列的文章进行充分的自行编码之后,对于flink应用开发都比较熟悉了。本文我们介绍下数据集转换中的mapfunction。mapfunction主要应用于map函数,这里我们可以通过mapf... Raeflink系列2023-08-041405 阅读0 评论
Flink应用开发系列(十二)DataSet开发之将参数传递给函数 在实际的flink开发中,我们还会涉及到自定义一些参数,然后把这些参数的值传递给某些方法,这样子在这些方法里面就可以获取到对应配置的自定义参数了。在日常的java开发中,我们经常会涉及到使用构造函数向某个类函数传递参... Raeflink系列2023-08-04928 阅读0 评论
热文Flink应用开发系列(十一)DataSet开发之分布式缓存 我们知道flink这块是属于分布式计算框架,因此在实际计算的时候,会把整个job切分成很多的task,然后把一部分task聚集到A worker节点上执行,某些task聚集到B worker节点上执行。这就是整个分布... Raeflink系列2023-08-041034 阅读0 评论
Flink应用开发系列(十)DataSet开发之迭代之DeltaIteration 上文《Flink应用开发系列(九)DataSet开发之迭代之BulkIteration》我们介绍了BulkIteration迭代,本文的话,我们介绍下另外一个迭代,也就是DeltaIteration迭代,简称:Del... Raeflink系列2023-08-03979 阅读0 评论