1 个回答
主要有2种状态类型:
1、Keyed State
1、Keyed State
作用范围:与特定 Key 绑定,仅限在 keyBy() 后的算子中使用。
特点:基于 Key 分区存储,每个 Key 对应独立的状态。支持丰富的数据结构(如 ValueState、ListState)。
典型场景:窗口聚合(如每个用户的点击计数)。键控流处理(如 KeyedProcessFunction 中的状态维护)。
2、Operator State (Non-Keyed State)作用范围:与算子实例绑定,所有数据共享同一状态(无 Key 分区)。
特点:由算子并行子任务独立管理,无 Key 关联。数据结构较简单(如 ListState、UnionState)。
典型场景:Source 算子(如 Kafka 偏移量记录)。全局计数(如全链路数据条数统计)。
发布于:3周前 (05-16) IP属地:
我来回答
您需要 登录 后回答此问题!