在大数据处理的场景里面,涉及到开发的同学大概都能知道数据会长期积累,越来越多。在必要的时候我们会涉及到删除一些数据。
在fluss中我们可以给表设置一个ttl,这时候只要表里面的数据过了ttl时间,那么他就会自动给删除掉,这样可以减少很多的数据存储,是不是很方便?下面给列举个案例。
#创建一张日志表,设置表数据过期未7天 CREATE TABLE log_table1 ( order_id BIGINT, item_id BIGINT, amount INT, address STRING ) WITH ( 'bucket.num' = '3', 'table.log.ttl' = '7 days' );
执行此命令即可看到创建成功了:
这里的核心是:
'table.log.ttl' = '7 days'
这里的单位支持有:
1)天
'table.log.ttl' = '7 days'
2)小时
'table.log.ttl' = '7 hours'
3)分钟
'table.log.ttl' = '7 minutes'
4)秒
'table.log.ttl' = '7 seconds'
除了上诉3种,其他的例如月,年都是不支持的。
这种ttl的设置仅支持fluss的日志表上,如果是主键表的话是不支持table.log.ttl参数配置的。如果想要主键表实现数据的ttl,那么使用分区即可,过期的分区会被自动删除掉,分区里面的数据也会被删除掉。
还没有评论,来说两句吧...