RaeV管理员
文章 1946 篇 | 评论 3720 次

作者 Rae 发布的文章

Apache Druid系列(五)Druid导入数据介绍

正常的业务场景中,我们是需要把数据导入到Druid里面去的。所以本文我们介绍下Druid导入数据的方式。目前Druid导入数据的方式主要有2种,分别是:有界流导入和无界流导入。 这两种很多区分,就是每次导入的数据是否...

Apache Druid系列(四)Druid架构说明

上文《Apache Druid系列(三)Druid伪集群方式安装》我们演示了Druid集群的安装部署,本文我们来介绍下Druid的部署架构组件信息。整个Druid集群主要由3部分角色组成,分别是:master节点,q...

Apache Druid系列(三)Druid伪集群方式安装

本文我们来演示下Druid伪集群的安装。前置说明在部署安装druid的时候,一般我们还是建议使用集群的方式进行安装,这样可以做到存算分离,在druid进行安装的时候从大体上主要分为3类节点,分别是:1、master节...

Apache Druid系列(一)Druid介绍

Apache Druid是一个分布式的,支持多维度实时在线OLAP分析的大数据处理系统。在部分的企业里面,关于大数据实时查询分析的场景里面都有用到这里的Apache Druid。所以这里我们写一个系列的文章,简单的介...

数据湖系列(十八)Iceberg介绍

前面我们介绍了hudi相关的数据湖信息,介绍的算是比较少的,主要是因为hudi我用的不多,并且hudi主要和spark的兼容性会比较强一点,个人感觉使用局限性比较大。所以hudi相关的信息介绍确实比较少一点,这里的话...