2 个回答
impala的缺点有:
1、对内存的依赖较大,且完全依赖于 hive
2、只能读取文本文件,而不能直接读取自定义二进制文件
3、每当新的记录/文件被添加到HDFS中的数据目录时,该表需要被刷新
发布于:2年前 (2023-07-20) IP属地:四川省
impala的优点有:
1、基于内存运算,中间结果不需要落盘,节省了大量 I/O 开销
2、无需转换为 MapReduce,直接访问存储在 HDFS,HBase 中的数据进行作业调度,查询速度快
3、使用了数据本地化的 I/O 调度机制,尽可能将数据和计算分配在
4、同一台机器上进行,减少了网络开销
5、丰富的文件格式支持,如 TEXTFILE 、SEQUENCEFILE 、RCFile、Parquet
6、可以访问 hive 的 metastore,可以对 hive 数据直接做数据分析
发布于:2年前 (2023-07-20) IP属地:四川省
我来回答
您需要 登录 后回答此问题!