Hive中常见的数据压缩格式有哪些?

提问者:帅平 问题分类:面试刷题
Hive中常见的数据压缩格式有哪些?
2 个回答
俗世风流债
俗世风流债
常见的压缩格式有:
gzip​
bzip2​
snappy​
lzo
备注:
1、bzip2的压缩率最高,需要消耗最多CPU。gzip压缩率中等。lzo和snappy压缩率比前两个都小。
2、snappy和lzo压缩解压缩速度最佳。gzip压缩速度中等。Bzip2压缩速度慢。
3、gzip/snappy不支持切片,而lzo/bzip2支持切片
发布于:3个月前 (01-24) IP属地:四川省
一世长安べ伴你行
一世长安べ伴你行
不同的压缩格式对应的类:
1、default格式:org.apache.hadoop.io.compress.DefaultCodec
2、gzip格式:org.apache.hadoop.io.compress.GzipCodec
3、bizp2格式:org.apache.hadoop.io.compress.BZip2Codec
4、lzo格式:com.hadoop.compression.lzo.LzopCodec
5、snappy格式:org.apache.hadoop.io.compress.SnappyCodec
发布于:3个月前 (01-24) IP属地:四川省
我来回答