上文《数据湖系列(十九)Iceberg+hive整合内部表使用案例》我们使用iceberg+hive的方式整合了内部表,实现了创建表,插入数据,查询数据的功能。
熟悉hive的同学也能知道我们经常在使用hive的时候,创建的表大多数还是外部表,所以这里我们演示下Iceberg+hive整合外部表使用的案例。
1)创建表
外部表的创建其实和使用hive创建其他外部表是一样的,仅是参数上的不同,要整个Iceberg外部表的话,创建表的示例语句如下:
CREATE TABLE users3( id int, name string, age int, dt string )STORED BY 'org.apache.iceberg.mr.hive.HiveIcebergStorageHandler' LOCATION 'hdfs://node1:9000/user/hive/warehouse/test1.db/users2' TBLPROPERTIES ('iceberg.catalog'='iceberg_users3');
这里创建外部表的话,主要的还是3个因素,分别是:
1、指定iceberg的存储格式。 2、指定外部的location位置 3、自定义多数据源目录
2)查询表
查询表的时候,我们还是使用hive的sql语句即可,例如:
select * from users3;
以上就是iceberg+hive整合外部表的案例。
还没有评论,来说两句吧...