一、背景
我们进行ETL(Extract-Transfer-Load) 过程中,经常会遇到从不同数据源获取的不同格式的数据,其中某些字段就是json格式,里面拼接了很多字段key和指标值value,今天讲一下如何解析出来相关数据。
二、hive 解析 json 数据函数
1、get_json_object
- 语法:get_json_object(json_string, ‘$.key’)
- 说明:解析json的字符串json_string,返回path指定的内容。如果输入的json字符串无效,那么返回NULL。这个函数每次只能返回一个数据项。
- 优势:一次可以解析一个json字段
select
get_json_object('{"user_name":"chimchim","age":30}', '$.user_name') as user_name,
get_json_object('{"user_name":"chimchim","age":30}', '$.age') as age
2、json_tuple
- 语法: json_tuple(json_string, k1,
本文转载自: https://blog.csdn.net/2401_84182073/article/details/137656704
版权归原作者 2401_84182073 所有, 如有侵权,请联系我们删除。
版权归原作者 2401_84182073 所有, 如有侵权,请联系我们删除。