0


Hive中的CONCAT、CONCAT_WS与COLLECT_SET函数

1.CONCAT与CONCAT_WS函数

1.1 CONCAT函数

-- concat(str1, str2, ... strN) - returns the concatenation of str1, str2, ... strN or concat(bin1, bin2, ... binN) - returns the concatenation of bytes in binary data  bin1, bin2, ... binNReturnsNULLifany argument isNULL.
Example:
  >SELECT concat('abc','def')FROM src LIMIT1;'abcdef'Function class:org.apache.hadoop.hive.ql.udf.generic.GenericUDFConcat
Functiontype:BUILTIN

CONCAT(string A/col, string B/col…): 返回输入字符串连接后的结果,支持任意个输入字符串;

1.2 CONCAT_WS函数

-- concat_ws(separator, [string | array(string)]+) - returns the concatenation of the strings separated by the separator.
Example:
  >SELECT concat_ws('.','www', array('facebook','com'))FROM src LIMIT1;'www.facebook.com'Function class:org.apache.hadoop.hive.ql.udf.generic.GenericUDFConcatWS
Functiontype:BUILTIN

CONCAT_WS(separator, str1, str2,…): 特殊形式的 CONCAT()。第一个参数为剩余参数间的分隔符。分隔符可以是与剩余参数一样的字符串。如果分隔符是 NULL,返回值也将为 NULL。函数会跳过分隔符参数后的任何 NULL 和空字符串。注意:

CONCAT_WS must be "string or array<string>

2.COLLECT_SET函数

2.1 函数语法

-- collect_set(x) - Returns a set of objects with duplicate elements eliminatedFunction class:org.apache.hadoop.hive.ql.udf.generic.GenericUDAFCollectSet
Functiontype:BUILTIN

COLLECT_SET(col): 该函数只接受基本数据类型,它的主要作用是将某字段的值进行去重汇总,产生array类型字段。

3.使用案例

3.1 准备数据

nameconstellationblood_type小明白羊座A小红射手座A小刚白羊座B小丽白羊座A小虎射手座A小威白羊座B

需求:把星座和血型一样的人归类到一起。结果如下:

射手座,A 小红|小虎

白羊座,A 小明|小丽

白羊座,B 小刚|小威

3.2 代码实现

SELECT  t1.c_b
       ,CONCAT_WS("|", collect_set(t1.name))FROM(SELECT  NAME
                   ,CONCAT_WS(',', constellation , blood_type) c_b
            FROM    person_info
        ) t1
GROUPBY t1.c_b

4.总结

  • concat 用于连接字符串。
  • concat_ws 用于按照指定的分隔符连接字符串。
  • collect_setgroup byconcat_ws 一起使用可以实现"列转行"。

本文转载自: https://blog.csdn.net/weixin_44852067/article/details/136717479
版权归原作者 独影月下酌酒 所有, 如有侵权,请联系我们删除。

“Hive中的CONCAT、CONCAT_WS与COLLECT_SET函数”的评论:

还没有评论