Hive中collect相关的函数有 collect_list 和 collect_set 。有时为了字段拼接效果,多和concat_ws ()函数连用。 Hive中collect相关的函数有collect_list和collect_set。 它们都是将分组中的某列转为一个数组返回,不同的是collect_list不去重而collect_set去重。 做简单的实验加深理解,创建一张实验用表,存放用户每天点播视频的记录:create table t_vi 使用collect_list窗口函数的示例如下: ``` SELECT id, val, collect_list(val) OVER (PARTITION BY id ORDER BY ts ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS val_list FROM my_table; ``` 该查询语句将my_table表中的数据按照id分组,并按照ts升序排序,然后将每个分组内的val值收集到一个列表中.

