博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
在hue中使用hive
阅读量:5025 次
发布时间:2019-06-12

本文共 1090 字,大约阅读时间需要 3 分钟。

一、创建新表

建表语句如下:

CREATE TABLE IF NOT EXISTS user_collection_9(  user_id string ,  seller_id string ,  product_id string , time string)  ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' ;

二、hue中向hive导入数据

首先,在文件浏览器中,将你创建表对应的文本导进来,如下图所示:

这里写图片描述

使用如下操作语句将文本数据导入到hive中。

这里写图片描述

三、hive中将选择的几张表数据导入新表

由于我的三张表结构是一样的,所以直接使用的是下面的操作语句。

CREATE TABLE user_port as SELECT * FROM user_collection_7 UNION ALL select * FROM user_collection_8 UNION all select * FROM user_collection_9

 

四、hive中的连接函数

在hive中,group_concat不能使用,使用concat_ws.

CREATE table user_collection_port as select ip as user_id,concat_ws(' ',collect_set(product_id)) as product FROM user_collection_taobao_allall GROUP BY ip having count(*)>2;

 

使用该函数操作的结果会把每个用户对应的数据连接到一起了,中间使用空格隔开,如下图所示:

这里写图片描述

五、hue中将hive中的数据导出到本地

下表结构跟上图一样,所以两列直接用了制表符作为分隔符,使用如下语句,你就会发现在“/user/qianyang/”目录下,存在

insert overwrite  directory '/user/qianyang/' row format delimited fields terminated by '\t' select * from user_789collection;

 这里写图片描述

可以在线浏览一些这个数据。

这里写图片描述

导出到windows

按照下图操作,便可将该表数据下载到本地。

这里写图片描述

 
参考资料:https://blog.csdn.net/qy20115549/article/details/78480234

转载于:https://www.cnblogs.com/shujuxiong/p/9485884.html

你可能感兴趣的文章
hdu 1010 dfs搜索
查看>>
搭建wamp环境,数据库基础知识
查看>>
android中DatePicker和TimePicker的使用
查看>>
SpringMVC源码剖析(四)- DispatcherServlet请求转发的实现
查看>>
Android中获取应用程序(包)的大小-----PackageManager的使用(二)
查看>>
Codeforces Gym 100513M M. Variable Shadowing 暴力
查看>>
浅谈 Mybatis中的 ${ } 和 #{ }的区别
查看>>
CNN 笔记
查看>>
版本更新
查看>>
SQL 单引号转义
查看>>
start
查看>>
实现手机扫描二维码页面登录,类似web微信-第三篇,手机客户端
查看>>
PHP socket客户端长连接
查看>>
7、shell函数
查看>>
【转】Apache Jmeter发送post请求
查看>>
Nginx 基本 安装..
查看>>
【凸优化】保留凸性的几个方式(交集、仿射变换、投影、线性分式变换)
查看>>
NYOJ-613//HDU-1176-免费馅饼,数字三角形的兄弟~~
查看>>
TFS --- GrantBackup Plan Permissions Error
查看>>
傅里叶级数与积分方程
查看>>