背景:
后台有小伙伴问我,做数据分析的时候,经常会用到hive -e "sql" > result.csv,然后将结果导入到excel中,可是使用hive -e导出后默认的分隔符是\t,excel无法识别,所以需要将\t 转成(逗号) 该如何让做呢?
方案一:使用linux管道符替换
hive -e "select * from table_name limit 100" | sed 's/\t/,/g' > result.csv
方案二:使用 hive insert 导数据到本地,指定分隔符
insert overwrite local directory '/home/hadoop/20180303' row format delimited fields terminated by ',' select * from table_name limit 100
这两种方案基本上足够了,如果小伙伴们有更好的方案,欢迎一起交流。
点击阅读原文,获取更多学习资料。