Hive安装和使用( 三 ) _Hive

3.2.3查询和标注sql语法基本一致,例如查询一天的日活
select count(distinct cuid) from testhive;Total MapReduce CPU Time Spent: 1 minutes 5 seconds 520 msecOK2942630Time taken: 33.79 seconds, Fetched: 1 row(s)3.3 hive命令的执行方式1).CLI 方式直接执行 2).作为字符串通过shell调用hive –e执行（-S开启静默，去掉”OK”，”Time taken”）
Hql作为字符串在shell脚本中执行，查询结果可以直接导出到本地本件（默认分隔符为t）: hive -e "use ${database};select * from tb"> tb.txt如果字符串较长的话,可以按照如下方式书写,sql=$(cat <<endtag 字符串endtag)方式可以将字符串复制给sql
file_path='/home/abc.txt'sql=$(cat <<!EOFUSE pmp;set mapred.queue.names=queue3;drop table if exists people_targeted_delivery;create table people_targeted_delivery( special_tag_id int,cnt bigint);INSERT OVERWRITE LOCAL DIRECTORY $file_pathROW FORMAT DELIMITED FIELDS TERMINATED BY 't' select special_tag_id,count(1) from t_pmp_special_user_tags group by special_tag_id;!EOF)############execute begin###########echo $sql$HIVE_HOME/bin/hive -e "$sql"exitCode=$?if [ $exitCode -ne 0 ];thenecho "[ERROR] hive execute failed!"exit $exitCodefi3).作为独立文件，通过shell调用 hive –f
mytest.hql书写我们编写好的hivesql文件
hive -fmytest.hql4.配置远程机器访问基于资源隔离的原则,不可能所有的hive操作会登录到hive服务本地操作,更多的是在其他机器进行.此时我们需要配置远程访问.
4.1 远程配置使用远程模式，需要在hadoop的core-site.xml文件中添加一下属性
其中，XXX是用来代理其它用户访问hdfs的用户名，此处我的配置如下
<property><name>hadoop.proxyuser.xxx.hosts</name><value>*</value></property><property><name>hadoop.proxyuser.xxx.groups</name><value>*</value></property>重启
#启动./hadoop/sbin/start-all.sh#./hadoop/sbin/stop-all.sh#关闭安全模式 hdfs dfsadmin -safemode leave设置hive-site.xml
<property><name>hive.metastore.uris</name><value>thrift://ip:9083</value></property>设置防火墙
vi /etc/sysconfig/iptable-A INPUT -m state --state NEW -m tcp -p tcp --dport 9083 -j ACCEPT-A INPUT -m state --state NEW -m tcp -p tcp --dport 10000 -j ACCEPTsystemctl restart iptables.service启动metastore或者hiveserver2
nohup hive --service metastore &# 下面这个支持beeline连接,官方nohup hive --service hiveserver2 & 4.2 客户端配置

确保安装了java环境

yumlocalinstall jdk-8u151-linux-x64.rpm

新建一个hadoopclient 的目录,用于存放hadoopclient和hiveclient,如下.所谓客户端就是copy远程集群的目录即可

# tree -L 1.├── hadoop├── hive

配置正确环境变量

export JAVA_HOME=/usr/java/jdk1.8.0_151/export HADOOP_HOME=/home/xxx/hadoopclient/hadoopexport HIVE_HOME=/home/xxx/hadoopclient/hiveexport HIVE_CONF_DIR=${HIVE_HOME}/confexport HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib:$HADOOP_HOME/lib/native"export PATH=$JAVA_HOME/bin:$HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$HIVE_HOME/bin:$PATH

客户端发起连接

方式1 -hive

继续使用hivecli命令
hive

方式2-beeline(推荐)

beeline!connect jdbc:hive2://ip:10000#或者beeline -u jdbc:hive2://ip:10000beeline -u"jdbc:hive2://ip:10000/testdb;"

Beeline和其他工具有一些不同，执行查询都是正常的SQL输入，但是如果是一些管理的命令，比如进行连接，中断，退出，执行Beeline命令需要带上“！”，不需要终止符 。常用命令介绍：1、!connect url –连接不同的Hive2服务器2、!exit –退出shell3、!help –显示全部命令列表4、!verbose –显示查询追加的明细The Beeline CLI 支持以下命令行参数:OptionDescription--autoCommit=[true/false] ---进入一个自动提交模式：beeline --autoCommit=true--autosave=[true/false]---进入一个自动保存模式：beeline --autosave=true--color=[true/false]---显示用到的颜色：beeline --color=true--delimiterForDSV= DELIMITER ---分隔值输出格式的分隔符 。默认是“|”字符 。--fastConnect=[true/false]---在连接时，跳过组建表等对象：beeline --fastConnect=false--force=[true/false]---是否强制运行脚本：beeline--force=true--headerInterval=ROWS---输出的表间隔格式，默认是100: beeline --headerInterval=50--help ---帮助beeline --help--hiveconf property=value---设置属性值，以防被hive.conf.restricted.list重置：beeline --hiveconf prop1=value1--hivevar name=value---设置变量名：beeline --hivevar var1=value1--incremental=[true/false]---输出增量--isolation=LEVEL---设置事务隔离级别：beeline --isolation=TRANSACTION_SERIALIZABLE--maxColumnWidth=MAXCOLWIDTH ---设置字符串列的最大宽度：beeline --maxColumnWidth=25--maxWidth=MAXWIDTH ---设置截断数据的最大宽度：beeline --maxWidth=150--nullemptystring=[true/false]---打印空字符串：beeline --nullemptystring=false--numberFormat=[pattern]---数字使用DecimalFormat：beeline --numberFormat="#,###,##0.00"--outputformat=[table/vertical/csv/tsv/dsv/csv2/tsv2] ---输出格式：beeline --outputformat=tsv--showHeader=[true/false]---显示查询结果的列名：beeline --showHeader=false--showNestedErrs=[true/false] ---显示嵌套错误：beeline --showNestedErrs=true--showWarnings=[true/false] ---显示警告：beeline --showWarnings=true--silent=[true/false]---减少显示的信息量：beeline --silent=true--truncateTable=[true/false] ---是否在客户端截断表的列--verbose=[true/false]---显示详细错误信息和调试信息：beeline --verbose=true-d <driver class>---使用一个驱动类：beeline -d driver_class-e <query>---使用一个查询语句：beeline -e "query_string"-f <file>---加载一个文件：beeline -f filepath多个文件用-e file1 -e file2-n <username>---加载一个用户名：beeline -n valid_user-p <password>---加载一个密码：beeline -p valid_password-u <database URL> ---加载一个JDBC连接字符串：beeline -u db_URL
上一页
1
2
3
4
下一页
		  	






























推荐阅读

           
                  
              
                  萌小糸说历史|中华上下五千年的十大猛将排行榜！ 
                
                   
                
              
            

                  
              
                  人民车市|难掩分化加剧，自主品牌7月销量回暖 
                
                   
                
              
            

                  
              
                  前沿最炫奇葩秀|木木的街拍：小外套，藏不住真相 
                
                   
                
              
            

                  
              
                  开发一站式购物平台（app），支持淘宝、京东、当当、卓越，技术上可行吗大致该咋做 
                
                   
                
              
            

                  
              
                  鞭牛士|薇娅与其丈夫间接持股40%，杭州爱娅生物科技有限公司注销 
                
                   
                
              
            

                  
              
                  #孩子#疫情期间，如何帮助孩子养成健康的生活作息？ 
                
                   
                
              
            

                  
              
                  练瑜伽美图|圈粉百万，又燃又励志！肥宅减重20斤成健身博主 
                
                   
                
              
            

                  
              
                  玩懂手机华为Mate X2折叠屏新机3C认证曝光：支持66W快充 
                
                   
                
              
            

                  
              
                  「外交部」驻立陶宛使馆为留学生送温暖 
                
                   
                
              
            

                  
              
                  王学刚律师团队的“破冰”之旅 
                
                   
                
              
            

                  
              
                  饺子|夏天此菜要多吃，钙是鸡肉的7倍，只要1元一斤，用来包饺子超级香 
                
                   
                
              
            

                  
              
                  有声绘本故事@有声绘本故事《和爷爷奶奶过周末》 
                
                   
                
              
            

                  
              
                  「爱笑的傻猫」幽默笑话：让你知道什么叫做好马不吃回头草 
                
                   
                
              
            

                  
              
                  「食材」大胃王挑战80个“炸鸡腿”，转换镜头一看穿帮，直接掉粉70万！ 
                
                   
                
              
            

                  
              
                  炸杏鲍菇怎么做不软还酥脆 炸杏鲍菇如何做不软还酥脆 
                
                   
                
              
            

                  
              
                  烹饪|15块钱一斤的石斑鱼，教你清蒸石斑鱼的做法，肉质鲜嫩，营养丰富 
                
                   
                
              
            

                  
              
                  丝瓜|这碗汤我家一周要喝10次，鲜美又滋补，秋天常喝让皮肤嫩得出水 
                
                   
                
              
            

                  
              
                  吃深绿色蔬菜能防白内障 
                
                   
                
              
            

                  
              
                  凯迪拉克·上海音乐厅年末发布“初心向前——2021音乐季1月-7月音乐会”精心策划演出，献礼建党百年 
                
                   
                
              
            

                  
              
                  虾和四季豆能一起吃吗 
                
                   
                
              
            

          

SQL 中 on 和 where 条件放置的差异 

XAI 可解释的AI ：如何使用LIME 和 SHAP更好地解释模型的预测 

打麻将的基本原则和技巧 

红茶的种类和味道,泡红茶种类 

正香红茶代表作,红茶的种类和图片大全 

鳑鲏|崔秉亮和化绍新到底是师徒么？说不割粉丝韭菜的崔秉亮终于挥刀了 

最常见的红茶有哪些,红茶的种类和图片大全 

红茶的种类和特点,云南红茶的地位 

红茶和普洱茶加工区别,熟普洱茶分种类吗 

滇红茶种类,滇红和普洱茶差别