Hive初认识(2)

news/2024/7/4 11:30:57

配置hive首先需要安装在hadoop主节点的linux上
需要注意的需要同时安装MYSQL
对于hive安装呢 唯一要注意的就是配置site.xml文件
配置参数 通用的首先就是


javax.jdo.option.ConnectionURL

<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://127.0.0.1:3306/hive?createDatabaseIfNotExist=true</value>
<description>JDBC connect string for a JDBC metastore</description>

java.jdo.option.ConnectionDriverName

<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
<description>Driver class name for a JDBC metastore</description>

java.jdo.ConnectionUserName

<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
<description>Username to use against metastore database</description>

java.jdo.ConnectionPassword

<name>javax.jdo.option.ConnectionPassword</name>
<value>sa</value>
<description>password to use against metastore database</description>

hive.exec.local.scratchdir

<name>hive.exec.local.scratchdir</name>
<value>/usr/tools/apache-hive-2.0.0-bin/tmp</value>
<description>Local scratch space for Hive jobs</description>

hive.downloaded.resources.dir

<name>hive.downloaded.resources.dir</name>
<value>/usr/tools/apache-hive-2.0.0-bin/tmp/resources</value>
<description>Temporary local directory for added resources in the remote file system.</description>

hive.querylog.location

<name>hive.querylog.location</name>
<value>/usr/tools/apache-hive-2.0.0-bin/tmp</value>
<description>Location of Hive run time structured log file</description>

hive.server2.logging.operation.log.location

<name>hive.server2.logging.operation.log.location</name>
<value>/usr/tools/apache-hive-2.0.0-bin/tmp/operation_logs</value>
<description>Top level directory where operation logs are stored if logging functionality is enabled</description>

配置完后,使用
schematool -initSchema -daType mysql

最后运行即可
如果报错 可能星有两个hive的site.xml信息配置出错
不然就是mysql有问题

关于hive的使用
确保集群开启
运行 hiveserver2
重新打开一个命令窗口
运行beeline
当出现
beeline>则表示运行成功
然后输入!connect jdbc:hive2://localhost:10000
会出现让你输入user和password 当输入完成后 则
会变成
0 : jdbc:hive://localhost:10000>

官网文档为
image
当然你也可以指定链接参数在命令行它的意思就是可以找到你在unix shell命令的历史记录的字符串(所以第一次登录个估计不行吧)
image

登录进入后
可以执行一些读写操作

比如讲hdfs上的文档写入到数据库中
创建数据库
create database test;
使用 数据库
use test;
创建table
create table docs(line string);
讲HDFS系统上的README.txt 文件写入到docs 表中 以字符串的形式
load data inpath '/reversetext/README.txt' overwrite into table docs;

接下来做一个简单的单词计数
操作为
select explode (split(line,'\s')) from docs;
意思为讲字符串参数 line 用空格分割开来
展示效果为 所有单个单词
接下来聚合单词 讲上条sql作为子令
select word,count(*) from (select explode(split(line,'\s'))as word from docs)a group by word;

这样的展示并未输出写入到hive数据库中或者hdfs中
我们可以通过 下面这条指令 将结果写到table表格中
create table wc_result as select word,count(*) as wccount from (select explode (split(line,'\s'))as word from docs)a group by word;

这条语句中 我们是通过创建table表名为wc_result 将上面的聚合结果当做输入写入到wc_result中 你可以发现 在这个创建的table中没有指定字段.
所以说 hive中是可以不用指定字段,但是问题在于table如何创建的.

运用hive必须会数据语言
DDL 数据定义语言 创建删除表数据库 更改表结构
DML 数据操作语言 对表的增删改查
DQL 数据查询语言 Select ..
DCL 数据库控制语言 grant priliages on , create user..


http://www.niftyadmin.cn/n/1999916.html

相关文章

mysql d是什么意思_是mysqld意思

老男孩教育每日一题:2017年3月9日-请解释下面Shell脚本中if开头的整行代码的意思及应用场景吗&#xff1f;请解释下面Shell脚本中 if开头的整行代码的意思,你见过它的应用场景么?123456if(kill -0 $pid 2>/dev/du11)thenecho"oldboy"elseecho"oldgirl"…

简单分布式爬虫

# url管理器 # url管理器 import pickle import hashlibclass UrlManager():def __init__(self):self.new_urls self.load_progress(new_urls.txt) # 未爬取url集合self.old_urls self.load_progress(old_urls.txt) # 已爬取集合def has_new_url(self):判断是否有未爬取的U…

c++ map插入key值相同的数据_不想用Object和Array存储数据,你还有Set和Map

全文共4271字&#xff0c;预计学习时长11分钟图源&#xff1a;unsplash许多年来&#xff0c;程序员们一直使用Object和Array来存储数据&#xff0c;这种趋势不仅仅局限于JavaScript。除了这两个选项外&#xff0c;没有其他选择来存储多个值和处理数据结构。然而&#xff0c;在使…

34 败走麦城

34 败走麦城 这是一个侠义英雄的结束。建安二十四年&#xff0c;关羽被杀&#xff0c;刘备集团不但痛失一员猛将&#xff0c;还永远地失去了荆州。那么&#xff0c;一个曾经威震华夏的虎将&#xff0c;为什么会一败涂地&#xff1f;在刘备方面&#xff0c;谁该为关羽的死负责呢…

关于指针传入函数

关于指针&#xff0c;有个经典的互换函数&#xff0c;来解释形参和实参。http://blog.csdn.net/jingzi123456789/article/details/51374807 。 任何东西&#xff0c;传入函数&#xff0c;其实在函数内部&#xff0c;就生成了一份拷贝。普通变量如此&#xff0c;指针也是如此。之…

mysql5.7 双向主从_docker mysql5.7主从复制搭建(双主双从)

1.1 简单说明这里用了两台服务器&#xff0c;分别是161,和163,有条件可以用四台161服务器 &#xff1a;1主1备(mysql-5.7-master-161 mysql-5.7-slave-161)端口&#xff1a;3339 和3340163服务器 &#xff1a;1主1备(mysql-5.7-master-163 mysql-5.7-slave-163)端口&#xff…

mysql4迁移5_(mysql)从digikam 4. *迁移到5. *时的数据库迁移难度

由于我的旧数据库中存在一些不一致,我遇到了同样的问题.修复后(主要是删除一些死引用)进行升级.我似乎还有另一个问题,但可能与db无关.这将显示您的问题(除了根标签外都应为空)&#xff1a;select * from Images where album not in (select Albums.id from Albums);select id,…