hive 创建数据库?Hive 数据库表的基本操作,必须掌握的基本功
各位老铁们好,相信很多人对hive 创建数据库都不是特别的了解,因此呢,今天就来为大家分享下关于hive 创建数据库以及Hive 数据库表的基本操作,必须掌握的基本功的问题知识,还望可以帮助大家,解决大家的一些困惑,下面一起来看看吧!
提问为什么我要创建一个数据库创建不出来求解,怎么办
1、mysql错误码1044,权限错误
当用root创建新数据库时,发现很奇怪的问题,root权限居然无法创建数据库,看了网上很多文档说是root创建密码问题,按照网上方法修改仍然没有起效
后来发现自已原来安装过mysql,已经创建了var/lib/mysql文件夹,然后卸载重装没有删除这个文件夹,这个文件夹里面的mysql权限文件是原来的mysql用户的,新的mysql用户虽然用户名也是mysql,但是ID是不一样的,当然无法访问原来的文件,于是发原来的mysql文件夹删掉,重新安装mysql,问题解决
2、启动mysql失败,提示:The server quit without updating PID file
查看err文件,提示是设置utf-8字符问题,原因是我在mysqld下面用了:default-character-set=utf8
导致启动失败
进入/etc/my.cnf文件,把设置utf-8字符的那行删掉,mysqld下面如果要使用utf-8,设置应该为:
init_connect='SET collation_connection= utf8_unicode_ci'
init_connect='SET NAMES utf8'
character-set-server=utf8
collation-server=utf8_unicode_ci
skip-character-set-client-handshake
问题解决
3、创建新数据库hive,创建用户hive,并授权hive数据库权限给hive用户后,发现使用hive用户登录时报错:
ERROR 1045(28000): Access denied for user'hive'@'localhost'(using password: YES)
这是因为user表中有用户名为空的用户导致,把user表中的空用户删除,刷新,问题解决
执行命令如下:
delete from user where user='';
FLUSH PRIVILEGES;
在hive数据库中怎么查看表结构
1
进入HIVE之前要把HADOOP给启动起来,因为HIVE是基于HADOOP的。所有的MR计算都是在HADOOP上面进行的。
2
在命令行中输入:hive。这个时候就可以顺利的进入HIVE了。当然了,如果你想直接执行HQL脚本文件可以这样:hive-f xxxxx.hql。
3
进入hive之后一一般默认的数据库都是default。如果你切换数据库的话所建的表都会是在default数据库里面。
4
创建数据库的语法是:create database database_name;非常简单的,其实hive跟mysql的语法还是比较相似的。为什么呢?请继续往下
5
切换数据库的时候可以输入:use database_name;
查看所有数据库的时候可以输入:show databases;
查看所有表的时候可以输入:show tables
6
看表结构的时候可以输入:describe tab_name;
Hive 数据库表的基本操作,必须掌握的基本功
说明:hive的表存放位置模式是由 hive-site.xml当中的一个属性指定的,默认是存放在该配置文件设置的路径下,也可在创建数据库时单独指定存储路径。
数据库有一些描述性的属性信息,可以在创建时添加:
查看数据库的键值对信息
修改数据库的键值对信息
与mysql查询语句是一样的语法
删除一个空数据库,如果数据库下面有数据表,那么就会报错
强制删除数据库,包含数据库下面的表一起删除(请谨慎操作)
[]里的属性为可选属性,不是必须的,但是如果有可选属性,会使 sql语句的易读性更好,更标准与规范。
例如:[comment'字段注释信息'][comment'表的描述信息']等,[external]属性除外
1. CREATE TABLE
创建一个指定名字的表,如果相同名字的表已存在,则抛出异常提示:表已存在,使用时可以使用IF NOT EXISTS语句来忽略这个异常。
如果创建的表名已存在,则不会再创建,也不会抛出异常提示:表已存在。否则则自动创建该表。
2. EXTERNAL
顾名思义是外部的意思,此关键字在建表语句中让使用者可以创建一个外部表,如果不加该关键字,则默认创建内部表。
外部表在创建时必须同时指定一个指向实际数据的路径(LOCATION),Hive在创建内部表时,会将数据移动到数据仓库指向的路径;
若创建外部表,仅记录数据所在的路径,不对数据的位置作任何改变。
内部表在删除后,其元数据和数据都会被一起删除。
外部表在删除后,只删除其元数据,数据不会被删除。
3. COMMENT
用于给表的各个字段或整张表的内容作解释说明的,便于他人理解其含义。
4. PARTITIONED BY
区分表是否是分区表的关键字段,依据具体字段名和类型来决定表的分区字段。
5. CLUSTERED BY
依据column_name对表进行分桶,在 Hive中对于每一张表或分区,Hive可以通过分桶的方式将数据以更细粒度进行数据范围划分。Hive采用对列值哈希,然后除以桶的个数求余的方式决定该条记录存放在哪个桶当中。
6. SORTED BY
指定表数据的排序字段和排序规则,是正序还是倒序排列。
7. ROW FORMAT DELIMITED FIELDS TERMINATED BY''
指定表存储中列的分隔符,这里指定的是'',也可以是其他分隔符。
8. STORED AS SEQUENCEFILE|TEXTFILE|RCFILE
指定表的存储格式,如果文件数据是纯文本格式,可以使用STORED AS TEXTFILE,如果数据需要压缩,则可以使用STORED AS SEQUENCEFILE。
9. LOCATION
指定 Hive表在 hdfs里的存储路径,一般内部表(Managed Table)不需要自定义,使用配置文件中设置的路径即可。
如果创建的是一张外部表,则需要单独指定一个路径。
1.使用create table语句创建表
例子:
2.使用create table... as select...语句创建表
例子:
使用 create table... as select...语句来创建新表sub_student,此时sub_student表的结构及表数据与 t_student表一模一样,相当于直接将 t_student的表结构和表数据复制一份到 sub_student表。
注意:
(1). select中选取的列名(如果是*则表示选取所有列名)会作为新表 sub_student的列名。
(2).该种创建表的方式会改变表的属性以及结构,例如不能是外部表,只能是内部表,也不支持分区、分桶。
如果as select后的表是分区表,并且使用select*,则分区字段在新表里只是作为字段存在,而不是作为分区字段存在。
在使用该种方式创建时,create与 table之间不能加 external关键字,即不能通过该种方式创建外部目标表,默认只支持创建内部目标表。
(3).该种创建表的方式所创建的目标表存储格式会变成默认的格式textfile。
3.使用like语句创建表
例子:
注意:
(1).只是将 t_student的表结构复制给 sub1_student表。
(2).并不复制 t_student表的数据给 sub1_student表。
(3).目标表可以创建为外部表,即:
怎样查看hive建的外部表的数据库
1
进入HIVE之前要把HADOOP给启动起来,因为HIVE是基于HADOOP的。所有的MR计算都是在HADOOP上面进行的。
2
在命令行中输入:hive。这个时候就可以顺利的进入HIVE了。当然了,如果你想直接执行HQL脚本文件可以这样:hive-f xxxxx.hql。
3
进入hive之后一一般默认的数据库都是default。如果你切换数据库的话所建的表都会是在default数据库里面。
4
创建数据库的语法是:create database database_name;非常简单的,其实hive跟mysql的语法还是比较相似的。为什么呢?请继续往下
5
切换数据库的时候可以输入:use database_name;
查看所有数据库的时候可以输入:show databases;
查看所有表的时候可以输入:show tables
6
看表结构的时候可以输入:describe tab_name;
关于hive 创建数据库到此分享完毕,希望能帮助到您。