Yum安装CDH5.5 Hive、Impala的过程详解 CDH是Cloudera公司提供的大数据解决方案,Hive与Impala是CDH的两个核心组件,可以对大数据进行分析和处理。本文将详细讲解使用yum命令在CentOS系统上安装
CDH是Cloudera公司提供的大数据解决方案,Hive与Impala是CDH的两个核心组件,可以对大数据进行分析和处理。本文将详细讲解使用yum命令在CentOS系统上安装CDH5.5 Hive、Impala的过程。
系统要求- CentOS 7.x
- root权限
在终端中执行以下命令,导入Cloudera GPG密钥:
rpm --import https://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/RPM-GPG-KEY-cloudera
步骤二:创建Cloudera.repo文件
在终端中执行以下命令,创建Cloudera.repo文件:
vim /etc/yum.repos.d/Cloudera.repo
将以下内容写入Cloudera.repo文件中:
[cloudera-cdh5]
name=Cloudera's Distribution for Hadoop, Version 5
baseurl=https://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/5/
gpgkey=https://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/RPM-GPG-KEY-cloudera
gpgcheck=1
保存并退出。
步骤三:更新yum库并安装Hive在终端中执行以下命令,更新yum库并安装Hive:
yum update
yum install hive
步骤四:更新yum库并安装Impala
在终端中执行以下命令,更新yum库并安装Impala:
yum update
yum install impala impala-server impala-shell
示例说明
示例一:使用Hive创建表
在终端中执行以下命令,启动Hive:
hive
在Hive交互界面中,使用以下命令创建一个表:
CREATE TABLE employee(emp_id int, name string, age int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE;
退出Hive交互界面:
quit;
示例二:使用Impala查询表
在终端中执行以下命令,启动Impala shell:
impala-shell
在Impala shell中,使用以下命令查询Hive创建的表:
USE default;
SELECT * FROM employee;
退出Impala shell:
自由互联热门推荐:PDF电子发票识别软件,一键识别电子发票并导入到Excel中!10大顶级数据挖掘软件!人工智能的十大作用!quit;
结论
通过yum命令可以快速安装CDH5.5 Hive、Impala,大大降低了安装和配置的难度,方便了大数据的使用和开发。