Hive 的查询功能是由 HDFS 和 MapReduce 结合起来实现的,对于大规模数据查询还是不建议在 hive中,因为过大数据量会造成查询十分缓慢。 Hive 与MySQL 的关系:只是借用 MySQL 来存储 hive 中的
Hive 的查询功能是由 HDFS 和 MapReduce 结合起来实现的,对于大规模数据查询还是不建议在 hive中,因为过大数据量会造成查询十分缓慢。
Hive 与MySQL 的关系:只是借用 MySQL 来存储 hive 中的表的元数据信息,称为metastore(元数据信息)。
当然了,阔以把hive的引擎换成spark,就是使用hive on spark模式,效率比mr快一些,因为spark走的内存计算