第五章 大数据查询Hive

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的类SQL查询功能,主要用于对大规模数据的提取转化加载(ETL)。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。

接下来,本章将详细介绍Hive的相关知识。

results matching ""

    No results matching ""