Hive

Apache Hive
Apache Hive
Тип	Система управления базами данных
Автор	Facebook
Разработчик	Apache Software Foundation
Написана на	Java
Операционная система	Кроссплатформенное программное обеспечение
Языки интерфейса	Английский
Первый выпуск	9 ноября 2011
Аппаратная платформа	Java Virtual Machine
Последняя версия	3.1.3 (9 апреля 2022);
Репозиторий	git.apache.org/hive.git; svn.apache.org/repos/asf…
Состояние	Активный
Лицензия	Apache License 2
Сайт	hive.apache.org

Apache Hive
Apache Hive
Тип	Система управления базами данных
Автор	Facebook
Разработчик	Apache Software Foundation
Написана на	Java
Операционная система	Кроссплатформенное программное обеспечение
Языки интерфейса	Английский
Первый выпуск	9 ноября 2011
Аппаратная платформа	Java Virtual Machine
Последняя версия	3.1.3 (9 апреля 2022);
Репозиторий	git.apache.org/hive.git; svn.apache.org/repos/asf…
Состояние	Активный
Лицензия	Apache License 2
Сайт	hive.apache.org

Hive — система управления базами данных на основе платформы Hadoop с SQL-подобным языком запросов, позволяет выполнять запросы, агрегировать и анализировать данные; компонент экосистемы Hadoop.

Создан корпорацией Facebook, в 2011 году передан под открытой лицензией в фонд Apache.

Работает напрямую с HDFS и Apache HBase, поддерживает основные форматы Hadoop. Запросы могут выполняться через Tez, Spark или Hadoop MapReduce^[3].

Язык запросов — HiveQL — приближен к SQL, при этом не реализует все возможности стандарта SQL-92. В язык встроены функции для работы с форматами XML и JSON, поддержка нескалярных типов данных, таких как массивы, структуры, ассоциативные массивы^[4], реализован достаточно широкий набор агрегатных функций, поддерживаются определяемые пользователем функции, блокировки.

Пример сеанса работы с Hive с применением HiveQL — удаление таблицы, создание таблицы, загрузка в неё данных из текстового файла и запрос для подсчёта, сколько раз каждое слово встречалось в файле:

DROP TABLE IF EXISTS docs;
CREATE TABLE docs (line STRING);
LOAD DATA INPATH 'input_file' OVERWRITE INTO TABLE docs;
CREATE TABLE word_counts AS
SELECT word, count(1) AS count FROM
 (SELECT explode(split(line, '\s')) AS word FROM docs) temp
GROUP BY word
ORDER BY word;

Официальный сайт
The Free Hive Book Архивная копия от 1 февраля 2014 на Wayback Machine
Apache Hive Wiki

[3]

[4]

[1]

[2]

Hive

Примечания

Ссылки

Категории