Arenadata Hyperwave
Arenadata Hyperwave (ADH) — это универсальная гибридная платформа, основанная на компонентах с открытым исходным кодом и проприетарной разработке, предназначенная для хранения, обработки и анализа данных любой структуры и объема.
ТОП-10 популярных статей
Обзор Apache Iceberg — открытого формата таблиц для больших хранилищ данных, который обеспечивает ACID-транзакции, перемещение во времени (time travel), изменение схемы (schema evolution), изменение партиции (partition evolution) и предоставляет другие возможности работы с данными.
Обзор архитектуры HDFS (Hadoop Distributed File System) — распределенной файловой системы, которая обеспечивает высокую отказоустойчивость на оборудовании с низкой стоимостью.
Описание наиболее распространенных HDFS-команд с примерами.
Обзор сервиса Ozone — распределенного хранилища объектов, использующего формат ключ/значение и оптимизированного для работы как с сервисами Hadoop, так и с хранилищами S3.
Список требований к программному обеспечению для работы c кластером Arenadata Hyperwave.
Apache Iceberg — это открытый, высокопроизводительный формат для больших аналитических таблиц. Сервис ADH Spark3 поддерживает данный формат, позволяя взаимодействовать с таблицами Iceberg через Spark.
Обзор сервиса Trino — движка SQL-запросов с открытым исходным кодом, используемого для параллельной обработки данных, распределенных по хранилищам разного типа, таких как объектные хранилища (S3), базы данных и файловые системы.
Описание встроенного каталога Trino для работы с таблицами Iceberg. Данный каталог использует коннектор Iceberg и готов к работе с таблицами Iceberg, хранящимися в кластере ADH.
Таблицы с сетевыми требованиями к установке Arenadata Hyperwave: порты сервисов ADH, порты JMX, переопределяемые со стороны Kerberos порты, клиентские порты.
Анализ плана выполнения запросов Hive с помощью команд EXPLAIN и ANALYZE.