Arenadata DB

Arenadata DB (ADB) — это распределенная аналитическая СУБД, построенная на базе MPP-системы с открытым исходным кодом Greengage DB. Она предназначена для хранения и обработки больших объемов структурированных и полуструктурированных данных (до десятков петабайт).

ТОП-10 популярных статей

Партиционирование (partitioning) — это способ повышения производительности запросов за счет логического разбиения больших таблиц (например, таблиц фактов) на небольшие части, называемые партициями (partition). Партиционирование позволяет оптимизаторам запросов сканировать ограниченное число строк в таблице (на основе условий предикатов) вместо чтения всего содержимого таблицы.

В статье перечислен список программных требований к установке кластера Arenadata DB.

Распределение данных (distribution) — одна из самых важных концепций, лежащих в основе ADB. Она означает хранение данных каждой таблицы на различных сегментах кластера. При этом чем более равномерно данные распределяются между сегментами, тем выше производительность всего кластера.

Статья содержит список минимальных требований к CPU, RAM и диску для установки ADB, ADB Control и ADBM.

В статье описаны основные компоненты Arenadata DB (ADB) — координатор (coordinator), резервный координатор (standby coordinator) и сегменты (segment). Также приведены способы зеркалирования сегментов и возможности по интеграции с внешними системами.

ADB поддерживает несколько типов таблиц, отличающихся способом хранения данных: heap, append-optimized со строковой ориентацией (row-oriented), append-optimized с колоночной ориентацией (column-oriented). Статья поясняет особенности и возможные варианты использования каждого типа таблиц.

Таблица — это основной объект данных в ADB. В целом, таблицы в ADB идентичны таблицам в любой реляционной СУБД, за исключением распределения табличных строк по различным сегментам кластера. ADB поддерживает несколько типов таблиц и вариантов сжатия данных, которые могут быть использованы для наиболее оптимального хранения данных.

Arenadata DB Backup Manager (ADBM) — это построенная на основе pgbackrest отказоустойчивая система для управления бинарными бэкапами ADB. В статье можно узнать о функционале, архитектуре и принципах работы ADBM.

Spill-файлы (также известные как work-файлы) создаются на диске, если оперативной памяти становится недостаточно для хранения временных данных, формируемых при выполнении запросов к БД. Временные данные могут включать в себя хеши JOIN, результаты сортировки, перераспределенные таблицы и так далее.

Arenadata DB Control (ADB Control) — это система мониторинга запросов Arenadata DB в режиме реального времени. В статье можно узнать о функционале, архитектуре и принципах работы ADB Control.

Нашли ошибку? Выделите текст и нажмите Ctrl+Enter чтобы сообщить о ней