Arenadata DB

Arenadata DB (ADB) — это распределенная аналитическая СУБД, построенная на базе MPP-системы с открытым исходным кодом Greenplum. Она предназначена для хранения и обработки больших объемов структурированных и полуструктурированных данных (до десятков петабайт).

ТОП-10 популярных статей

Партиционирование (partitioning) — это способ повышения производительности запросов за счет логического разбиения больших таблиц (например, таблиц фактов) на небольшие части, называемые партициями (partitions). Партиционирование позволяет оптимизаторам запросов сканировать ограниченное число строк в таблице (на основе условий предикатов) вместо чтения всего содержимого таблицы.

В статье описаны два способа установки кластера ADB с помощью кластерного менеджера ADCM: onine (на хостах с доступом к Интернету) и offline (без Интернета).

Перечень версий ADB 6 с описанием нового функционала, улучшений, исправленных багов и т.д.

В статье перечислен список программных требований к установке кластера Arenadata DB.

Распределение данных (distribution) — одна из самых важных концепций, лежащих в основе ADB. Она означает хранение данных каждой таблицы на различных сегментах кластера. При этом чем более равномерно данные распределяются между сегментами, тем выше производительность всего кластера.

Arenadata DB Backup Manager (ADBM) — это построенная на основе pgBackRest отказоустойчивая система для управления бинарными бэкапами ADB. В статье можно узнать о функционале, архитектуре и принципах работы ADBM.

Spill-файлы (также известные как work-файлы) создаются на диске, если оперативной памяти становится недостаточно для хранения временных данных, формируемых при выполнении запросов к БД. Временные данные могут включать в себя хеши JOIN, результаты сортировки, перераспределенные таблицы и так далее.

ADB поддерживает несколько типов таблиц, отличающихся способом хранения данных: heap, append-optimized со строковой ориентацией (row-oriented), append-optimized с колоночной ориентацией (column-oriented). Статья поясняет особенности и возможные варианты использования каждого типа таблиц.

В статье описаны параметры, которые могут быть настроены для сервисов ADB через ADCM.

Статья содержит список минимальных требований к CPU, RAM и диску для установки ADB, ADB Control и ADBM.

Нашли ошибку? Выделите текст и нажмите Ctrl+Enter чтобы сообщить о ней