Arenadata DB

Arenadata DB (ADB) — это распределенная аналитическая СУБД, построенная на базе MPP-системы с открытым исходным кодом Greenplum. Она предназначена для хранения и обработки больших объемов структурированных и полуструктурированных данных (до десятков петабайт).

ТОП-10 популярных статей

Партиционирование (partitioning) — это способ повышения производительности запросов за счет логического разбиения больших таблиц (например, таблиц фактов) на небольшие части, называемые партициями (partitions). Партиционирование позволяет оптимизаторам запросов сканировать ограниченное число строк в таблице (на основе условий предикатов) вместо чтения всего содержимого таблицы.

В статье описаны два способа установки кластера ADB с помощью кластерного менеджера ADCM: onine (на хостах с доступом к Интернету) и offline (без Интернета).

Распределение данных (distribution) — одна из самых важных концепций, лежащих в основе ADB. Она означает хранение данных каждой таблицы на различных сегментах кластера. При этом чем более равномерно данные распределяются между сегментами, тем выше производительность всего кластера.

В статье перечислен список программных требований к установке кластера Arenadata DB.

Перечень версий ADB 6 с описанием нового функционала, улучшений, исправленных багов и т.д.

ADB поддерживает несколько типов таблиц, отличающихся способом хранения данных: heap, append-optimized со строковой ориентацией (row-oriented), append-optimized с колоночной ориентацией (column-oriented). Статья поясняет особенности и возможные варианты использования каждого типа таблиц.

Статья содержит список минимальных требований к CPU, RAM и диску для установки ADB, ADB Control и ADBM.

Spill-файлы (также известные как work-файлы) создаются на диске, если оперативной памяти становится недостаточно для хранения временных данных, формируемых при выполнении запросов к БД. Временные данные могут включать в себя хеши JOIN, результаты сортировки, перераспределенные таблицы и так далее.

Arenadata DB Control (ADB Control) — это система мониторинга запросов Arenadata DB в режиме реального времени. В статье можно узнать о функционале, архитектуре и принципах работы ADB Control.

В статье описаны параметры, которые могут быть настроены для сервисов ADB через ADCM.

Нашли ошибку? Выделите текст и нажмите Ctrl+Enter чтобы сообщить о ней