Arenadata DB

Arenadata DB (ADB) — это распределенная аналитическая СУБД, построенная на базе MPP-системы с открытым исходным кодом Greengage DB. Она предназначена для хранения и обработки больших объемов структурированных и полуструктурированных данных (до десятков петабайт).

ТОП-10 популярных статей

Партиционирование

Партиционирование (partitioning) — это способ повышения производительности запросов за счет логического разбиения больших таблиц (например, таблиц фактов) на небольшие части, называемые партициями (partition). Партиционирование позволяет оптимизаторам запросов сканировать ограниченное число строк в таблице (на основе условий предикатов) вместо чтения всего содержимого таблицы.

Программные требования

В статье перечислен список программных требований к установке кластера ADB.

Распределение данных

Распределение данных (distribution) — одна из самых важных концепций, лежащих в основе ADB. Она означает хранение данных каждой таблицы на различных сегментах кластера. При этом чем более равномерно данные распределяются между сегментами, тем выше производительность всего кластера.

Обзор таблиц

Таблица — это основной объект данных в ADB. В целом, таблицы в ADB идентичны таблицам в любой реляционной СУБД, за исключением распределения табличных строк по различным сегментам кластера. ADB поддерживает несколько типов таблиц и вариантов сжатия данных, которые могут быть использованы для наиболее оптимального хранения данных.

Архитектура ADB

В статье описаны основные компоненты Arenadata DB (ADB) — мастер (master), резервный мастер (standby master) и сегменты (segment).Также приведены способы зеркалирования сегментов и возможности по интеграции с внешними системами.

Управление spill-файлами

Spill-файлы (также известные как work-файлы) создаются на диске, если оперативной памяти становится недостаточно для хранения временных данных, формируемых при выполнении запросов к БД. Временные данные могут включать в себя хеши JOIN, результаты сортировки, перераспределенные таблицы и так далее.

Типы таблиц

ADB поддерживает несколько типов таблиц, отличающихся способом хранения данных: heap, append-optimized со строковой ориентацией (row-oriented), append-optimized с колоночной ориентацией (column-oriented). Статья поясняет особенности и возможные варианты использования каждого типа таблиц.

Кластерные действия

Как осуществлять управление кластером ADB в ADCM: запуск, остановка, активация standby master, обновление, расширение и другие действия.

Требования к оборудованию

Статья содержит список минимальных требований к CPU, RAM и диску для установки ADB.

Конфигурационные параметры

В статье описаны параметры, которые могут быть настроены для сервисов ADB через ADCM.

Нашли ошибку? Выделите текст и нажмите Ctrl+Enter чтобы сообщить о ней