Arenadata DB

Arenadata DB (ADB) — это распределенная аналитическая СУБД, построенная на базе MPP-системы с открытым исходным кодом Greengage DB. Она предназначена для хранения и обработки больших объемов структурированных и полуструктурированных данных (до десятков петабайт).

ТОП-10 популярных статей

Партиционирование

Партиционирование (partitioning) — это способ повышения производительности запросов за счет логического разбиения больших таблиц (например, таблиц фактов) на небольшие части, называемые партициями (partition). Партиционирование позволяет оптимизаторам запросов сканировать ограниченное число строк в таблице (на основе условий предикатов) вместо чтения всего содержимого таблицы.

Распределение данных

Распределение данных (distribution) — одна из самых важных концепций, лежащих в основе ADB. Она означает хранение данных каждой таблицы на различных сегментах кластера. При этом чем более равномерно данные распределяются между сегментами, тем выше производительность всего кластера.

Программные требования

В статье перечислен список программных требований к установке кластера Arenadata DB.

Обзор таблиц

Таблица — это основной объект данных в ADB. В целом, таблицы в ADB идентичны таблицам в любой реляционной СУБД, за исключением распределения табличных строк по различным сегментам кластера. ADB поддерживает несколько типов таблиц и вариантов сжатия данных, которые могут быть использованы для наиболее оптимального хранения данных.

Типы таблиц

ADB поддерживает несколько типов таблиц, отличающихся способом хранения данных: heap, append-optimized со строковой ориентацией (row-oriented), append-optimized с колоночной ориентацией (column-oriented). Статья поясняет особенности и возможные варианты использования каждого типа таблиц.

Обзор Arenadata DB Control

Arenadata DB Control (ADB Control) — это система мониторинга запросов Arenadata DB в режиме реального времени. В статье можно узнать о функционале, архитектуре и принципах работы ADB Control.

Обзор Arenadata DB Backup Manager

Arenadata DB Backup Manager (ADBM) — это построенная на основе pgbackrest отказоустойчивая система для управления бинарными бэкапами ADB. В статье можно узнать о функционале, архитектуре и принципах работы ADBM.

Управление spill-файлами

Spill-файлы (также известные как work-файлы) создаются на диске, если оперативной памяти становится недостаточно для хранения временных данных, формируемых при выполнении запросов к БД. Временные данные могут включать в себя хеши JOIN, результаты сортировки, перераспределенные таблицы и так далее.

Архитектура ADB

В статье описаны основные компоненты Arenadata DB (ADB) — координатор (coordinator), резервный координатор (standby coordinator) и сегменты (segment). Также приведены способы зеркалирования сегментов и возможности по интеграции с внешними системами.

Требования к оборудованию

Статья содержит список минимальных требований к CPU, RAM и диску для установки ADB, ADB Control и ADBM.

Нашли ошибку? Выделите текст и нажмите Ctrl+Enter чтобы сообщить о ней