Arenadata DB

Arenadata DB (ADB) — это распределенная аналитическая СУБД, построенная на базе MPP-системы с открытым исходным кодом Greenplum. Она предназначена для хранения и обработки больших объемов структурированных и полуструктурированных данных (до десятков петабайт).

ТОП-10 популярных статей

Партиционирование (partitioning) — это способ повышения производительности запросов за счет логического разбиения больших таблиц (например, таблиц фактов) на небольшие части, называемые партициями (partitions). Партиционирование позволяет оптимизаторам запросов сканировать ограниченное число строк в таблице (на основе условий предикатов) вместо чтения всего содержимого таблицы.

Распределение данных (distribution) — одна из самых важных концепций, лежащих в основе ADB. Она означает хранение данных каждой таблицы на различных сегментах кластера. При этом чем более равномерно данные распределяются между сегментами, тем выше производительность всего кластера. Для этого сегменты должны содержать примерно одинаковые порции данных.

В настоящее время работа с ADBM осуществляется через web-интерфейс Arenadata DB Control (ADB Control).

Перечень версий ADB 6 с описанием нового функционала, улучшений, исправленных багов и т.д.

Статья описывает шаги для установки ADB ClickHouse Connector.

Arenadata DB Backup Manager (ADBM) — это построенная на основе pgBackRest отказоустойчивая система для управления бинарными бэкапами ADB.

Spill-файлы (также известные как work-файлы) создаются на диске, если оперативной памяти становится недостаточно для хранения временных данных, формируемых при выполнении запросов к БД. Временные данные могут включать в себя хеши JOIN, результаты сортировки, перераспределенные таблицы и так далее.

Схема — это логическое объединение сущностей внутри одной базы данных. В отличие от БД, схемы разделены не так жестко: пользователи могут обращаться к нескольким схемам одновременно (при наличии соответствующих прав).

Серверные конфигурационные параметры (также известные как Global User Configuration, GUC) позволяют администраторам управлять состоянием и конфигурацией ADB. Многие из этих параметров имеют те же названия и поведение, что в PostgreSQL.

В этой статье описаны параметры, которые могут быть настроены для сервисов ADB через ADCM.

Нашли ошибку? Выделите текст и нажмите Ctrl+Enter чтобы сообщить о ней