Глоссарий

ADB

Arenadata DB (ADB) — это распределенная аналитическая СУБД, построенная на базе MPP-системы с открытым исходным кодом Greengage DB.

ADBM

Arenadata DB Backup Manager (ADBM) — это построенная на основе pgBackRest отказоустойчивая система для управления бинарными бэкапами ADB.

ADB Control

Arenadata DB Control (ADB Control) — это система мониторинга запросов Arenadata DB в режиме реального времени.

Append-optimized table

Тип таблицы, в которой данные оптимизированы для массовой загрузки. Такие таблицы подходят для нагрузок OLAP (online analytical processing).

Backup configuration

Конфигурация резервного копирования, то есть набор опций в Arenadata DB Backup Manager (ADBM), который определяет, как управлять бинарными бэкапами ADB: где их хранить, какой тип сжатия использовать и т.д.

Backup manager

Компонент, который позволяет управлять конфигурацией резервного копирования в пользовательском интерфейсе ADB Control.

Bundle

Объект поставки в ADCM, призванный облегчить установку и развертывание продуктов. Это архив, содержащий пакеты программного обеспечения, шаблоны конфигурационных файлов и задачи Ansible, которые определяют операции, выполняемые на целевой системе.

Connector

Компонент, который обеспечивает обмен данными между ADB и внешними источниками. Например, ADB ClickHouse Connector, ADB to Kafka Connector, и Kafka to ADB Connector.

Cluster

Кластер — система из взаимосвязанных узлов, включающая ведущий узел (coordinator node) и несколько узлов-сегментов (segment nodes), которые обрабатывают данные параллельно. Каждый узел основан на экземпляре СУБД PostgreSQL.

Data flow

В ADBM поток данных — это процесс перемещения резервных копий между исходным и целевым кластером для реализации сценария Disaster Recovery. Конфигурацию потока данных можно создать в ADB Control, чтобы определить параметры бэкапа и восстановления, такие как тип восстановления (Copy или Streaming) и точки восстановления.

Differential backup

Дифференциальный бэкап — типа бэкапа, при котором в бэкап помещаются только те файлы базы данных, которые изменились после запуска последнего полного бэкапа.

Distribution

Распределение данных — это механизм распределения строк таблицы по нескольким сегментам в архитектуре с параллельной обработкой данных. Каждая таблица в ADB имеет политику распределения.

Enterprise Tools

Arenadata Enterprise Tools (ET) — это решение, предоставляющее инфраструктуру для развертывания продуктов Аренадата в среде с ограниченным доступом в интернет.

External table

Внешняя таблица — это таблица, которая ссылается на данные, хранящиеся вне ADB, позволяя запрашивать внешние файлы, как если бы они были обычными таблицами базы данных. Внешние таблицы используют протокол, определяющий параметры подключения к источнику данных. Встроенные протоколы включают FILE, GPFDIST и HTTP.

FDW

Foreign Data Wrapper — библиотека, которая используются внешней таблицей (foreign table) для взаимодействия с удаленным источником данных.

Foreign table

Сторонняя таблица — это таблица, которая позволяет получать доступ к данным, находящимся за пределами базы данных. Сторонние таблицы используют внешние серверы (foreign servers) для представления удаленных баз данных и FDW (foreign data wrapper) для взаимодействия с удаленным источником данных.

Full backup

Полный бэкап — тип бэкапа, при котором все содержимое базы данных помещается в бэкап.

GUC

Global User Configuration — это набор параметров конфигурации сервера, которые позволяют администраторам ADB управлять состоянием и конфигурацией СУБД.

Heap table

Тип таблицы, в которой данные хранятся в неотсортированной коллекции. Такие таблицы подходят для рабочих нагрузок OLTP (online transaction processing).

Incremental backup

Инкрементный бэкап — тип бэкапа, при котором в бэкап помещаются только файлы, изменившиеся с момента запуска последнего бэкапа любого типа (полного, дифференциального либо инкрементного).

Interconnect

Интерконнект — сеть, которая обеспечивает перемещение данных между координатором и сегментами.

Coordinator

Координатор — узел, который является точкой входа в базу данных и координирует работу сегментов. Конечные пользователи подключаются к нему для выполнения запросов. Прежнее название — мастер.

Mirror segment

Зеркальный сегмент — это узел, который обеспечивают отказоустойчивость для основных сегментов. Если основной сегмент становится недоступен, система автоматически переключается на его зеркальную копию.

Partitioning

Партиционирование — это способ повышения производительности запросов за счет логического разбиения больших таблиц на небольшие части, называемые партициями.

Primary segment

Основной сегмент — активный узел, который хранит данные, получает планы запросов и выполняет их.

PXF

Greenplum Platform Extension Framework (PXF) — библиотека, которая позволяет ADB получать данные из внешних источников. PXF включает встроенные коннекторы (например, для доступа к HDFS, Hive и HBase). Пользователи также могут создавать свои собственные коннекторы. В ADB PFX представлен в виде сервиса, которым можно управлять с помощью веб-интерфейса ADCM.

Restore point

В ADBM restore point — это именованная точка восстановления, которая является минимальной единицей гранулярности согласования данных в кластере ADB.

Segment

Сегмент — экземпляр базы данных PostgreSQL, который хранит и обрабатывает свой собственный набор данных.

Service

Сервис — компонент кластера, который предоставляет определенную функциональность. С помощью механизма Mapping можно задать, на каких хостах должны быть установлены конкретные сервисы.

Standby coordinator

Резервный координатор — это компонент, который служит теплым резервом для основного координатора. Для поддержания синхронизации с основным координатором он использует записи WAL (write-ahead logging).

Tablespace

Табличное пространство — логическое имя для физического каталога в файловой системе, где база данных может хранить свои файлы данных (такие как таблицы и индексы). Табличное пространство позволяет оптимизировать производительность, размещая часто используемые данные на высокоскоростных носителях, в то время как исторические или менее важные данные хранятся на носителях более низкого класса.

Timeline

Механизм, используемый в ADBM для того, чтобы отличать серии WAL, сгенерированные после восстановления БД на определенный момент времени, от тех, которые были созданы в исходной истории базы данных (до применения восстановления).

Transaction

Транзакция — логическая единица, которая группирует одно или несколько SQL-выражений. Эти выражения затем рассматриваются как единая операция: либо все они выполняются успешно, либо ни одно из них. Отслеживать транзакции можно на странице Monitoring в ADB Control.

User mapping

Конфигурация, которая связывает локального пользователя базы данных с пользователем во внешней базе данных для предоставления доступа к ней. Сопоставление пользователей требуется для использования Foreign Data Wrappers (FDW).

WAL

Write-Ahead Logging — это метод, обеспечивающий целостность данных путем записи всех изменений базы данных в постоянный, дополняемый журнал перед обновлением соответствующих страниц данных на диске. WAL играет важную роль в механизме Point-in-Time Recovery (PITR), используемом в ADBM.

Нашли ошибку? Выделите текст и нажмите Ctrl+Enter чтобы сообщить о ней