Глоссарий
- ADB
-
Arenadata DB (ADB) — это распределенная аналитическая СУБД, построенная на базе MPP-системы с открытым исходным кодом Greengage DB.
- ADBM
-
Arenadata DB Backup Manager (ADBM) — это построенная на основе pgBackRest отказоустойчивая система для управления бинарными бэкапами ADB.
- ADB Control
-
Arenadata DB Control (ADB Control) — это система мониторинга запросов Arenadata DB в режиме реального времени.
- Append-optimized table
-
Тип таблицы, в которой данные оптимизированы для массовой загрузки. Такие таблицы подходят для нагрузок OLAP (online analytical processing).
- Backup configuration
-
Конфигурация резервного копирования, то есть набор опций в Arenadata DB Backup Manager (ADBM), который определяет, как управлять бинарными бэкапами ADB: где их хранить, какой тип сжатия использовать и т.д.
- Backup manager
-
Компонент, который позволяет управлять конфигурацией резервного копирования в пользовательском интерфейсе ADB Control.
- Bundle
-
Объект поставки в ADCM, призванный облегчить установку и развертывание продуктов. Это архив, содержащий пакеты программного обеспечения, шаблоны конфигурационных файлов и задачи Ansible, которые определяют операции, выполняемые на целевой системе.
- Connector
-
Компонент, который обеспечивает обмен данными между ADB и внешними источниками. Например, ADB ClickHouse Connector, ADB to Kafka Connector, и Kafka to ADB Connector.
- Cluster
-
Кластер — система из взаимосвязанных узлов, включающая ведущий узел (coordinator node) и несколько узлов-сегментов (segment nodes), которые обрабатывают данные параллельно. Каждый узел основан на экземпляре СУБД PostgreSQL.
- Data flow
-
В ADBM поток данных — это процесс перемещения резервных копий между исходным и целевым кластером для реализации сценария Disaster Recovery. Конфигурацию потока данных можно создать в ADB Control, чтобы определить параметры бэкапа и восстановления, такие как тип восстановления (
CopyилиStreaming) и точки восстановления. - Differential backup
-
Дифференциальный бэкап — типа бэкапа, при котором в бэкап помещаются только те файлы базы данных, которые изменились после запуска последнего полного бэкапа.
- Distribution
-
Распределение данных — это механизм распределения строк таблицы по нескольким сегментам в архитектуре с параллельной обработкой данных. Каждая таблица в ADB имеет политику распределения.
- Enterprise Tools
-
Arenadata Enterprise Tools (ET) — это решение, предоставляющее инфраструктуру для развертывания продуктов Аренадата в среде с ограниченным доступом в интернет.
- External table
-
Внешняя таблица — это таблица, которая ссылается на данные, хранящиеся вне ADB, позволяя запрашивать внешние файлы, как если бы они были обычными таблицами базы данных. Внешние таблицы используют протокол, определяющий параметры подключения к источнику данных. Встроенные протоколы включают FILE, GPFDIST и HTTP.
- FDW
-
Foreign Data Wrapper — библиотека, которая используются внешней таблицей (foreign table) для взаимодействия с удаленным источником данных.
- Foreign table
-
Сторонняя таблица — это таблица, которая позволяет получать доступ к данным, находящимся за пределами базы данных. Сторонние таблицы используют внешние серверы (foreign servers) для представления удаленных баз данных и FDW (foreign data wrapper) для взаимодействия с удаленным источником данных.
- Full backup
-
Полный бэкап — тип бэкапа, при котором все содержимое базы данных помещается в бэкап.
- GUC
-
Global User Configuration — это набор параметров конфигурации сервера, которые позволяют администраторам ADB управлять состоянием и конфигурацией СУБД.
- Heap table
-
Тип таблицы, в которой данные хранятся в неотсортированной коллекции. Такие таблицы подходят для рабочих нагрузок OLTP (online transaction processing).
- Incremental backup
-
Инкрементный бэкап — тип бэкапа, при котором в бэкап помещаются только файлы, изменившиеся с момента запуска последнего бэкапа любого типа (полного, дифференциального либо инкрементного).
- Interconnect
-
Интерконнект — сеть, которая обеспечивает перемещение данных между координатором и сегментами.
- Coordinator
-
Координатор — узел, который является точкой входа в базу данных и координирует работу сегментов. Конечные пользователи подключаются к нему для выполнения запросов. Прежнее название — мастер.
- Mirror segment
-
Зеркальный сегмент — это узел, который обеспечивают отказоустойчивость для основных сегментов. Если основной сегмент становится недоступен, система автоматически переключается на его зеркальную копию.
- Partitioning
-
Партиционирование — это способ повышения производительности запросов за счет логического разбиения больших таблиц на небольшие части, называемые партициями.
- Primary segment
-
Основной сегмент — активный узел, который хранит данные, получает планы запросов и выполняет их.
- PXF
-
Greenplum Platform Extension Framework (PXF) — библиотека, которая позволяет ADB получать данные из внешних источников. PXF включает встроенные коннекторы (например, для доступа к HDFS, Hive и HBase). Пользователи также могут создавать свои собственные коннекторы. В ADB PFX представлен в виде сервиса, которым можно управлять с помощью веб-интерфейса ADCM.
- Restore point
-
В ADBM restore point — это именованная точка восстановления, которая является минимальной единицей гранулярности согласования данных в кластере ADB.
- Segment
-
Сегмент — экземпляр базы данных PostgreSQL, который хранит и обрабатывает свой собственный набор данных.
- Service
-
Сервис — компонент кластера, который предоставляет определенную функциональность. С помощью механизма Mapping можно задать, на каких хостах должны быть установлены конкретные сервисы.
- Standby coordinator
-
Резервный координатор — это компонент, который служит теплым резервом для основного координатора. Для поддержания синхронизации с основным координатором он использует записи WAL (write-ahead logging).
- Tablespace
-
Табличное пространство — логическое имя для физического каталога в файловой системе, где база данных может хранить свои файлы данных (такие как таблицы и индексы). Табличное пространство позволяет оптимизировать производительность, размещая часто используемые данные на высокоскоростных носителях, в то время как исторические или менее важные данные хранятся на носителях более низкого класса.
- Timeline
-
Механизм, используемый в ADBM для того, чтобы отличать серии WAL, сгенерированные после восстановления БД на определенный момент времени, от тех, которые были созданы в исходной истории базы данных (до применения восстановления).
- Transaction
-
Транзакция — логическая единица, которая группирует одно или несколько SQL-выражений. Эти выражения затем рассматриваются как единая операция: либо все они выполняются успешно, либо ни одно из них. Отслеживать транзакции можно на странице Monitoring в ADB Control.
- User mapping
-
Конфигурация, которая связывает локального пользователя базы данных с пользователем во внешней базе данных для предоставления доступа к ней. Сопоставление пользователей требуется для использования Foreign Data Wrappers (FDW).
- WAL
-
Write-Ahead Logging — это метод, обеспечивающий целостность данных путем записи всех изменений базы данных в постоянный, дополняемый журнал перед обновлением соответствующих страниц данных на диске. WAL играет важную роль в механизме Point-in-Time Recovery (PITR), используемом в ADBM.