Глоссарий терминов для работы с ADB

В документе приведено краткое описание базовых терминов, используемых в сопровождающей документации по кластеру Arenadata DB.

Important

Контактная информация службы поддержки – e-mail: info@arenadata.io

ACID
Atomicity, Consistence, Isolation, Durability – атомарность, целостность, изолированность, постоянство
Bloat
Раздутие – ситуация, в которой недействительные строки накапливаются в таблице, и увеличенная нагрузка на ввод/вывод дисков негативно влияет на производительность.
Cluster
Кластер – группа серверов и координирующего программного обеспечения, объединенных логически, способных обрабатывать идентичные запросы и использующихся как единый ресурс.
Dead row
Неиспользуемая строка – строка с истекшим сроком действия, удалив которую можно освободить место для новых данных.
Dirty read
Грязное считывание – явление, которое возникает, когда транзакция считывает незафиксированные данные из другой параллельной транзакции.
Frozen XID
Идентификатор, считающийся всегда старше обычного XID.
Heap-таблица
Heap table – специализированная структура данных типа дерево, которая удовлетворяет свойство кучи: если B является узлом-потомком узла A, то ключ(A) ≥ ключ(B).
Instance
Сегмент – экземпляр PostgreSQL, запущенный на одном из серверов сегментов, хранящий и обрабатывающий свою часть данных. Пользователи не взаимодействуют напрямую с сегментами, но делают это через мастера.
Interconnect
Интерконнект – сеть, предназначенная для взаимодействия мастера и сегментов между собой.
Log-files
Лог-файлы – файлы, генерируемые инстансами сегментов и инстансами мастера. Для этих лог-файлов должно быть выделено достаточно места. Однако для обеспечения того, чтобы лог-файлы не становились слишком большими, следует использовать механизм ротации.
Master
Мастер – точка входа в систему базы данных ADB. Мастер принимает клиентские соединения и обрабатывает команды SQL, содержит системный каталог (набор системных таблиц с метаданными о ADB), однако мастер не содержит никаких пользовательских данных.
Metadata
Метаданные – субканальная информация об используемых данных. Структурированные данные, представляющие собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки, управления ими.
MVCC, MultiVersion Concurrency Control
Управление параллельным доступом с помощью многоверсионности – один из механизмов обеспечения параллельного доступа к БД, заключающийся в предоставлении каждому пользователю снэпшота БД, обладающего тем свойством, что вносимые пользователем изменения в БД невидимы другим пользователям до момента фиксации транзакции.
Non-repeatable read
Неповторяющееся чтение – ситуация, когда при повторном чтении в рамках одной транзакции ранее прочитанные данные оказываются измененными.
Phantom read
Фантомное чтение – ситуация, когда при повторном чтении в рамках одной транзакции одна и та же выборка дает разные множества строк.
Redundancy
Избыточность – как правило относится к дублированию различных объектов в ADB. Например, избыточность мастера подразумевает наличие резервной копии главного мастера.
Replication
Репликация – механизм синхронизации содержимого нескольких копий объекта (например, содержимого базы данных).
Segment host
Сегмент Хост – сервер, на котором запущен один или несколько сегментов.
Snapshot
Снэпшот – моментальный снимок, копия файлов и директорий файловой системы на определенный момент времени.
Transaction
Транзакция – группа последовательных операций с базой данных. Транзакция может быть выполнена либо целиком и успешно, соблюдая целостность данных и независимо от параллельно идущих других транзакций, либо не выполнена вообще, и тогда она не должна произвести никакого эффекта.
Vacuuming
Очистка – предотвращает зацикливание XID путем очистки ненужных значений XID.
WAL, Write Ahead Log
Журнал опережающей записи – гарантирует, что до занесения на диск записи, связанной с журналом, никакие изменения данных записаны не будут. Таким образом обеспечиваются свойства ACID для транзакции.
XID
Уникальный идентификатор транзакции (32-битное значение).
Грязное считывание
Dirty read – явление, которое возникает, когда транзакция считывает незафиксированные данные из другой параллельной транзакции.
Журнал опережающей записи
Write Ahead Log, WAL – гарантирует, что до занесения на диск записи, связанной с журналом, никакие изменения данных записаны не будут. Таким образом обеспечиваются свойства ACID для транзакции.
Избыточность
Redundancy – как правило относится к дублированию различных объектов в ADB. Например, избыточность мастера подразумевает наличие резервной копии главного мастера.
Интерконнект
Interconnect – сеть, предназначенная для взаимодействия мастера и сегментов между собой.
Кластер
Cluster – группа серверов и координирующего программного обеспечения, объединенных логически, способных обрабатывать идентичные запросы и использующихся как единый ресурс.
Лог-файлы
Log-files – файлы, генерируемые инстансами сегментов и инстансами мастера. Для этих лог-файлов должно быть выделено достаточно места. Однако для обеспечения того, чтобы лог-файлы не становились слишком большими, следует использовать механизм ротации.
Мастер
Master – точка входа в систему базы данных ADB. Мастер принимает клиентские соединения и обрабатывает команды SQL, содержит системный каталог (набор системных таблиц с метаданными о ADB), однако мастер не содержит никаких пользовательских данных.
Метаданные
Metadata – субканальная информация об используемых данных. Структурированные данные, представляющие собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки, управления ими.
Неиспользуемая строка
Dead row – строка с истекшим сроком действия, удалив которую можно освободить место для новых данных.
Неповторяющееся чтение
Non-repeatable read – ситуация, когда при повторном чтении в рамках одной транзакции ранее прочитанные данные оказываются измененными.
Очистка
Vacuuming – предотвращает зацикливание XID путем очистки ненужных значений XID.
Раздутие
Bloat – ситуация, в которой недействительные строки накапливаются в таблице, и увеличенная нагрузка на ввод/вывод дисков негативно влияет на производительность.
Репликация
Replication – механизм синхронизации содержимого нескольких копий объекта (например, содержимого базы данных).
Сегмент
Instance – экземпляр PostgreSQL, запущенный на одном из серверов сегментов, хранящий и обрабатывающий свою часть данных. Пользователи не взаимодействуют напрямую с сегментами, но делают это через мастера.
Сегмент Хост
Segment host – сервер, на котором запущен один или несколько сегментов.
Снэпшот
Snapshot – моментальный снимок, копия файлов и директорий файловой системы на определенный момент времени.
Транзакция
Transaction – группа последовательных операций с базой данных. Транзакция может быть выполнена либо целиком и успешно, соблюдая целостность данных и независимо от параллельно идущих других транзакций, либо не выполнена вообще, и тогда она не должна произвести никакого эффекта.
Управление параллельным доступом с помощью многоверсионности
MultiVersion Concurrency Control, MVCC – один из механизмов обеспечения параллельного доступа к БД, заключающийся в предоставлении каждому пользователю снэпшота БД, обладающего тем свойством, что вносимые пользователем изменения в БД невидимы другим пользователям до момента фиксации транзакции.
Фантомное чтение
Phantom read – ситуация, когда при повторном чтении в рамках одной транзакции одна и та же выборка дает разные множества строк.