Глоссарий терминов для работы с ADB

В документе приведено краткое описание базовых терминов, используемых в сопровождающей документации по кластеру Arenadata DB.

Important

Контактная информация службы поддержки – e-mail: info@arenadata.io

ACID
Atomicity, Consistence, Isolation, Durability (неделимость, согласованность, изолированность, сохраняемость)
Frozen XID
Идентификатор считающийся всегда старше обычного XID
Heap таблица (heap table)
Специализированная структура данных типа дерево, которая удовлетворяет свойство кучи: если B является узлом-потомком узла A, то ключ(A) ≥ ключ(B)
XID
Уникальный идентификатор транзакции (32 битное значение)
Грязное считывание (dirty read)
Явление которое возникает, когда транзакция считывает незафиксированные данные из другой параллельной транзакции
Журнал Упреждающей Памяти (Write Ahead Log)
Гарантирует, что до занесения на диск записи, связанной с журналом, никакие изменения данных записаны не будут. Таким образом обеспечиваются свойства ACID для транзакции
Избыточность (redundancy)
Как правило относится к дублированию различных объектов в ADB. Например, избыточность мастера подразумевает наличие резервной копии главного мастера
Интерконнект (interconnect)
Сеть, предназначенная для взаимодействия мастера и сегментов между собой
Кластер (cluster)
Группа серверов и координирующего программного обеспечения, объединённых логически, способных обрабатывать идентичные запросы и использующихся как единый ресурс
Лог-файлы (Log-files)
Файлы, генерируемые инстансами сегментов и инстансами мастера. Для этих лог-файлов должно быть выделено достаточно места. Однако для обеспечения того, чтобы лог-файлы не становились слишком большими, следует использовать механизм ротации
Мастер (master)
Точка входа в систему базы данных ADB. Мастер принимает клиентские соединения и обрабатывает команды SQL. Мастер содержит системный каталог (набор системных таблиц, содержащих метаданные о ADB), однако мастер не содержит никаких пользовательских данных
Метаданные (metadata)
Субканальная информация об используемых данных. Структурированные данные, представляющие собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки, управления ими
Неиспользуемая строка (dead row)
Строка с истекшим сроком действия, удалив которую можно освободить место для новых данных
Неповторяющееся чтение (non-repeatable read)
Ситуация, когда при повторном чтении в рамках одной транзакции ранее прочитанные данные оказываются изменёнными
Очистка (vacuuming)
Предотвращает зацикливание XID путем очистки ненужных значений XID
Раздутие (bloat)
Ситуация в которой недействительные строки накапливаются в таблице, и увеличенная нагрузка на ввод/вывод дисков негативно влияет на производительность
Репликация (replication)
Механизм синхронизации содержимого нескольких копий объекта (например, содержимого базы данных)
Сегмент Хост (segment host)
Сервер на котором запущен один или несколько сегментов
Сегмент (instance or segment)
Экземпляр PostgreSQL запущенный на одном из серверов сегментов хранящий и обрабатывающий свою часть данных. Пользователи не взаимодействуют напрямую с сегментами, но делают это через мастера
Снэпшот (snapshot)
Моментальный снимок, копия файлов и директорий файловой системы на определённый момент времени
Транзакция (transaction)
Группа последовательных операций с базой данных. Транзакция может быть выполнена либо целиком и успешно, соблюдая целостность данных и независимо от параллельно идущих других транзакций, либо не выполнена вообще, и тогда она не должна произвести никакого эффекта
Управление параллельным доступом с помощью многоверсионности (MVCC — MultiVersion Concurrency Control)
Один из механизмов обеспечения параллельного доступа к БД, заключающийся в предоставлении каждому пользователю снэпшота БД, обладающего тем свойством, что вносимые пользователем изменения в БД невидимы другим пользователям до момента фиксации транзакции
Чтение фантомов (phantom read)
Ситуация, когда при повторном чтении в рамках одной транзакции одна и та же выборка дает разные множества строк