Расширенная аналитика данных, предоставляемая ADB, используется для решения широкого спектра задач в различных областях, включая финансы, промышленность, автомобилестроение, правительственный сектор, энергетику, образование, розничную торговлю и многое другое.
Одной из особенностей ADB является возможность анализировать множество типов данных, использовать существующие знания SQL и обучать больше моделей за меньшее время за счет архитектуры MPP.
Кроме того, ADB предоставляет аналитику вида in-database, которая позволяет выполнять анализ данных непосредственно в БД вместо экспорта и обработки данных во внешней аналитической системе.
Arenadata DB является отличным решением для машинного обучения – изучения компьютерных алгоритмов, которые автоматически совершенствуются через опыт. Apache MADlib – это основанная на SQL и предназначенная для машинного обучения библиотека с открытым исходным кодом, которая работает в режиме in-database в ADB, как и в PostgreSQL.
Сочетание ADB и Apache MADlib помогает улучшить параллелизм, масштабируемость и прогностическую точность развертывания моделей машинного обучения. Преобразование данных и возможности техники feature engineering также доступны в MADlib для машинного обучения, включая дескриптивную и индуктивную статистику, pivoting, реконструкцию сессий по времени и кодирование/преобразование категориальных переменных.
Благодаря способности ADB обрабатывать большие объемы данных на высоких скоростях, эта СУБД становится мощным инструментом для интеллектуальных приложений, взаимодействующих на основе неограниченного количества уникальных сценариев.
Например, телекоммуникационные компании могут использовать возможности Arenadata DB AI в интеллектуальных датчиках систем IoT (Internet of Things), предназначенных для сбора и анализа данных с целью повышения операционной эффективности, безопасности и качества обслуживания.
- настраивать расписание бэкапирования;
- управлять конфигурацией;
- выполнять создание бэкапа (полного, инкрементного, дифференциального) on-demand;
- восстанавливать кластер из имеющихся бэкапов;
- проводить аудит действий, связанных с бэкапированием.
- высокая скорость передачи данных;
- автоматическое формирование схемы данных;
- гибкое партиционирование;
- поддержка push-down операторов;
- поддержка batch-операций.
- возможность чтения и записи данных в формате AVRO из топиков Kafka;
- работа с CSV и текстовым форматом данных для операции чтения;
- поддержка транзакций в Arenadata DB.
- транзакционно загружать данные за счет автоматического создания staging-таблиц;
- использовать несколько семейств engine таблиц в ClickHouse;
- гибко распределять и распараллеливать нагрузку записи.
- Выпуск Tkhemali connector 2.0
- Обработка предиката IN для целей фильтрации push-down в PXF JDBC
- Возможность использования SSL между Client и Master
- Добавлены дашборды PXF Monitoring Grafana Dashboards
- Arenadata DB Command Center (ADBCC) переименован в Arenadata DB Control (ADB Control)
- Оптимизация хранения данных с возможностью экспорта метрик во внешнюю БД для долговременного хранения
- Улучшенная безопасность с поддержкой CSRF (Cross-Site Request Forgery)
- Улучшенный механизм аутентификации с принудительной сменой пароля при первом входе пользователя и блокировкой после нескольких неудачных попыток входа
- Добавлена возможность просмотра суммарных системных метрик мониторинга, а также их расчет в режиме реального времени для активных команд
- Возможность использования ADBM на PowerPC
- Возможность восстановления данных из бэкапов без сегментов-зеркал (mirror)
- Улучшен механизм фильтрации для действий Restore
- Синхронизация с Greenplum Database 6.22.1
- Обновление pgbouncer 1.18
- Обновление gpbackup 1.27
- Обновление plcontainer 2.2
- Добавлен буферный параметр в утилиту gpcheckperf
- Восстановление из бэкапа для остановленного кластера
- Возможность удаления последнего бэкапа из stanza
- Восстановление определенных баз данных из бэкапа
- Возможность совместного использования ADB Control и gpperfmon в рамках одного кластера ADB
- Возможность LDAP-поиска по нескольким Organizational Units (OU) в ходе аутентификации
- Гибкая сортировка на страницах мониторинга команд и транзакций
- Синхронизация с Greenplum Database 6.22.0
- Добавлена поддержка AltLinux 8.4 SP
- Добавлен Data Domain Boost плагин версии 1.0.0
- PXF: разрешена установка параллельных инструкций Oracle
- Произведен рефакторинг Planchecker для использования внешней БД ADB Control под интенсивной нагрузкой (при большом числе соединений)
- gpbackup: сортировка метаданных исправлена таким образом, что теперь утилита gprestore может восстанавливать функции после таблиц, используемых в этих функциях в качестве выходных значений
- gptkh: получение актуальных столбцов system.tables в ClickHouse (в соответствии с версией ClickHouse)
- Добавлены новые метрики производительности для команд и транзакций: Cpu usage total, Read bytes total, Write bytes total
- Добавлена возможность повторно изменять ресурсную группу для транзакции
- Исправлен расчет числа кортежей, затронутых запросом
- Объекты базы данных Planchecker включены в миграцию
- Синхронизация с Greenplum Database 6.21.1
- Разрешены файлы core dump для процессов ADB
- Исправлена проблема с потерей слотов ресурсной группы при перемещении запроса
- Добавлен образ Planchecker в сервис ADCC (docker-compose) в бандле ADB
- Добавлена возможность отменять транзакцию
- Добавлена возможность переназначать запросы другой ресурсной группе
- Добавлена фильтрация команд по планировщику запроса
- Синхронизация с Greenplum Database 6.21.0
- Оптимизированы DML-запросы к партиционированным таблицам во избежание дальнейшего планирования в случае, если партиция обрезана
- Фоновый процесс gpmon исключен из списка разделяемой памяти (shared memory) пользователя
- Реализован запасной вариант (fallback) с PostgreSQL для пустого целевого списка в производителе CTE
- Бандл ADB: добавлена возможность определять кластерную сеть
- Для коммуникации с агентом теперь используется неблокирующий сокет
- Добавлен мониторинг транзакций
- Добавлен мониторинг следующих групп SQL-выражений: DDL, DML, DCL и TCL
- Добавлен расчет Spill и Spill Skew
- Синхронизация с Greenplum Database 6.20.1
- PXF: PXF 6.3.0 добавлен в бандл ADB (с возможностью обновления с PXF 5.x)
- PXF: активирована команда PXF cluster sync
- PXF: добавлена возможность переопределять соответствие типов данных во внешних таблицах для PXF
- Добавлен ADB ClickHouse connector 1.0.1
- Для завершенных запросов теперь обрабатывается актуальная статистика от EXPLAIN ANALYZE
- Интегрированы средние по кластеру метрики запросов
- Реализовано сжатие данных для объемных запросов
- Синхронизация с Greenplum Database 6.19.3
- Добавлены инструменты ADB Loader для RHEL 8
- Добавлена возможность развертывать скрипты обслуживания (maintenance scripts) для нескольких БД
- Сделан доступным параметр GUC (Global User Configuration) backlog_lock_waits
- Поддержка аудита обращения к объектам базы данных
- Добавлена страница истории Background jobs
- Поддержка виртуальной памяти процесса в системных метриках команды
- Сбор статистики по нагрузке на сервисы мониторинга
- Синхронизация с Greenplum Database 6.18.2
- Реализация режима archive_mode на постоянной основе
- Выпуск Kafka ADB connector версии 1.0.4
- Поддержка HTTPS
- Реализован механизм backpressure относительно занятого объема памяти в heap на агенте
- Синхронизация с Greenplum Database 6.18.0
- gpbackup: добавлено явное указание порядка таблиц с использованием pg_class.relpages
- PXF: добавлена поддержка партиционированных запросов в Sybase
- Поддержка работы с несколькими кластерами ADB
- Сбор системных метрик в разрезе запроса: CPU, RAM, IO
- Актуализация информации для долгое время выполняющихся запросов
- Динамическое добавление столбцов на страницы History и Monitoring
- Синхронизация с Greenplum Database 6.17.5
- Бандл ADB: добавлен статус Ready to upgrade для действия обновления бандла
- Решена проблема низкой производительности CPU на Power с новыми опциями сборки CGLAGS
- Добавлена сборка для платформы Power8 LE (ppc64le arch)
- Добавлена сборка агента для платформы Power8 LE (ppc64le arch)
- Синхронизация с Greenplum Database 6.17.1
- Бандл ADB: соединение с внешней БД для ADB Control
- Исправлено: оптимизатор PostgreSQL строил некорректный план для таблиц с типом распределения replicated и индексами
- adcc-extension: получение и отправка текста об ошибках
- Новый пользовательский интерфейс
- Возможность отменять и прерывать запросы
- Основанная на времени политика Retention Policy
- Развернутая информация по ошибкам запросов
- Аутентификация LDAP
- Синхронизация с Greenplum Database 6.16.2
- Уменьшение сегментных файлов отношений до нуля при выполнении TRUNCATE и DELETE
- PXF: удалена проверка количества кортежей для JDBC-запросов INSERT
- Kafka ADB Connector: добавлена возможность установки кастомных опций librdkafka
- Реализовано обновление расширения diskquota
- Добавлен параметр gp_enable_gpperfmon=on на серверы Master и Segment
- Добавлены JVM-аргументы для логирования
- Синхронизация с Greenplum Database 6.15.0
- Реализовано переключение Master на Standby в ADCM
- Добавлены переменные окружения $PXF_CONF и $PXF_HOME для хостов PXF
- Kafka ADB connector: реализованы обработчики сигналов для прерывания потребления сообщений (consuming)
- Реализована поддержка Alt Linux 8.2
- Поддержка горизонтального масштабирования бэкенда ADB Control
- Добавлена обработка UDS unlink, обновлена сборка библиотеки под CentOS 7
- Добавлен параметр innerQueueCapacity размера внутренней очереди сообщений для агента
- Синхронизация с Greenplum Database 6.14.1
- Удалена online-загрузка статических ресурсов из web-интерфейса ADB Control
- Синхронизация с Greenplum Database 6.14.0
- Синхронизация с Greenplum Database 6.13.0
- Добавлена поддержка вспомогательных отношений для таблиц append-optimized с целью точной оценки расширением pgstattuple величины "раздувания" (bloat) этих отношений
- ADB ClickHouse connector: исключено промежуточное преобразование в byte array
- Удалены неактуальные опции пакетной обработки (batching) из Arenadata QuickMarts connector (т.к. теперь используется TEXT)
- Синхронизация с Greenplum Database 6.12.1
- Добавлена offset-функция в Kafka ADB connector
- Добавлена функция rest committed в Kafka ADB connector
- Поддержка текстового формата в Kafka ADB connector
- Поддержка опции JVM_OPTS для PXF
- Реализованы логические типы AVRO в Kafka ADB connector
- Переход на использование rd_kafka_query_watermark_offsets для валидации пар partition-offset в Kafka ADB connector