Arenadata DB

Arenadata DB (ADB) – это массивно-параллельная реляционная СУБД с открытым исходным кодом для хранилищ данных с гибкой горизонтальной масштабируемостью и колоночным хранением на основе PostgreSQL. Благодаря своим архитектурным особенностям и мощному оптимизатору запросов, ADB отличается особой надежностью и высокой скоростью обработки SQL-запросов над большими объемами данных – поэтому Arenadata DB широко применяется для аналитики Big Data в промышленных масштабах.

Для более удобной работы и построения практических задач любой сложности Arenadata DB поставляется вместе с рядом дополнительных инструментов, обеспечивающих интеграцию с внешними хранилищами данных, управление бинарными бэкапами и мониторинг запросов в режиме реального времени. Описанный функционал позволяет строить решения с полным покрытием всех процессов, связанных с сопровождением бизнес-систем.

Сценарии использования

Расширенный анализ данных

Расширенная аналитика данных, предоставляемая ADB, используется для решения широкого спектра задач в различных областях, включая финансы, промышленность, автомобилестроение, правительственный сектор, энергетику, образование, розничную торговлю и многое другое.

Одной из особенностей ADB является возможность анализировать множество типов данных, использовать существующие знания SQL и обучать больше моделей за меньшее время за счет архитектуры MPP.

Кроме того, ADB предоставляет аналитику вида in-database, которая позволяет выполнять анализ данных непосредственно в БД вместо экспорта и обработки данных во внешней аналитической системе.

Машинное обучение

Arenadata DB является отличным решением для машинного обучения – изучения компьютерных алгоритмов, которые автоматически совершенствуются через опыт. Apache MADlib – это основанная на SQL и предназначенная для машинного обучения библиотека с открытым исходным кодом, которая работает в режиме in-database в ADB, как и в PostgreSQL.

Сочетание ADB и Apache MADlib помогает улучшить параллелизм, масштабируемость и прогностическую точность развертывания моделей машинного обучения. Преобразование данных и возможности техники feature engineering также доступны в MADlib для машинного обучения, включая дескриптивную и индуктивную статистику, pivoting, реконструкцию сессий по времени и кодирование/преобразование категориальных переменных.

Искусственный интеллект

Благодаря способности ADB обрабатывать большие объемы данных на высоких скоростях, эта СУБД становится мощным инструментом для интеллектуальных приложений, взаимодействующих на основе неограниченного количества уникальных сценариев.

Например, телекоммуникационные компании могут использовать возможности Arenadata DB AI в интеллектуальных датчиках систем IoT (Internet of Things), предназначенных для сбора и анализа данных с целью повышения операционной эффективности, безопасности и качества обслуживания.

Enterprise

Community

Функциональность ядра Greenplum

gpbackup/gprestore

PXF

Автоматизация развертывания и обновления

Мониторинг и оповещения

Offline-установка

Управление бэкапами на основе WAL

x86

Техническая поддержка 24/7

Корпоративные обучающие курсы

Индивидуальные решения

Доступные интеграции

ADQM

ADS

ADPG

Kafka

Oracle

HBase

HDFS

JDBC

Hive

Операционные системы

Alt Linux

CentOS

RedHat

Astra Linux

Ubuntu

RedOS

Функциональность ядра Greenplum

gpbackup/gprestore

PXF

Автоматизация развертывания и обновления

Мониторинг и оповещения

Offline-установка

Управление бэкапами на основе WAL

x86

Техническая поддержка 24/7

Корпоративные обучающие курсы

Индивидуальные решения

Доступные интеграции

ADQM

ADS

ADPG

Kafka

Oracle

HBase

HDFS

JDBC

Hive

Операционные системы

Alt Linux

CentOS

RedHat

Astra Linux

Ubuntu

RedOS

Ключевые особенности

Производительность

Возможно горизонтальное масштабирование ADB до десятков петабайт без снижения производительности запросов

Безопасность

Встроенный аудит действий пользователя в кластере: аутентификация, конфигурирование LDAP, настройка ресурсных групп

Надежность

Зеркалирование (mirroring), безопасное управление бэкапами, плагин ddboost для утилит gpbackup/gprestore

Удобство

Гибкое развертывание и конфигурирование, обновления с проверенными бинарными файлами и необходимыми миграциями для всех компонентов

Контрибуция

Наша команда – один из основных контрибьюторов Greenplum в мире. Кроме этого, мы создаем и поддерживаем в актуальном состоянии собственную документацию

ADB Control

Система мониторинга запросов Arenadata DB

Предназначена для глубокого исследования процессов выполнения команд или утилит, работающих с кластером.

Мониторинг производится в режиме реального времени со сбором информации о потребляемых на уровне запросов ресурсах и прогрессе выполнения планов запросов. Дополнительно можно производить отслеживание выполнения запросов в разрезе транзакций.

Система мониторинга имеет удобный пользовательский интерфейс с возможностью подключения к нему нескольких кластеров Arenadata DB, сбора статистики, ее графического представления и выгрузки метрик.

Arenadata DB Backup Manager

Сервис по управлению бэкапами для ADB

Основной особенностью является асинхронное снятие бинарных бэкапов с работающего кластера.

Имеется пользовательский интерфейс, встроенный в ADB Control, из которого можно работать с несколькими кластерами ADB и для каждого из них:

настраивать расписание бэкапирования;
управлять конфигурацией;
выполнять создание бэкапа (полного, инкрементного, дифференциального) on-demand;
восстанавливать кластер из имеющихся бэкапов;
проводить аудит действий, связанных с бэкапированием.

Коннекторы

ADB Spark Connector

Mногофункциональный коннектор с поддержкой параллельных операций чтения/записи между Apache Spark и Arenadata DB. На его основе можно легко строить ETL-решения и осуществлять анализ данных in-memory.

Обладает большой гибкостью в настройке и множеством возможностей:

высокая скорость передачи данных;
автоматическое формирование схемы данных;
гибкое партиционирование;
поддержка push-down операторов;
поддержка batch-операций.

Читать документацию

ADB Kafka Connector

Cпециализированный коннектор для интеграции Apache Kafka с Arenadata DB.

Характеристики:

возможность чтения и записи данных в формате AVRO из топиков Kafka;
работа с CSV и текстовым форматом данных для операции чтения;
поддержка транзакций при записи данных в Arenadata DB.

Читать документацию

ADB PXF Connector

Фреймворк для параллельного и высокопроизводительного доступа к гетерогенным источникам данных из Arenadata DB при помощи встроенных коннекторов.

Обращение к данным происходит за счет механизма внешних таблиц, что позволяет строить сложные федеративные запросы.

Для подключения внешних хранилищ предоставляются коннекторы JDBC, S3, Hive, HDFS и HBase. При этом аутентификация может включать в себя использование Kerberos и/или SSL.

ADB ClickHouse Connector

Fdw-коннектор для передачи данных в Arenadata QuickMarts или ClickHouse.

Позволяет:

транзакционно загружать данные за счет автоматического создания staging-таблиц;
использовать несколько семейств engine таблиц в ClickHouse;
гибко распределять и распараллеливать нагрузку записи.

Читать документацию

ADB to ADB Connector

Реализованный на основе foreign data wrapper и параллельных курсоров (parallel retrieve cursor) коннектор, обеспечивающий двустороннюю передачу данных между двумя кластерами ADB.

Основные возможности коннектора:

параллельное получение данных сегментами локального кластера напрямую с сегментов удаленного кластера;
транзакционная вставка данных с локального на удаленный кластер в режиме "master-master";
возможность автоматического определения количества обработчиков (Query Executor, QE).

Читать документацию

ADB 7 на базе Greenplum 7

Новая Community-версия

ADB 7 открывает новую эру аналитики больших данных с мощными улучшениями и передовыми возможностями. Обновление приносит еще больше надежности, безопасности и контроля над данными, предоставляя организациям инструменты для быстрого и эффективного анализа. С новыми уровнями производительности и простотой управления, ADB 7 станет ключевым инструментом для компаний, стремящихся максимизировать свои аналитические возможности и ускорить принятие решений.

Кроме того, эта версия идеальна для тех, кто ищет надежное и производительное решение с открытым исходным кодом. Присоединяйтесь к нашему сообществу, чтобы получить доступ к новым возможностям для эффективного управления и анализа данных.

Ключевые особенности ADB 7

Современное ядро на базе PostgreSQL 12

ADB 7 построен на основе PostgreSQL 12, что обеспечивает улучшенную совместимость и доступ к новым возможностям, предоставленным в этой версии PostgreSQL.

Значительный рост производительности

Внедрение JIT-компиляции, поддержка новых типов индексов, усовершенствование индексации AO/CO-таблиц, добавление хинтов оптимизатора и параметризированных запросов, а также другие улучшения в GPORCA обеспечивают ощутимое повышение производительности.

Расширенные инструменты администрирования и управления ресурсами

Обновленные возможности управления кластером делают процесс администрирования более гибким и эффективным, позволяя точнее настраивать использование ресурсов и обеспечивать бесперебойную работу даже в условиях высокой нагрузки.

Усиленные меры безопасности

В ADB 7 внедрены дополнительные средства управления доступом и защиты данных, включая улучшенную проверку доступа, контроль на уровне строк, а также встроенные механизмы аудита, что делает систему еще более безопасной.

Расширенные возможности интеграции

Поддержка дополнительных инструментов для внешних таблиц (FDW) расширяет возможности интеграции с различными системами, обеспечивая более гибкое и эффективное взаимодействие с внешними источниками данных.

Улучшенная поддержка облачных решений

ADB 7 предлагает улучшенную поддержку облачных сред, включая оптимизацию работы в облаках и гибридных инфраструктурах, что обеспечивает повышенную гибкость и масштабируемость для современных корпоративных приложений.

Сравнение продуктов

Arenadata DB

К сравнению

VMWare Tanzu Greenplum

Teradata

Vertica

Oracle Autonomous Data Warehouse

К сравнению

VMWare Tanzu Greenplum

Teradata

Vertica

Oracle Autonomous Data Warehouse

Инфраструктура

Система управления, включая простую установку, обновление и модернизацию

Есть

Нет

Есть

Расширение кластера

Есть

Только через CLI.

Есть

Система мониторинга

Есть

Система резервного копирования/восстановления с графическим интерфейсом

Есть

Нет

Есть

Поддержка IT-ландшафта

Возможность развертывания различных сочетаний bare metal, cloud

Есть

Поддержка PaaS у облачных провайдеров

VK Cloud;

Cloud.ru (в разработке).

AWS;

Azure;

Google Cloud Platform.

AWS;

Azure;

Google Cloud Platform.

AWS;

Azure;

Google Cloud Platform.

Oracle Cloud.

Поддержка отечественных операционных систем

Alt Linux

Есть

Нет

Astra Linux

Есть

Нет

RED OS

Есть

Нет

Ubuntu

Есть

Функционал

Физическое бэкапирование/восстановление

Есть

Нет

Есть

Мониторинг кластера

Есть

Мониторинг запросов

Есть

Возможно ухудшение производительности.

Есть

Интеграции

Kafka

Есть

ADB Kafka Connector.

Есть

Возможно ухудшение производительности.

Есть

За дополнительную стоимость (недоступно для РФ).

ClickHouse

Есть

ADB ClickHouse Connector.

Есть

Только через PXF, ручная интеграция

Есть

Только через JDBC.

Есть

Только через JDBC.

Есть

За дополнительную стоимость, ручная интеграция (недоступно для РФ).

Hadoop

Есть

ADB PXF Connector.

Есть

За дополнительную стоимость (недоступно для РФ).

Spark

Есть

ADB Spark Connector.

Есть

Только через JDBC.

Есть

За дополнительную стоимость (недоступно для РФ).

Cluster-to-cluster

Есть

ADB to ADB Connector.

Есть

За дополнительную стоимость (недоступно для РФ).

Настройки безопасности

SSL между клиентом и сервером

Есть

Синхронизация с LDAP

Есть

Внешнее хранение секретов

В разработке

Нет

Есть

Дополнительно

Техническая поддержка 24х7

Есть

Нет

Есть

(Недоступно для РФ).

Есть

(Недоступно для РФ).

Нет

Самые быстрые выпуски исправлений ошибок, новых функций и оптимизации

Есть

Нет

Обучение/тренинги

Есть

Нет

Есть

(Недоступно для РФ).

Есть

(Недоступно для РФ).

Нет

Версия для сообщества

Есть

Нет

Есть

С ограничениями.

Нет

Документация на русском языке

Есть

Нет

Регистрация в реестре отечественного программного обеспечения

Есть

Нет

Сертификация ФСТЭК

Есть

Нет

ADB Control & Backup Manager

К сравнению

Tanzu Greenplum Command Center

Teradata Viewpoint

Oracle Enterprise Manager

К сравнению

Tanzu Greenplum Command Center

Teradata Viewpoint

Oracle Enterprise Manager

Инфраструктура

Система управления

Arenadata Cluster Manager (ADCM)

Нет

Teradata Vantage

Oracle Enterprise Manager Cloud Control

Централизованный апгрейд

Есть

Через ADCM.

Нет

Есть

Поддержка IT-ландшафта

Возможность развертывания различных сочетаний bare metal, cloud

Есть

Поддержка отечественных операционных систем

Alt Linux

Есть

Нет

Astra Linux

Есть

Нет

RED OS

Есть

Нет

Функционал

Интеграция с другими продуктами

ADB

Tanzu Greenplum

Teradata

Oracle

Пользовательский UI с разграничением доступа по ролям

Есть

Подключение нескольких кластеров различных типов (с/без Standby и зеркалирования) через UI

Есть

Нет

Есть

Выгрузка метрик во внешнюю БД через UI

Есть

Нет

Мониторинг запросов и транзакций, история запросов в UI

Есть

Отслеживание выполнения и плана запроса в UI

Есть

Приоритизация ресурсов через UI

Есть

Нет

Снятие бинарных бэкапов с работающего кластера через UI

Есть

Нет

Есть

Управление бэкапами: конфигурация, запуск по расписанию и вручную, просмотр, удаление, создание restore points (UI)

Есть

Нет

Есть

Поддержка S3- и Posix-совместимых хранилищ для бэкапов

Есть

Нет

Есть

Disaster recovery

Да (асинхронный)

Нет

On-premises

Есть

Настройки безопасности

SSL-шифрование

Есть

Управляется в ADCM.

Есть

Стандартное разделение доступа на основе Role Based Access Control

Есть

Журналирование действий пользователей и системы

Есть

Дополнительно

Техническая поддержка 24/7

Есть

Нет

Недоступно для РФ

Обучение/тренинги

Есть

Полноценное обучение работе с продуктами Arenadata.

Нет

Недоступно для РФ

Community-версия

Нет

Документация

Есть

Регистрация в реестре отечественного ПО

Есть

Нет

Успешные внедрения

Есть

История релизов с описанием

Есть

В открытом доступе полная история релизов с версиями сервисов и описанием доработанного функционала.

Есть

Раздел "Сравнение продуктов" является актуальным на дату 14.11.2024.

Релизы

2023

ADB 7.4.0

ADB Control 4.15.0

ADBM 2.8.0

ADB 6.29.1.1

ADBM 2.6.6

ADB 6.29.0.3

ADB Control 4.14.2

ADBM 2.6.5

ADB 6.27.1.66

ADB Control 4.13.3

ADBM 2.5.5

ADB 6.27.1.63

ADBM 2.5.0

ADB Control 4.13.0

ADB 6.27.1.60

ADBM 2.4.0

ADB Control 4.12.0

ADB 6.27.1.59

ADB Control 4.11.0

ADBM 2.3.2

ADB 6.27.1.58

ADB Control 4.10.3

ADBM 2.2.3

ADB 7.2.0.1

ADB 6.27.1.57

ADB Control 4.9.1

ADBM 2.1.2

ADB 6.27.1.56

ADB Control 4.8.8

ADBM 2.0.4

ADB 6.26.2.55

ADB Control 4.7.5

ADBM 1.7.3

ADB 6.26.0.53

ADB Control 4.6.4

ADBM 1.6.3

ADB 6.25.2.52

ADB Control 4.5.3

ADBM 1.5.2

ADB 6.25.1.51

ADB Control 4.4.0

ADBM 1.4.0

ADB 6.25.1.49

ADB Control 4.3.3

ADBM 1.3.3

ADB 6.24.3.48

ADB Control 4.3.2

ADBM 1.3.2

ADB 6.24.3.47

ADB Control 4.3.1

ADBM 1.3.1

ADB 6.23.5

ADB 5.29.11

ADB 6.23.3

ADB Control 4.2.1

ADBM 1.2.1

ADB 6.22.1

ADBM 1.1.0

ADB Control 4.1.0

ADB 6.22.0

ADB Control 3.7.0

ADB 6.21.1

ADB Control 3.6.0

ADB 6.21.0

ADB Control 3.5.1

ADB 6.20.1

ADB Control 3.4.0

ADB 6.19.3

ADB Control 3.3.1

ADB 6.18.2

ADB Control 3.2.5

ADB 6.18.0

ADB Control 3.2.4

ADB 6.17.5

ADB Control 3.1.3

ADB 6.17.1

ADB Control 3.1.0

ADB 6.16.2

ADB Control 2.1.1

ADB 6.15.0

ADB Control 2.0.3

ADB 6.14.1

ADB 6.14.0

ADB 6.13.0

ADB 6.12.1