Конференция Arenadata
Новое время — новый Greenplum
Мы приглашаем вас принять участие в конференции, посвященной будущему Open-Source Greenplum 19 сентября в 18:00:00 UTC +3. Встреча будет проходить в гибридном формате — и офлайн, и онлайн. Онлайн-трансляция будет доступна для всех желающих.
Внезапное закрытие Greenplum его владельцем — компанией Broadcom - стало неприятным сюрпризом для всех, кто использует или планирует начать использовать решения на базе этой технологии. Многие ожидают выхода стабильной версии Greenplum 7 и надеются на её дальнейшее активное развитие.
Arenadata не могла допустить, чтобы разрабатываемый годами Open-Source проект Greenplum прекратил своё существование, поэтому 19 сентября мы представим наш ответ на данное решение Broadcom, а участники сообщества получат исчерпывающие разъяснения на все вопросы о дальнейшей судьбе этой технологии.

На конференции вас ждёт обсуждение следующих тем:

  • План возрождения Greenplum;
  • Дорожная карта;
  • Экспертное обсуждение и консультации.
Осталось до события

Arenadata Hadoop

Arenadata Hadoop is a full-fledged enterprise distribution package based on Apache Hadoop and designed for storing and processing semi-structured and unstructured data.

TOP-10 popular articles

A cheatsheet that describes the most common HDFS commands with examples.

The article shows how to create and run your first DAG to process CSV files.

ADH release notes. Learn about new features, improvements, bug fixes, etc.

The tutorial guides you through the process of installing an Arenadata Hadoop (ADH) cluster using the online and offline installation types.

The section provides reference information on configuration parameters that can be used to configure ADH services via ADCM.

Hive provides several ways to work with tables. You can use data manipulation language (DML) queries to import or add data to a table. Also, you can directly ingest data to a Hive table using HDFS commands.

A guide on using DBeaver to connect to Hive with Kerberos authentication enabled.

An overview of HDFS (Hadoop Distributed File System) — a highly fault-tolerant distributed file system designed for deployment on low-cost hardware.

An overview of ADH (Arenadata Hadoop) — a full-fledged enterprise distribution package based on Apache Hadoop and designed for storing and processing semi-structured and unstructured data.

Recommendations and best practices on hardware, software, network, and file system requirements. A sample configuration for a test cluster.

Found a mistake? Seleсt text and press Ctrl+Enter to report it