Подготовка окружения

Hadoop представляет собой программную платформу для анализа распределенных данных с использованием обычных серверов. В данном разделе мы рекомендуем некоторые принципы надежного размещения этого программного обеспечения с использованием различных аппаратных и программных средств. Очень важно точно определить объем данных, тип и количество задач для кластеров Hadoop. Существуют метрики для измерения реальной рабочей нагрузки при работе над пилотным проектом. Вы можете масштабировать пилотный кластер, не прибегая к значительным изменениям в уже установленном оборудовании, программном обеспечении, стратегии размещения и сетевых соединениях.

Это руководство включает:

Нашли ошибку? Выделите текст и нажмите Ctrl+Enter чтобы сообщить о ней