Подготовка окружения
Hadoop представляет собой программную платформу для анализа распределенных данных с использованием обычных серверов. В данном разделе мы рекомендуем некоторые принципы надежного размещения этого программного обеспечения с использованием различных аппаратных и программных средств. Очень важно точно определить объем данных, тип и количество задач для кластеров Hadoop. Существуют метрики для измерения реальной рабочей нагрузки при работе над пилотным проектом. Вы можете масштабировать пилотный кластер, не прибегая к значительным изменениям в уже установленном оборудовании, программном обеспечении, стратегии размещения и сетевых соединениях.
Это руководство включает: