Масштабируемость

В настоящее время Hadoop может работать на кластерах с тысячами узлов, где HDFS имеет по одному NameNode для каждого кластера. Таким образом общий объем памяти, доступный на NameNode, является основным ограничением масштабируемости. В очень больших кластерах увеличение среднего размера файлов, хранящихся в HDFS, способствует увеличению размера кластера без повышения требований к памяти для NameNode.

Important

Конфигурация по умолчанию может не подходить для очень больших кластеров