Подключение к MapReduce через CLI
Обзор CLI
MapReduce предоставляет интерфейс командной строки, реализованный в виде скрипта bin/mapred. Чтобы взаимодействовать с MapReduce через CLI, подключитесь к хосту кластера с компонентом MapReduce через SSH и запустите нужную команду MapReduce CLI.
Для проверки работы MapReduce CLI можно запросить версию с помощью команды:
$ mapred version
Пример вывода:
Hadoop 3.2.4 Source code repository git@ssh.gitlab.adsw.io:arenadata/infrastructure/code/ci/prj_adh.git -r 3cb85f40e394dcfb50fe77310908cce385381ba2 Compiled by jenkins on 2024-03-20T17:53Z Compiled with protoc 2.5.0 From source with checksum ee031c16fe785bbb35252c749418712 This command was run using /usr/lib/hadoop/hadoop-common-3.2.4.jar
Запуск команды mapred без аргументов выводит список всех команд MapReduce.
Команды имеют следующий синтаксис:
$ mapred [SHELL_OPTIONS] COMMAND [GENERIC_OPTIONS] [COMMAND_OPTIONS]
Здесь:
-
SHELL_OPTIONS— опции Hadoop shell, описанные в разделе Shell Options справки команд Hadoop. -
GENERIC_OPTIONS— стандартные опции, поддерживаемые несколькими командами. Дополнительную информацию можно получить в разделе Generic Options справки команд Hadoop. -
COMMAND_OPTIONS— опции, специфичные для конкретной команды, описанные в справочных материалах.
Примеры использования
Обычно задачи (jobs) для MapReduce запускается с помощью команд yarn jar или hadoop jar, но вы можете использовать MapReduce CLI, например, для получения информации о конкретных задачах и для контроля их выполнения.
Чтобы увидеть список всех задач, выполните:
$ mapred job -list all
Пример вывода:
Total jobs:13
JobId JobName State StartTime UserName Queue Priority UsedContainers RsvdContainers UsedMem RsvdMem NeededMem AM info
job_1713528166269_0001 QuasiMonteCarlo SUCCEEDED 1713529720429 yarn default DEFAULT N/A N/A N/A N/A N/A http://elenas-adh2.ru-central1.internal:8088/proxy/application_1713528166269_0001/
job_1713770455913_0001 QuasiMonteCarlo SUCCEEDED 1713770623388 yarn default DEFAULT N/A N/A N/A N/A N/A http://elenas-adh2.ru-central1.internal:8088/proxy/application_1713770455913_0001/
job_1713770455913_0002 QuasiMonteCarlo SUCCEEDED 1713771341014 yarn default DEFAULT N/A N/A N/A N/A N/A http://elenas-adh2.ru-central1.internal:8088/proxy/application_1713770455913_0002/
job_1713964485222_0001 QuasiMonteCarlo PREP 1713965480860 yarn default DEFAULT 1 0 2048M 0M 2048M http://elenas-adh2.ru-central1.internal:8088/proxy/application_1713964485222_0001/
job_1701175565199_0001 QuasiMonteCarlo SUCCEEDED 1701175708248 yarn default DEFAULT N/A N/A N/A N/A N/A http://elenas-adh2.ru-central1.internal:8088/proxy/application_1701175565199_0001/
job_1705311887839_0001 QuasiMonteCarlo SUCCEEDED 1705319626157 yarn default DEFAULT N/A N/A N/A N/A N/A http://elenas-adh2.ru-central1.internal:8088/proxy/application_1705311887839_0001/
job_1705311887839_0002 QuasiMonteCarlo SUCCEEDED 1705319754517 yarn default DEFAULT N/A N/A N/A N/A N/A http://elenas-adh2.ru-central1.internal:8088/proxy/application_1705311887839_0002/
job_1705573015955_0002 QuasiMonteCarlo SUCCEEDED 1705658611315 yarn default DEFAULT N/A N/A N/A N/A N/A http://elenas-adh2.ru-central1.internal:8088/proxy/application_1705573015955_0002/
job_1704872668642_0003 QuasiMonteCarlo SUCCEEDED 1704884498654 yarn default DEFAULT N/A N/A N/A N/A N/A http://elenas-adh2.ru-central1.internal:8088/proxy/application_1704872668642_0003/
job_1712415098046_0001 QuasiMonteCarlo SUCCEEDED 1712416353017 yarn default DEFAULT N/A N/A N/A N/A N/A http://elenas-adh2.ru-central1.internal:8088/proxy/application_1712415098046_0001/
job_1704872668642_0004 QuasiMonteCarlo SUCCEEDED 1704884603925 yarn default DEFAULT N/A N/A N/A N/A N/A http://elenas-adh2.ru-central1.internal:8088/proxy/application_1704872668642_0004/
job_1704872668642_0001 distcp SUCCEEDED 1704884156346 hdfs default DEFAULT N/A N/A N/A N/A N/A http://elenas-adh2.ru-central1.internal:8088/proxy/application_1704872668642_0001/
job_1704872668642_0002 distcp SUCCEEDED 1704884247607 hdfs default DEFAULT N/A N/A N/A N/A N/A http://elenas-adh2.ru-central1.internal:8088/proxy/application_1704872668642_0002/
Чтобы увидеть состояние конкретной задачи, выполните:
$ mapred job -status <job-ID>
Здесь job-ID — это идентификатор задачи, по которой запрашивается информация.
Пример вывода:
Job: job_1713964485222_0001
Job File: hdfs://adh/user/yarn/.staging/job_1713964485222_0001/job.xml
Job Tracking URL : http://elenas-adh2.ru-central1.internal:8088/proxy/application_1713964485222_0001/
Uber job : false
Number of maps: 16
Number of reduces: 1
map() completion: 0.625
reduce() completion: 0.0
Job state: RUNNING
retired: false
reason for failure:
Counters: 33
File System Counters
FILE: Number of bytes read=0
FILE: Number of bytes written=2306730
FILE: Number of read operations=0
FILE: Number of large read operations=0
FILE: Number of write operations=0
HDFS: Number of bytes read=2536
HDFS: Number of bytes written=0
HDFS: Number of read operations=40
HDFS: Number of large read operations=0
HDFS: Number of write operations=0
Job Counters
Launched map tasks=11
Data-local map tasks=11
Total time spent by all maps in occupied slots (ms)=19885
Total time spent by all map tasks (ms)=19885
Total vcore-milliseconds taken by all map tasks=19885
Total megabyte-milliseconds taken by all map tasks=20362240
Map-Reduce Framework
Map input records=10
Map output records=20
Map output bytes=180
Map output materialized bytes=280
Input split bytes=1356
Combine input records=0
Spilled Records=20
Failed Shuffles=0
Merged Map outputs=0
GC time elapsed (ms)=406
CPU time spent (ms)=3600
Physical memory (bytes) snapshot=3162824704
Virtual memory (bytes) snapshot=28058554368
Total committed heap usage (bytes)=2188902400
Peak Map Physical memory (bytes)=346021888
Peak Map Virtual memory (bytes)=2810654720
File Input Format Counters
Bytes Read=1180