Командная строка Beeline

Команды Beeline

!<SQLLine command>

Выполняет SQLLine-команду

!delimiter

Устанавливает разделитель для запросов Beeline. Допустимы разделители, состоящие из нескольких символов, но недопустимы кавычки, слеши и символы --. По умолчанию используется символ ;.

Использование: !delimiter $$

Версия: 3.0.0

Свойства Beeline

fetchsize

Стандарт JDBC позволяет указать количество строк для запроса, получаемых при каждом обходе (round trip) базы данных. Это количество называют объёмом выборки (fetch size). Задание объёма выборки в Beeline переписывает стандартное значение объёма выборки драйвера JDBC и влияет на последующие команды, выполняющиеся в текущей сессии.

Значение -1 передаёт для Beeline инструкцию использовать значение объёма выборки драйвера JDBC по умолчанию.

Значение 0 или большее передаётся драйверу JDBC для каждой команды.

Любое другое отрицательное значение вызовет ошибку.

Использование: !set fetchsize 200

Версия: 4.0.0

Команды Beeline для Hive

Команды, специфичные для Hive (как и команды интерфейса Hive), можно запускать из Beeline, если используется драйвер Hive JDBC. Используйте ; (точку с запятой), чтобы завершать команды. Для полных версий аргументов можно использовать префикс --.

Hive-команды в Beeline

reset

Сбрасывает конфигурацию до значений по умолчанию

reset <key>

Сбрасывает значение конкретной конфигурационной переменной (key) до её значения по умолчанию. Если вы неправильно укажете название переменной, Beeline не выдаст ошибку

set <key>=<value>

Сбрасывает значение конкретной конфигурационной переменной (key). Если вы неправильно укажете название переменной, Beeline не выдаст ошибку

set

Показывает список конфигурационных переменных, которые изменены пользователем или непосредственно процессами Hive

set -v

Показывает все конфигурационные переменные Hadoop и Hive

add FILE[S] <filepath> <filepath>\*

add JAR[S] <filepath> <filepath>\*

add ARCHIVE[S] <filepath> <filepath>\*

Добавляет один или несколько файлов, JAR-файлов либо архивов в список ресурсов в распределённом кеше. Больше информации можно найти на странице Hive Resources документации Apache Hive

add FILE[S] <ivyurl> <ivyurl>\*

add JAR[S] <ivyurl> <ivyurl>\*

add ARCHIVE[S] <ivyurl> <ivyurl>\*

В Hive 1.2.0 добавляет один или несколько файлов, JAR-файлов либо архивов в список ресурсов в распределённом кеше, используя Ivy URL вида ivy://group:module:version?query_string. Больше информации можно найти на странице Hive Resources документации Apache Hive

list FILE[S]

list JAR[S]

list ARCHIVE[S]

Показывает список ресурсов, уже добавленных в распределённый кеш. Больше информации можно найти на странице Hive Resources документации Apache Hive

list FILE[S] <filepath>\*

list JAR[S] <filepath>\*

list ARCHIVE[S] <filepath>\*

Проверяет, добавлены ли данные ресурсы в распределённый кеш. Больше информации можно найти на странице Hive Resources документации Apache Hive

delete FILE[S] <filepath>\*

delete JAR[S] <filepath>\*

delete ARCHIVE[S] <filepath>\*

Удаляет ресурсы из распределённого кеша

delete FILE[S] <ivyurl> <ivyurl>\*

delete JAR[S] <ivyurl> <ivyurl>\*

delete ARCHIVE[S] <ivyurl> <ivyurl>\*

В Hive 1.2.0 удаляет из распределённого кеша ресурсы, которые были добавлены с использованием <ivyurl>. Больше информации можно найти на странице Hive Resources документации Apache Hive

reload

В Hive 0.14.0 оповещает HiveServer2 о любых изменениях JAR-файлов по пути, указанному в конфигурационном параметре hive.reloadable.aux.jars.path (без необходимости перезапускать HiveServer2). Изменения могут включать добавление, удаление или обновление JAR-файлов

dfs <dfs command>

Выполняет команду dfs

<query string>

Выполняет запрос Hive и выводит результаты в стандартный вывод

Аргументы команд Beeline

Команды Beeline работают со следующими аргументами:

Аргумент Описание Пример использования

-u <database URL>

Устанавливает JDBC URL для соединения. Специальные символы в значениях параметров при необходимости должны быть закодированы в кодировке URL

$ beeline -u db_URL

-r

Повторно соединяется с Hive с помощью последнего использованного URL (если при последнем соединении были использованы команды !connect и !save).

Версия: 2.1.0

$ beeline -r

-n <username>

Устанавливает имя пользователя, необходимое для подключения

$ beeline -n <valid_user>

-p <password>

Устанавливает пароль, необходимый для подключения.

Опциональное указание пароля: Начиная с Hive 2.2.0, аргумент после -p не обязателен. Если после -p пароль не указан, Beeline запросит пароль при подключении. Если пароль указан, то Beeline использует его для подключения

$ beeline -p <valid_password>

-d <driver class>

Устанавливает класс драйвера, который нужно использовать для подключения

$ beeline -d <driver_class>

-e <query>

Определяет запрос, который нужно выполнить. Запрос заключен в двойные либо одинарные кавычки. Этот аргумент можно задать несколько раз

$ beeline -e "query_string"

-f <file>

Указывает файл скрипта, который нужно выполнить. Если скрипт содержит отступы (tabs), обработка запроса приводит к ошибке в версии 0.12.0. Этот баг исправлен в версии 0.13.0

$ beeline -f <path/to/file>

-i <file>

--init <files>

Указывает файлы для инициализации.

Версия: 0.14.0 для одного файла.

Версия: 2.1.0: для нескольких файлов

$ beeline -i <path/to/initfile>

-w <password file>

--password-file <password file>

Указывает путь к файлу, который содержит пароль.

Версия: 1.2.0

$ beeline -u '<JDBC_URL>' -n test_user -w pass

-a <auth_type>

--authType <auth type>

Указывает тип аутентификации, который передаётся JDBC в виде свойства auth.

Версия: 0.13.0

$ beeline --authType 'kerberos'

--property-file <file>

Указывает файл, из которого нужно прочитать конфигурационные свойства.

Версия: 2.2.0

$ beeline --property-file <path/to/file>

--hiveconf property=value

Устанавливает значение текущего конфигурационного свойства. Свойства, которые указаны в hive.conf.restricted.list, не могут быть изменены через hiveconf (больше информации можно получить на странице Restricted List and Whitelist документации Apache Hive). Версия: 0.13.0

$ beeline --hiveconf prop1=value1

--hivevar name=value

Определяет имя и значение для переменной Hive. Эта опция является специфической для Hive и позволяет задавать на уровне сессии переменные, которые могут использоваться в командах и запросах Hive

$ beeline --hivevar var1=value1

--color=[true/false]

Управляет подсветкой вывода. По умолчанию принимает значение false Не поддерживается для форматов Separated-Value Output

$ beeline --color=true

--showHeader=[true/false]

Добавляет (true) или удаляет (false) названия столбцов из результатов запроса. По умолчанию принимает значение true

$ beeline --showHeader=false

--headerInterval=ROWS

Определяет интервал для повторного отображения заголовков столбцов после определённого числа строк, когда outputformat=table. По умолчанию принимает значение 100. Не поддерживается для форматов Separated-Value Output

$ beeline --headerInterval=50

--fastConnect=[true/false]

Определяет, пропускать (true) или выполнять (false) стадию создания списка всех таблиц и столбцов для автоматической подстановки после tab в выражениях HiveQL. По умолчанию принимает значение true

$ beeline --fastConnect=false

--autoCommit=[true/false]

Включает/отключает автоматические коммиты для транзакций. По умолчанию принимает значение false

$ beeline --autoCommit=true

--verbose=[true/false]

Определяет, отображать (true) или скрывать (false) подробные сообщения об ошибках и информацию для их анализа (debugging). По умолчанию принимает значение false

$ beeline --verbose=true

--showWarnings=[true/false]

Управляет отображением предупреждений после выполнения любых команд HiveQL. По умолчанию принимает значение false

$ beeline --showWarnings=true

--showDbInPrompt=[true/false]

Определяет, отображать (true) или скрывать (false) имя текущей базы данных при запросе. По умолчанию принимает значение false.

Версия: 2.2.0

$ beeline --showDbInPrompt=true

--showNestedErrs=[true/false]

Управляет отображением вложенных (nested) ошибок. По умолчанию принимает значение false

$ beeline --showNestedErrs=true

--numberFormat=[pattern]

Определяет форматирование чисел, используя DecimalFormat

$ beeline --numberFormat="#,###,##0.00"

--force=[true/false]

Определяет, продолжать (true) или остановить (false) выполнение скрипта в случае ошибок. По умолчанию принимает значение false

$ beeline--force=true

--maxWidth=MAXWIDTH

Устанавливает максимальную ширину вывода символов в случае, когда outputformat=table. Символы, выходящие за границы этой величины, будут обрезаны. По умолчанию принимает значение из терминала для текущей величины параметра, затем снова принимает значение 80

$ beeline --maxWidth=150

--maxColumnWidth=MAXCOLWIDTH

Устанавливает максимальную ширину столбца в случае, когда для outputformat=table. По умолчанию принимает значение 50 в версии Hive 2.2.0+ или значение 15 в более ранних версиях

$ beeline --maxColumnWidth=25

--silent=[true/false]

Отображает (true) или скрывает (false) информационные сообщения. Также останавливает или возобновляет отображение сообщений логов для запросов из HiveServer2 (в Hive 0.14 и выше) и команд HiveQL (в Hive 1.2.0 и выше). По умолчанию принимает значение false

$ beeline --silent=true

--autosave=[true/false]

Управляет автоматическим сохранением настроек. По умолчанию принимает значение false

$ beeline --autosave=true

--outputformat=[table/vertical/csv/tsv/dsv/csv2/tsv2]

Устанавливает форматирование для отображения результатов. По умолчанию принимает значение table. Больше информации о типах форматирования можно найти на странице Separated-value output formats. Версия 0.14.0: добавлены форматы dsv/csv2/tsv2

$ beeline --outputformat=tsv

--truncateTable=[true/false]

При установке значения true столбцы таблицы будут обрезаться на экране (в случае превышения высоты экрана). Версия: 0.14.0

$ beeline --truncateTable=true

--delimiterForDSV= DELIMITER

Устанавливает разделитель для значений при формате вывода DSV. По умолчанию используется символ |.

Версия: 0.14.0

$ beeline --delimiterForDSV='*'

--isolation=LEVEL

Устанавливает уровень изоляции для транзакций TRANSACTION_READ_COMMITTED или TRANSACTION_SERIALIZABLE.

Больше информации доступно на странице Java Connection Interface

$ beeline --isolation=TRANSACTION_SERIALIZABLE

--nullemptystring=[true/false]

Определяет необходимость вывода null-значений в виде пустой строки (true) либо в виде NULL (false). По умолчанию принимает значение false.

Версия: 0.13.0

$ beeline --nullemptystring=false

--incremental=[true/false]

По умолчанию принимает значение true, начиная с Hive 2.3. В более ранних версиях значением по умолчанию было false. В случае false результат выборки помещается в буфер перед отображением, что позволяет оптимизировать размер столбцов при отображении. В случае true строки результата отображаются немедленно после загрузки, что приводит к меньшей задержке и меньшему потреблению памяти за счет дополнительного паддинга столбцов при отображении. Установка --incremental=true рекомендуется, если вы столкнулись с OutOfMemoryError на стороне клиента (в связи с тем, что загруженный результат слишком большого размера)

$ beeline --incremental=false

--incrementalBufferRows=NUMROWS

Устанавливает число строк для буфера при выводе строк в stdout, по умолчанию принимает значение 1000; используется только в случае, если --incremental=true и --outputformat=table.

Версия: 2.3.0

$ beeline --incrementalBufferRows=1000

--maxHistoryRows=NUMROWS

Устанавливает максимальное число строк для хранения в истории Beeline

Версия: 2.3.0

$ beeline --maxHistoryRows=1000

--delimiter=;

Устанавливает разделитель для запросов Beeline. Поддерживаются разделители из нескольких символов, но кавычки, слеши и -- не поддерживаются. По умолчанию используется ;

Версия: 3.0.0

$ beeline beeline --delimiter=$$

--convertBinaryArrayToString=[true/false]

Контролирует отображение двоичных данных столбца в виде строки, используя набор символов платформы по умолчанию.

Версия: 3.0.0:

Поведение по умолчанию (false) предполагает отображение двоичных данных с использованием метода Arrays.toString(byte[] columnValue).  
Версия: 4.0.0:

Двоичные данные столбцов отображаются в виде строк с использованием набора символов UTF-8. Поведение по умолчанию (false) предполагает отображение двоичных данных с использованием кодировки Base64 без padding

$ beeline --convertBinaryArrayToString=true

--help

Отображает строку помощи (help)

$ beeline --help
Нашли ошибку? Выделите текст и нажмите Ctrl+Enter чтобы сообщить о ней