scan

Определение

Сканирует таблицу и возвращает все строки, соответствующие заданным спецификациям.

Использование

  • Базовый синтаксис:

    scan '[<namespace_name>:]<table_name>'[,
         '<column_family>:<column_qualifier>']
  • С использованием словарей:

    scan '[<namespace_name>:]<table_name>',
         {COLUMN => <columns_array[]>[,
         VERSIONS => <number_displayed_versions>][,
         TIMESTAMP => <cell_timestamp>][,
         TIMERANGE => [<timestamp_start>, <timestamp_end>][,
         ATTRIBUTES => {'<cell_attribute_name>' => '<cell_attribute_value>'[,...]}]}
  • На уровне таблицы:

    scan '[<namespace_name>:]<table_name>',
         {TIMERANGE => [<timestamp_start>, <timestamp_end>]}
  • С использованием фильтров:

    scan '[<namespace_name>:]<table_name>',
         {[ROWPREFIXFILTER => '<row_prefix>'][,
         FILTER => "<filter_description>"]}`
  • С использованием метрик:

    scan '[<namespace_name>:]<table_name>',
         {ALL_METRICS => true} | {METRICS => <metrics_array[]>}
  • Включая ячейки, помеченные как удаленные:

    scan '[<namespace_name>:]<table_name>',
         {RAW => true, VERSIONS => <number_displayed_versions>}
Аргументы
Параметр Описание

namespace_name

Имя пространства имен

table_name

Имя таблицы

column_family

Имя семейства столбцов

column_qualifier

Квалификатор столбца (column qualifier)

columns_array

Массив строк, указанных в формате '<column_family>:<column_qualifier>', где <column_family> — имя семейства столбцов; <column_qualifier> — квалификатор столбца

number_displayed_versions

Количество версий ячеек, которые необходимо отобразить

cell_timestamp

Временная метка ячейки

timestamp_start

Начальное значение для поиска временных меток ячеек

timestamp_end

Конечное значение для поиска временных меток ячеек

cell_attribute_name

Имя атрибута ячейки

cell_attribute_value

Значение указанного атрибута ячейки

row_prefix

Префикс для поиска ключей строки

filter_description

Фильтр, используемый для поиска ячеек таблицы

metrics_array

Массив имен метрик статистики

Примеры

Сканирование всей таблицы

hbase(main):003:0> scan 't4'
ROW                                      COLUMN+CELL
 r1                                      column=cf1:c1, timestamp=1637324524743, value=value1
 r1                                      column=cf1:c2, timestamp=2222221111111, value=value2
 r1                                      column=cf1:c3, timestamp=1637326735791, value=value3_new
 r1                                      column=cf1:c4, timestamp=1637324859512, value=value4
 r1                                      column=cf1:c5, timestamp=1637329193429, value=7738718b
1 row(s)
Took 0.0744 seconds

Сканирование указанной ячейки столбца

hbase(main):010:0> scan 't4', {COLUMN => 'cf1:c1'}
ROW                                      COLUMN+CELL
 r1                                      column=cf1:c1, timestamp=1637324524743, value=value1
1 row(s)
Took 0.0103 seconds

Сканирование нескольких столбцов

hbase(main):008:0> scan 't4', {COLUMN => ['cf1:c1', 'cf1:c2']}
ROW                                      COLUMN+CELL
 r1                                      column=cf1:c1, timestamp=1637324524743, value=value1
 r1                                      column=cf1:c2, timestamp=2222221111111, value=value2
1 row(s)
Took 0.0149 seconds

Использование TIMERANGE

hbase(main):009:0> scan 't4', {TIMERANGE => [1637324524743, 1637326735791]}
ROW                                      COLUMN+CELL
 r1                                      column=cf1:c1, timestamp=1637324524743, value=value1
 r1                                      column=cf1:c4, timestamp=1637324859512, value=value4
1 row(s)
Took 0.0129 seconds

Сканирование нескольких версий значений одного столбца

hbase(main):011:0> scan 't4', {COLUMN => 'cf1:c5', VERSIONS => 5}
ROW                                      COLUMN+CELL
 r1                                      column=cf1:c5, timestamp=1637329193429, value=7738718b
 r1                                      column=cf1:c5, timestamp=1637329190124, value=7738718a
 r1                                      column=cf1:c5, timestamp=1637329187604, value=7738718W
 r1                                      column=cf1:c5, timestamp=1637328326920, value=7738718M
1 row(s)
Took 0.0085 seconds

Сканирование указанной версии значения

hbase(main):016:0> scan 't4', {COLUMN => 'cf1:c5', TIMESTAMP => 1637329190124}
ROW                                      COLUMN+CELL
 r1                                      column=cf1:c5, timestamp=1637329190124, value=7738718a
1 row(s)
Took 0.0070 seconds

Использование фильтра для значений столбца

hbase(main):019:0> scan 't4', {FILTER => "ValueFilter(=, 'regexstring:value*')"}
ROW                                      COLUMN+CELL
 r1                                      column=cf1:c1, timestamp=1637324524743, value=value1
 r1                                      column=cf1:c2, timestamp=2222221111111, value=value2
 r1                                      column=cf1:c3, timestamp=1637326735791, value=value3_new
 r1                                      column=cf1:c4, timestamp=1637324859512, value=value4
1 row(s)
Took 0.0380 seconds

Использование префикса для поиска ключей строки

hbase(main):026:0> scan 't4', {ROWPREFIXFILTER => 'r'}
ROW                                      COLUMN+CELL
 r1                                      column=cf1:c1, timestamp=1637324524743, value=value1
 r1                                      column=cf1:c2, timestamp=2222221111111, value=value2
 r1                                      column=cf1:c3, timestamp=1637326735791, value=value3_new
 r1                                      column=cf1:c4, timestamp=1637324859512, value=value4
 r1                                      column=cf1:c5, timestamp=1637329193429, value=7738718b
1 row(s)
Took 0.0077 seconds

Получение всех статистических показателей

hbase(main):022:0> scan 't4', {ALL_METRICS => true}
ROW                                      COLUMN+CELL
 r1                                      column=cf1:c1, timestamp=1637324524743, value=value1
 r1                                      column=cf1:c2, timestamp=2222221111111, value=value2
 r1                                      column=cf1:c3, timestamp=1637326735791, value=value3_new
 r1                                      column=cf1:c4, timestamp=1637324859512, value=value4
 r1                                      column=cf1:c5, timestamp=1637329193429, value=7738718b
1 row(s)

METRIC                                   VALUE
 BYTES_IN_REMOTE_RESULTS                 191
 BYTES_IN_RESULTS                        191
 MILLIS_BETWEEN_NEXTS                    5
 NOT_SERVING_REGION_EXCEPTION            0
 REGIONS_SCANNED                         1
 REMOTE_RPC_CALLS                        1
 REMOTE_RPC_RETRIES                      0
 ROWS_FILTERED                           0
 ROWS_SCANNED                            1
 RPC_CALLS                               1
 RPC_RETRIES                             0
Took 0.0079 seconds

Получение определенных статистических показателей

hbase(main):028:0> scan 't4', {METRICS => ['RPC_RETRIES', 'ROWS_FILTERED']}
ROW                                      COLUMN+CELL
 r1                                      column=cf1:c1, timestamp=1637324524743, value=value1
 r1                                      column=cf1:c2, timestamp=2222221111111, value=value2
 r1                                      column=cf1:c3, timestamp=1637326735791, value=value3_new
 r1                                      column=cf1:c4, timestamp=1637324859512, value=value4
 r1                                      column=cf1:c5, timestamp=1637329193429, value=7738718b
1 row(s)

METRIC                                   VALUE
 ROWS_FILTERED                           0
 RPC_RETRIES                             0
Took 0.0131 seconds

Включая ячейки, отмеченные для удаления

hbase(main):001:0> scan 't4', {RAW => true, VERSIONS => 10}
ROW                                      COLUMN+CELL
 r1                                      column=cf1:c1, timestamp=1637324524743, value=value1
 r1                                      column=cf1:c2, timestamp=2222221111111, value=value2
 r1                                      column=cf1:c3, timestamp=1637326735791, value=value3_new
 r1                                      column=cf1:c4, timestamp=1637324859512, value=value4
 r1                                      column=cf1:c5, timestamp=1637329193429, value=7738718b
 r1                                      column=cf1:c5, timestamp=1637329190124, value=7738718a
 r1                                      column=cf1:c5, timestamp=1637329187604, value=7738718W
 r1                                      column=cf1:c5, timestamp=1637328326920, value=7738718M
 r1                                      column=cf2:c1, timestamp=1637329303310, type=Delete
 r1                                      column=cf2:c1, timestamp=1637329303310, value=last
 r1                                      column=cf2:c1, timestamp=1637329264711, type=Delete
 r1                                      column=cf2:c1, timestamp=1637329264711, value=value_new_new2
 r1                                      column=cf2:c1, timestamp=1637329262403, type=Delete
 r1                                      column=cf2:c1, timestamp=1637329262403, value=value_new
 r1                                      column=cf2:c1, timestamp=1637329253123, type=Delete
 r1                                      column=cf2:c1, timestamp=1637329253123, value=value
1 row(s)
Took 0.3665 seconds
Нашли ошибку? Выделите текст и нажмите Ctrl+Enter чтобы сообщить о ней