Маскирование столбцов в Hive с использованием Ranger

Обзор

Маскирование столбцов в Hive — это функция Ranger, позволяющая обфусцировать чувствительные данные. Для использования маскирования необходимо активировать плагин Ranger Hive. Пример ниже показывает, как активировать маскирование для столбца таблицы Hive. Предполагается, что таблица Hive уже создана и заполнена данными.

В данном примере используются следующие данные:

name    mass
Sun     1989100000
Mercury	330
Venus	4867
Earth	5972
Mars	642
Jupiter	1898187
Saturn	568317
Uranus	86813
Neptune	102413

Политика маскирования

  1. В web-интерфейсе Ranger Admin выберите сервис Hive вашего кластера ADH.

    Сервис Hive в Ranger
    Сервис Hive в Ranger
    Сервис Hive в Ranger
    Сервис Hive в Ranger
  2. Откройте вкладку Masking и нажмите Add New Policy.

    Вкладка Masking в Ranger
    Вкладка Masking в Ranger
    Вкладка Masking в Ranger
    Вкладка Masking в Ranger
  3. Заполните параметры политики и нажмите Save.

    Параметры политики маскирования
    Параметры политики маскирования
    Параметры политики маскирования
    Параметры политики маскирования

    В Ranger доступны следующие опции маскирования:

    • Redact — для строковых типов данных все буквенные символы заменяются на n, а все численные — на x. Для целочисленных типов данных все символы заменяются на 1. Для типов данных с плавающей точкой все значения ячеек заменяются на NULL.

    • Partial mask: show last 4 — показываются только последние 4 символа, а остальные маскируются по тем же правилам, что и при Redact.

    • Partial mask: show first 4 — показываются только первые 4 символа, а остальные маскируются по тем же правилам, что и при Redact.

    • Hash — все значения заменяются на хеш изначального значения ячейки.

    • Nullify — все значения заменяются на NULL.

    • Unmasked (retain original value) — все значения остаются незамаскированными.

    • Date: show only year — день и месяц заменяются на 01/01, а значение года остается неизменным.

    • Custom — позволяет указать кастомное правило маскирования.

  4. Чтобы проверить правильность работы политики, отправьте запрос к БД. В данном примере для этого используется HUE.

    Результат запроса в HUE с замаскированными данными
    Результат запроса в HUE с замаскированными данными
    Результат запроса в HUE с замаскированными данными
    Результат запроса в HUE с замаскированными данными
Нашли ошибку? Выделите текст и нажмите Ctrl+Enter чтобы сообщить о ней