Маскирование столбцов в Hive с использованием Ranger
Обзор
Маскирование столбцов в Hive — это функция Ranger, позволяющая обфусцировать чувствительные данные. Для использования маскирования необходимо активировать плагин Ranger Hive. Пример ниже показывает, как активировать маскирование для столбца таблицы Hive. Предполагается, что таблица Hive уже создана и заполнена данными.
В данном примере используются следующие данные:
name mass Sun 1989100000 Mercury 330 Venus 4867 Earth 5972 Mars 642 Jupiter 1898187 Saturn 568317 Uranus 86813 Neptune 102413
Политика маскирования
-
В web-интерфейсе Ranger Admin выберите сервис Hive вашего кластера ADH.
Сервис Hive в Ranger
Сервис Hive в Ranger -
Откройте вкладку Masking и нажмите Add New Policy.
Вкладка Masking в Ranger
Вкладка Masking в Ranger -
Заполните параметры политики и нажмите Save.
Параметры политики маскирования
Параметры политики маскированияВ Ranger доступны следующие опции маскирования:
-
Redact — для строковых типов данных все буквенные символы заменяются на
n, а все численные — наx. Для целочисленных типов данных все символы заменяются на1. Для типов данных с плавающей точкой все значения ячеек заменяются наNULL. -
Partial mask: show last 4 — показываются только последние 4 символа, а остальные маскируются по тем же правилам, что и при Redact.
-
Partial mask: show first 4 — показываются только первые 4 символа, а остальные маскируются по тем же правилам, что и при Redact.
-
Hash — все значения заменяются на хеш изначального значения ячейки.
-
Nullify — все значения заменяются на
NULL. -
Unmasked (retain original value) — все значения остаются незамаскированными.
-
Date: show only year — день и месяц заменяются на
01/01, а значение года остается неизменным. -
Custom — позволяет указать кастомное правило маскирования.
-
-
Чтобы проверить правильность работы политики, отправьте запрос к БД. В данном примере для этого используется HUE.
Результат запроса в HUE с замаскированными данными
Результат запроса в HUE с замаскированными данными