トランスフォーメーション > データマスキングトランスフォーメーション > マスキング方法の設定プロパティ
  

マスキング方法の設定プロパティ

特定のマスキング方法をどのように動作させるかを定義するには、マスキング方法のさまざまなプロパティを設定します。データマスキングトランスフォーメーションでは、選択したマスキング方法および設定した特定の構成に基づいてデータがマスクされます。
表示される設定プロパティは、マスキング方法とデータ型によって決まります。例えば、文字列データにブラーを適用することはできません。ランダムマスキング方法を使用するときは、シード値を選択できません。

再現可能な出力

再現可能な出力は、データマスキングトランスフォーメーションから返される、一貫した値のセットです。
再現可能な出力は確定的な値を返します。例えば、名のカラムに対して再現可能な出力を設定するとします。データマスキングトランスフォーメーションでは、同じ名前がワークフローに表示されるたびに、同じマスクされた値が返されます。
再現可能なマスキングを設定できるのは、文字列データ型に、ランダムマスキング方法、置換マスキング方法、特殊マスク形式のいずれかを使用するときです。[再現可能]を選択してシード値を入力し、再現可能なマスキングを設定してください。
再現可能な出力をキーマスキング方法に設定することはできません。

ディクショナリの使用の最適化

[ディクショナリ出力の最適化]オプションは、マスキングのためのディクショナリ値の使用を増やし、ターゲット内の重複するディクショナリ値を減らします。
置換マスキングまたはカスタム置換マスキングを実行する場合は、ディクショナリの使用を最適化するという選択ができます。ワークフローは、選択したディクショナリの一部の値を使用してソースデータをマスクします。これらのディクショナリ値は、すべてのソースデータがターゲットでマスクされるように、複数のエントリに対して使用される場合があります。ディクショナリの使用を最適化すると、ディクショナリ値が重複して使用される可能性が低減されます。ディクショナリの出力を最適化するには、再現可能な出力のマスキングルールを設定する必要があります。

シード

シード値は、マスクされた値を生成する開始ポイントです。
データマスキングトランスフォーメーションでは、1~999の範囲の乱数であるデフォルトのシード値が作成されます。別のシード値を入力することもできます。別のソースデータから同じマスクされたデータ値を返すには、カラムに同じシード値を適用します。例えば、4つのテーブルに同じCust_IDカラムがあり、そのすべてで同じマスクを適用した値を出力するとします。このような場合は、4つすべてのカラムを同じシード値に設定できます。
シード値をパラメータとして入力できます。シード値パラメータの名前は$$で始まる必要があります。名前にアンダースコア(_)を含めることはできますが、他の特殊文字を含めることはできません。必要なパラメータと値をパラメータファイルに追加し、実行時にパラメータファイル名を指定します。
注: シード値をパラメータとして入力する場合は、マッピングタスクでマッピングを実行する必要があります。シード値パラメータを含むマッピングを実行すると、パラメータ値を読み取ることができないため、マッピングは誤った値を使用します。

一意の置換

一意の置換マスキングを設定すると、一意のソース値ごとに一意のディクショナリ値が使用されます。
ソース値を一意のディクショナリ値でマスクするには、一意の置換マスキングを設定します。ソース値が特定のディクショナリ値でマスクされている場合、他のソース値はこのディクショナリ値ではマスクされません。
例えば、ソースデータの[名前]カラムにJohnという複数のエントリが含まれているとします。再現可能なマスキングを設定した場合、Johnというすべてのエントリは、Xyzaなどの同じディクショナリ値を取得します。ただし、他のソース値も同じディクショナリ値でマスクされる可能性があります。つまり、Jackというソースエントリで、ディクショナリ値Xyzaが使用されることもあります。その結果、JohnおよびJackというすべてのエントリで同じディクショナリ値が使用されます。一意の置換マスキングを設定した場合、Johnというすべてのソース値でXyzaというディクショナリ値が使用されると、他のソース値では同じディクショナリ値が使用されなくなります。
一意の置換マスキングには、ストレージテーブルに対するストレージ接続が必要です。ストレージテーブルには、一意の置換マスキングに必要なソースからディクショナリへの値のマッピング情報が含まれています。
注: ソースデータにディクショナリよりも多くの一意の値が含まれている場合、すべてのソースデータをマスクするために必要な一意のディクショナリ値が足りないため、マスキングは失敗します。

マスクフォーマット

キーマスキングまたはランダムマスキングを文字列データ型に設定するときは、出力カラムの各文字を、アルファベット、数字、英数字に制限するようにマスク形式を設定します。
マスクフォーマットの定義がない場合、各ソース文字は任意の文字に置き換えられます。マスクフォーマットが入力文字列より長い場合は、マスクフォーマットの余分な文字が無視されます。マスクフォーマットがソース文字列より短い場合は、ソース文字列の最後の部分の文字はマスクされません。
マスク形式を設定するときは、ソースフィルタ文字またはターゲットフィルタ文字を設定し、それによってマスク形式を使用します。
マスク形式には大文字を使用します。マスク文字として小文字を入力すると、データマスキングトランスフォーメーションによって大文字に変換されます。
次の表に、マスク形式文字を示します。
文字
説明
A
英文字。例えば、ASCII文字a~z、A~Zです。
D
数字。0~9。
N
英数字。例えば、ASCII文字a~z、A~Z、および0~9です。
X
任意の文字。たとえば、英文字や記号です。
+
マスキングなし。
R
残りの文字。Rは、文字列内のその他の文字に、任意の種類の文字を使用できることを示します。Rは、マスクの最後の文字にする必要があります。
例えば、部署名の形式が次のとおりであるとします。
nnn-<部署名>
最初の3文字を数値に限定し、部署名を英文字に限定し、ダッシュを出力に残すマスクを設定できます。この場合、マスクフォーマットを以下のように設定します。
DDD+AAAAAAAAAAAAAAAA
Data Maskingトランスフォーメーションによって、最初の3文字が数字に置き換えられます。4番目の文字は置き換えられません。残りの文字は、アルファベットに置き換えられます。

ソースフィルタ文字

キーマスキングまたはランダムマスキングを文字列データ型に設定するときは、ソースフィルタ文字を設定して、マスクする文字を選択します。
ある文字をソースフィルタ文字として設定すると、その文字は、ソースデータに出現するたびにマスクされます。ソース文字列における文字の位置や文字数にかかわらず、設定することができます。ソースフィルタ文字を設定しない場合、マスキングによってカラム内のすべてのソース文字が置き換えられます。
ソースフィルタ文字では、大文字と小文字が区別されます。データマスキングトランスフォーメーションは、ソース文字列の文字数が結果文字列の文字数より少ない場合、一意のデータを返さないことがあります。

ターゲットフィルタ文字

キーマスキングまたはランダムマスキングを文字列データ型に設定するときは、ターゲットフィルタ文字を設定して、ターゲットカラムに表示する文字を制限します。
データマスキングトランスフォーメーションによって、ターゲットの文字はターゲットフィルタ文字で置き換えられます。例えば、各マスクに英文字の大文字をすべて含めるよう設定するには、次の文字を入力します。ABCDEFGHIJKLMNOPQRSTUVWXYZ
異なる入力値に対して同じ出力が生成されないようにするには、設定する置換文字の範囲を広くするか、マスクするソース文字の数を少なくします。文字列内での文字の位置は、重要ではありません。

範囲

数値または日時データの範囲を定義します。 数値または日付値の範囲を定義すると、データマスキングトランスフォーメーションによって、ソースデータが上限値と下限値の範囲内の値でマスクされます。

数値の範囲

数値カラムの上限値と下限値を設定します。上限値は、フィールド精度以下である必要があります。 デフォルトの範囲は、1からフィールド精度長までです。

日付範囲

日付値の上限値と下限値を設定します。上限と下限の各フィールドには、デフォルトの日付の上限と下限が表示されます。 デフォルトの日付形式は、MM/DD/YYYY HH24:MI:SSです。上限の日付は、下限の日付より後である必要があります。

ブラー

ブラーでは、ソースデータ値に対する固定偏差またはパーセント偏差の範囲の出力値が生成されます。元の値に近いランダムな値が返されるようにする場合は、ブラーを設定します。ブラーの対象は、数値および日付値です。
ソース数値のブラー方法として、固定偏差またはパーセント偏差を選択します。下限値は、ソース値より小さい値に関する偏差です。 上限値は、ソース値より大きい値に関する偏差です。 どちらの値もゼロ以上である必要があります。Data Maskingトランスフォーメーションによって返されるマスクされたデータで、数値データは定義した値の範囲内の値に置き換えられます。
ブラーを設定すると、ソース日付に対する偏差で日付をマスクできます。 偏差の適用対象の日付単位を選択します。選択できるのは、年、月、日、時、分、または秒です。 ソース日付単位の上下の偏差を定義するには、上限と下限を入力します。データマスキングトランスフォーメーションは、偏差を適用し、偏差の範囲内の日付を返します。
例えば、マスクされた日付をソース日付の2年以内に制限するには、単位として年を選択します。高低の境界として2を入力します。ソース日付が2006年2月2日の場合、データマスキングトランスフォーメーションは2004年2月2日から2008年2月2日の日付を返します。

データマスキングトランスフォーメーションの接続

マスキング方法でカスタムディクショナリ接続またはストレージ接続を使用するには、データマスキングトランスフォーメーションに接続を追加する必要があります。
カスタムフラットファイルまたはリレーショナルディクショナリを使用できます。また、一意の置換マスキング方法には、ソースからディクショナリ値へのマッピングのためのストレージ接続が必要です。
データマスキングトランスフォーメーションの[マスキングルール]タブに接続を追加します。カラムにマスキング方法を設定する場合は、[マスキングルール]タブで指定したディクショナリとストレージ接続を使用できます。
[マスキングルール]タブには次のような接続フィールドが表示されます。
2022年4月リリース以前に作成されたマッピングをエクスポートした場合、マッピングのデータマスキングトランスフォーメーションにディクショナリとストレージ接続情報が含まれない場合があります。マッピングをインポートすると、フィールドは空白の状態で表示されます。2022年4月リリース以降の環境にマッピングをインポートする場合にこの問題を回避するには、マッピングをエクスポートする前に、マッピングを開いて保存します。エクスポートされたマッピングには、インポート時にディクショナリとストレージ接続情報が表示されます。接続は、[依存関係の表示]ページの[用途]タブにも表示されます。
注: [保存]ボタンを有効にするには、マッピングを変更する必要がある場合があります。