解析トランスフォーメーションの出力フィールド
解析トランスフォーメーションは、解析アセットで指定された出力フィールドを作成します。出力フィールドのタイプと数は、ユーザーが解析アセットで設定する解析操作によって異なります。出力フィールドは、[プロパティ]パネルの[出力フィールド]タブに表示されます。
解析トランスフォーメーションは、次のタイプの出力フィールド(一部またはすべて)を作成できます。
- 解析済みデータフィールド
- アセットで定義されている解析条件を満たすデータ値が含まれます。
- オーバーフローフィールド
解析条件を満たしているものの、対応する出力フィールドが使用できないデータ値が含まれます。値用の適切なすべての出力フィールドがすでに入力されている場合、解析トランスフォーメーションはその値をオーバーフローフィールドに書き込みます。
- 未解析フィールド
- アセットで定義されている解析条件を満たさない値が含まれるフィールドです。
解析トランスフォーメーションの出力フィールドのルールおよびガイドライン
トランスフォーメーションの出力フィールドを確認するときは、次のルールとガイドラインを考慮してください。
- •出力フィールドのタイプと数は、ユーザーが解析アセットで設定する解析操作によって異なります。
- •アセットで正規表現またはディクショナリが指定されている場合は、トランスフォーメーションにより、各正規表現またはディクショナリが正常に解析されたデータ用の1つ以上の出力フィールドが作成されます。
アセットを設定するユーザーが、各正規表現またはディクショナリの操作用の出力フィールド数を決定します。各正規表現またはディクショナリの操作は、アセット設定のステップと呼ばれます。
- •アセットでパターンベースの解析が指定されている場合は、トランスフォーメーションにより、パターンロジックで検出される可能性のある情報のタイプを表す一連の出力フィールドが作成されます。
パターンベースの解析操作では、次の情報のタイプの出力フィールドを生成できます。
- - 名、姓、名前の接頭語、名前の接尾辞などの人名。
- - 性別、正式なあいさつ、略式のあいさつなどの派生情報。
- - 解析操作により入力データ行で識別されたパターンを表すラベル値。Data Qualityユーザーは、ラベルを使用してアセットのパターンロジックを強化できます。
解析されたデータの出力フィールドの数は、アセットロジックにより決定されます。
- •アセットで正規表現またはディクショナリが指定されている場合は、トランスフォーメーションにより、すべてのオーバーフローデータ用の単一のオーバーフローフィールドが作成されることがあります。または、トランスフォーメーションにより、アセットで定義されている正規表現またはディクショナリごとにオーバーフローフィールドが作成されることもあります。ユーザーはアセットプロパティを更新して、オーバーフローフィールドのポリシーを決定できます。
アセットでパターン解析操作が指定されている場合は、トランスフォーメーションにより、単一のオーバーフローフィールドが作成される場合と作成されない場合があります。オーバーフローフィールドの有無は、アセットで入力データに指定されているロケールによって異なります。例えば、アセットでロケールがポルトガルまたはブラジルとして指定されている場合は、解析トランスフォーメーションによりパターン解析操作用のオーバーフローフィールドが作成されます。このロケールはData Qualityユーザーが設定します。
- •アセットで正規表現またはディクショナリが指定されていない場合は、トランスフォーメーションにより、すべての未解析データ用の単一のフィールドが作成されます。
アセットでパターン解析操作が指定されている場合は、トランスフォーメーションにより、未解析データフィールドが作成される場合と作成されない場合があります。パターンベースの解析における未解析データフィールドの有無は、アセットで入力データに指定されているロケールによって異なります。