データプロファイリング
データプロファイリングを使用して、データプロファイリングタスクを作成および実行します。データプロファイリングでは、データプロファイリングタスクはプロファイルとも呼ばれます。
ソースオブジェクトでプロファイルを実行すると、結果には次のカラム統計が含まれます。
- •個別、重複あり、およびNULL値の数
- •個別、重複あり、およびNULL値の割合
- •文書化されたデータ型および推測されたデータ型
- •パターン数
- •上位のパターンの割合
- •値の最大長と最小長
- •最大値と最小値
- •数値データ型の平均、合計、および標準偏差
- •値の頻度
- •異常値
リレーショナルデータソースおよびフラットファイルデータソースでデータプロファイリングタスクを実行できます。
[マイサービス]ページからデータプロファイリングを選択すると、次の図に示す[エクスプローラ]ページが表示されます。
データプロファイリングのナビゲーションバーから、次のページにアクセスできます。
- •新規。データプロファイリングタスクを作成します。
- •エクスプローラ。プロジェクト、アセット、フォルダを作成および管理します。
- •マイジョブ。データプロファイリングジョブと例外ジョブのステータスを表示します。
- •マイインポート/エクスポートログ。インポートとエクスポートのステータスを表示します。
注: プロファイリングタスクと例外タスクは、Data Qualityの[参照]ページから開くことができます。