Enterprise Data Catalog
ここでは、バージョン10.4.0の新しいEnterprise Data Catalog機能について説明します。
カスタム属性のリソースおよびクラスへの割り当て
バージョン10.4.0では、カタログの特定のリソースとクラス、またはすべてのリソースとクラスにカスタム属性を割り当てることができます。カスタム属性を作成または変更をするときに、このタスクを実行できます。
詳細については、『Informatica 10.4.0 Catalog Administrator Guide』を参照してください。
新しいリソース
バージョン10.4.0から、Enterprise Data Catalogに次のリソースが新しく追加されています。
- •AWS Glue
- •Microsoft Power BI
- •Apache Cassandra
- •Snowflake
- •Google Cloud Storage
上記のすべてのリソースからメタデータ、リレーションおよびリネージュ情報を抽出できます。詳細については、『Informatica 10.4.0 Enterprise Data Catalog Scanner Configuration Guide』を参照してください。
参照リソースと参照アセット
バージョン10.4.0では、リソースを設定して、データソースに関するメタデータまたはリソースによって参照されるカタログ内のその他のリソースを抽出できます。例えば、PowerCenterマッピング内のソーステーブルとターゲットテーブル、Tableauレポートからのソーステーブルとファイルなどがあります。これらの参照されるデーターソースは参照リソースと呼ばれ、データソースに含まれるアセットは参照アセットと呼ばれます。Enterprise Data Catalogアプリケーションで参照リソースと参照アセットを表示できます。Enterprise Data Catalogで完全なリネージュを表示するには、参照リソースの接続割り当てを実行できます。参照リソースと、参照リソースデータソースのためにEnterprise Data Catalogで設定したリソースとの間で接続割り当てを実行できます。
次のリソースを設定して、データソースに関するメタデータまたはリソースによって参照されるカタログ内のその他のリソースを抽出できます。
- •PowerCenter
- •AWS Glue
- •Tableau Server
- •Coudera Navigator
- •Apache Atlas
- •Informatica Intelligent Cloud Services
- •Informatica Platform
- •SQL Server統合サービス
詳細については、『Informatica 10.4.0 Catalog Administrator Guide』および『Informatica 10.4.0 Enterprise Data Catalogユーザーガイド』を参照してください。
検索結果からアセットのエクスポート
バージョン10.4.0では、検索結果に表示されるすべてのアセットをカンマ区切り値(CSV)ファイルにエクスポートしたり、このCSVファイルをインポートしてEnterprise Data Catalogに戻したりできます。任意の検索タブで検索結果を絞り込んでからアセットをエクスポートします。
詳細については、『Informatica 10.4.0 Enterprise Data Catalogユーザーガイド』の「アセットタスク」の章を参照してください。
リネージュと影響のフィルタ
バージョン10.4.0では、フィルタを作成して、[リネージュと影響]ビューに適用できます。フィルタを使用して、[リネージュと影響]ビューの結果を絞り込みます。[リネージュと影響]ビューで使用できるアセットタイプに基づいたフィルタオプションのさまざまな組み合わせを使用して、カスタマイズしたフィルタを作成します。
詳細については、『Informatica 10.4.0 Enterprise Data Catalogユーザーガイド』の「リネージュおよび影響の表示」の章を参照してください。
アセット制御のサマリ
バージョン10.4.0では、テーブルおよびファイルアセットタイプの[アセット制御のサマリ]タブで制御フローアセットを表示できます。制御フローは、データのフローに制約または条件を配置します。例えば、SQLクエリのWHERE句に制約を含めたり、マッピングにトランスフォーメーションを含めることができます。
詳細については、『Informatica 10.4.0 Enterprise Data Catalogユーザーガイド』の「リネージュおよび影響の表示」の章を参照してください。
ルールとスコアカード
バージョン10.4.0では、プロファイリングウェアハウスからルールとスコアカードの結果を抽出し、Enterprise Data Catalogでそれらを表示できます。ルールとスコアカードのカラムの結果を表示して、データソースのデータ品質を測定できます。
詳細については、『Informatica 10.4.0 Enterprise Data Catalogユーザーガイド』の「アセットの表示」の章を参照してください。
一意のキー推測
バージョン10.4.0では、ソースデータオブジェクト内のカラムから一意のキー候補を生成できます。一意のキー推測の結果を表示し、重複する値を持つカラムを特定することでデータ品質の問題を理解できます。
推測済みの一意のキー推測の結果を承認または拒否できます。推測済みの一意のキー推測を承認または拒否した後、一意のキー推測をリセットして、推測済みステータスに戻すことができます。
詳細については、『Informatica 10.4.0 Enterprise Data Catalogユーザーガイド』の「アセットの表示」の章を参照してください。
CLOBファイルタイプでのデータドメイン検出
バージョン10.4.0では、CLOBファイルタイプでデータドメイン検出が実行できます。
詳細については、Informatica 10.4.0 Enterprise Catalog管理者ガイドのEnterprise Data Catalogの概念に関する章を参照してください。
Sparkエンジンでのデータ検出とサンプリングオプション
バージョン10.4.0では、Sparkエンジンでプロファイルを実行してデータドメインの検出およびサンプリングオプションの選択ができます。
- Sparkエンジンでのデータドメイン検出
- Sparkエンジンでデータドメイン検出を実行できます。
- Sparkエンジンでのサンプリングオプション
- Sparkエンジンで次のサンプリングオプションを選択してデータドメインを検出できます。
- - [制限n]サンプリングオプションは、データオブジェクト内の行数に基づいてプロファイルを実行します。Hadoop環境でデータドメインの検出を選択した場合、Sparkエンジンはデータオブジェクトの複数パーティションからサンプルを収集し、サンプルサイズを計算するためにそのサンプルを単一ノードにプッシュします。
- - [ランダム割合]サンプリングオプションは、データオブジェクト内の行の割合でプロファイルを実行します。
詳細については、Informatica 10.4.0 Enterprise Catalog管理者ガイドのEnterprise Data Catalogの概念に関する章を参照してください。
テクニカルプレビューの追跡
Enterprise Data Catalogバージョン10.4.0には、テクニカルプレビューで使用できる機能が含まれています。
テクニカルプレビュー機能はサポートされていますが、保証対象外で本番環境には対応していません。非本番環境でのみ使用することをお勧めします。Informaticaでは、本番環境用に次のGAリリースでプレビュー機能を導入するつもりですが、市場や技術的な状況の変化に応じて導入しない場合もあります。詳細については、Informaticaグローバルカスタマサポートにお問い合わせください。
- •バージョン10.4.0では、[リネージュと影響]ビューのコンパクトなビューを表示することを選択できます。コンパクトな[リネージュと影響]ビューは、リソースレベルで概要を示すリネージュと影響の図が表示されます。
詳細については、『Informatica 10.4.0 Enterprise Data Catalogユーザーガイド』の「リネージュおよび影響の表示」の章を参照してください。
- •バージョン10.4.0では、SAP Business Warehouse、SAP BW/4HANA、IBM InfoSphere DataStage、およびOracle Data Integratorのソースが実行時にアクセスできない、またはオフラインのときに、それらからメタデータを抽出できます。
詳細については、『Informatica 10.4.0 Catalog Administratorガイド』を参照してください。
- •バージョン10.4.0では、SAP Business WarehouseおよびSAP BW/4HANAデータソースからメタデータを抽出できます。
詳細については、『Informatica 10.4.0 Enterprise Data Catalog Scanner Configuration Guide』を参照してください。
データプレビューおよびプロビジョニング
バージョン10.4.0では、カタログ内でのデータ検出完了後にデータプロビジョニングを実行できるようになりました。データプロビジョニングにより、ターゲットにデータを移動して、さらに分析できます。ターゲットに移動する前に、リレーショナルソースのデータをプレビューして、データにアクセスできます。
データのプレビューとプロビジョニングの詳細については、『Informatica 10.4.0 Catalog Administratorガイド』および『Informatica 10.4.0 Enterprise Data Catalogユーザーガイド』を参照してください。
スタンドアロンスキャナユーティリティでサポートされるリソースのタイプ
バージョン10.4では、次の外部ソースに実行時にアクセスできない場合やオフラインの場合に、その外部ソースからメタデータを抽出できます。
- •Amazon Redshift
- •Amazon S3
- •Apache Cassandra
- •Axon
- •Azure Data Lake Store
- •Azure Microsoft SQLデータウェアハウス
- •Azure Microsoft SQL Server
- •Business Glossary
- •カスタムリネージュ
- •データベーススクリプト
- •Erwin
- •Glue
- •Google BigQuery
- •Google Cloud Storage
- •Informatica Cloudサービス
- •IBM Cognos
- •Microsoft Azure Blobストレージ
- •Microsoft SQL Server統合サービス
- •PowerBI
- •QlikView Business Intelligence
- •Salesforce
- •SAP HANA
- •SAP PowerDesigner
- •Snowflake
- •Workday
詳細については、『Informatica 10.4 Enterprise Data Catalog管理者ガイド』の「オフラインおよびアクセスできないリソースからのメタデータの抽出」の章を参照してください。
REST API
バージョン10.4では、次のInformatica Enterprise Data Catalog REST APIを使用できるようになりました。
- •データプロビジョニングREST API。既存のREST APIに加えて、データプロビジョニングをユーザーが使用できるかどうかの表示とデータプロビジョニングをサポートするリソースの一覧表示ができます。
- •リネージュフィルタREST API。リネージュフィルタの作成、更新、一覧表示、削除ができます。
- •モデル情報REST API。既存のREST APIに加えて、定義済みスライダファセット、スライダファセット定義、リネージュフィルタ定義の一覧表示ができます。
- •モデル変更REST API。既存のREST APIに加えて、スライダファセット定義の作成、更新、削除ができます。
- •監視情報REST API。オブジェクトエクスポートタイプ、オブジェクトインポートタイプ、リソースエクスポートタイプ、検索エクスポートタイプなどのジョブを送信または一覧表示できます。
- •オブジェクトの子カウントREST API。オブジェクトの子アセットの合計数を一覧表示できます。
- •製品情報REST API。リリースバージョン、ビルドバージョン、およびビルドした日付などのEnterprise Data Catalogに関する詳細を一覧表示できます。
REST APIの詳細については、『Informatica 10.4 . Enterprise Data Catalog REST APIリファレンス』を参照してください。