Enterprise Information Catalog
ここでは、10.2の新しいEnterprise Information Catalog機能について説明します。
新しいデータソース
バージョン10.2では、Informatica Enterprise Information Catalogは、新しいデータソースからメタデータを抽出することができます。
Informatica Catalog Administratorにリソースを作成して、次のデータソースからメタデータを抽出することができます。
- Apache Atlas
- Hadoopのメタデータフレームワーク。
- Azure Microsoft SQLデータウェアハウス
- 大量のデータを処理するクラウドベースのリレーショナルデータベース。
- Azure Microsoft SQL Server
- 管理されたクラウドデータベース。
- Azure WASBファイルシステム
- Azure blobにデータを読み込むためのWindows Azure Storage Blobインターフェイス。
- Erwin
- データモデリングツール。
- Informatica Axon
- エンタープライズデータガバナンスソリューション。
新しいリソースの詳細については、『Informatica Catalog Administratorガイド10.2』を参照してください。
カスタムスキャナフレームワーク
バージョン10.2では、カスタムメタデータをカタログに取り込むことができます。
カスタムメタデータは、ユーザーが定義するメタデータです。カスタムモデルを定義し、カスタムリソースタイプを作成し、カスタムデータソースからカスタムメタデータを取り込むためのカスタムリソースを作成できます。カスタムメタデータ統合を使用して、Enterprise Information Catalogがモデルを提供しないカスタムデータソースからメタデータを抽出および取り込むことができます。
カスタムメタデータ統合の詳細については、『Informatica Enterprise Information Catalog 10.2カスタムメタデータ統合ガイド』を参照してください。
REST API
バージョン10.2では、Informatica Enterprise Information Catalog REST APIを使用して、データソースに関連付けられたオブジェクトおよびモデルに関連する機能にアクセスし、設定することができます。
REST APIを使用すると、データソースに関連付けられたオブジェクトやモデルに関連する情報を取得できます。また、属性、関連付け、クラスなどのモデルやオブジェクトに関連するエンティティを作成、更新、または削除することもできます。
非構造化ファイルソースの詳細については、『Informatica Enterprise Information Catalog 10.2 REST APIリファレンス』を参照してください。
複合データドメイン
バージョン10.2では、複合データドメインを作成できます。複合データドメインは、ルールを使用してリンクできるデータドメインまたはその他の複合データドメインのコレクションです。複合データドメインを使用して、データソース内の複数のスキーマにまたがるエンティティの必要な詳細を検索できます。
カタログ管理者のリソースに対して複合データドメイン検出を作成して有効にすると、[アセットの詳細]ビューに表形式アセットの複合データドメインを表示できます。複合データドメインを検索し、[アセットの詳細]ビューで複合データドメインのビューの詳細を表示することもできます。
複合データドメインの詳細については、『Informatica Enterprise Information Catalog 10.2ユーザーガイド』の「アセットの表示」を参照し、『Informatica Catalog Administratorガイド10.2』の「Catalog Administratorの概念」および「複合データドメインの管理」の章を参照してください。
データドメイン
ここでは、Enterprise Information Catalogのデータドメインに関連する新機能について説明します。
データドメインを定義します。
バージョン10.2では、データドメインを作成するときに次の追加オプションを設定できます。
- •参照テーブル、ルール、および正規表現を使用して、データルールまたはカラムルールを作成します。
- •データドメイン一致の最小一致率または適合する行の最小数を使用します。
- •自動承諾オプションを使用して、データドメイン一致が設定された自動承諾の割合を超えたときに、Enterprise Information Catalog内のデータドメインを自動的に受け入れます。
カタログ管理者のデータドメインの詳細については、『Informatica Catalog Administratorガイド10.2』の「データドメインの管理」の章を参照してください。
データドメインの設定
バージョン10.2では、リソースを作成または編集するときに、定義済みの値を使用したり、データドメイン一致の適合値を入力したりできます。
データドメインとリソースの詳細については、『Informatica Catalog Administratorガイド10.2』の「リソースの管理」の章を参照してください。
データドメインの特権
バージョン10.2では、Informatica Administratorに、ドメイン管理: 管理 - ビュードメインおよびDomaingroupおよびドメイン管理: 管理 - ドメインとDomaingroupの編集権限を設定して、カタログ管理者のデータドメインまたはデータドメイングループを表示、作成、編集、または削除します。
特権の詳細については、『Enterprise Information Catalog 10.2用Informatica Administratorリファレンス』の「特権およびロール」の章を参照してください。
データドメインキュレーション
バージョン10.2では、データドメインの一致率がカタログ管理者の設定された自動承諾の割合を超えた場合、Enterprise Information Catalogはデータドメインを自動的に受け入れます。
データドメインキュレーションの詳細については、『Informatica Enterprise Information Catalog 10.2ユーザーガイド』の「アセットの表示」の章を参照してください。
カスタム属性のエクスポートとインポート
バージョン10.2では、リソースで設定されたカスタム属性をCSVファイルにエクスポートし、そのCSVファイルをEnterprise Information Catalogにインポートすることができます。エクスポートしたCSVファイルを使用して、複数のアセットにカスタム属性値を同時に割り当てることができます。
カスタム属性のエクスポートとインポートの詳細については、『Informatica Enterprise Information Catalog 10.2ユーザーガイド』の「アセットの表示」の章を参照してください。
カスタム属性値としてのリッチテキスト
バージョン10.2では、カスタム属性を編集して、複数のリッチテキスト文字列を属性値として割り当てることができます。
アセットへのカスタム属性値の割り当ての詳細については、『Informatica Enterprise Information Catalog 10.2 User Guide』の「アセットの表示」を参照してください。
トランスフォーメーションロジック
バージョン10.2では、[リネージュおよび影響]ビューでアセットのトランスフォーメーションロジックを表示できます。[リネージュおよび影響]ビューには、トランスフォーメーションを含むアセットのトランスフォーメーションロジックが表示されます。トランスフォーメーションビューには、テーブルやカラムなどのデータ構造のトランスフォーメーションロジックが表示されます。ビューには、フィルタ、ジョイナ、ルックアップ、式、ソータ、共有体、集計など、さまざまなタイプのトランスフォーメーションも表示されます。
トランスフォーメーションロジックの詳細については、『Informatica Enterprise Information Catalog 10.2ユーザーガイド』の「リネージュおよび影響の表示」の章を参照してください。
非構造化ファイルタイプ
バージョン10.2では、データソース内のすべての行に対して非構造化ファイルタイプおよび拡張非構造化形式でデータドメイン検出プロファイルまたはカラムプロファイルおよびデータドメイン検出プロファイルを実行できます。非構造化ファイルタイプには、圧縮ファイル、電子メール形式、Webページファイル、Microsoft Excel、Microsoft PowerPoint、Microsoft Word、およびPDFが含まれます。拡張非構造化形式には、mp3、mp4、bmp、およびjpgが含まれます。
非構造化ファイルタイプの詳細については、『Informatica Catalog Administratorガイド10.2』の「リソースの管理」の章を参照してください。
値の頻度
値の頻度の設定および表示
バージョン10.2では、データソースの値の頻度を計算するために、Catalog Administratorのカラムデータの類似性とともに値の頻度を有効にすることができます。Catalog Administratorのデータソースで値の頻度を実行した後に、[アセットの詳細]ビューのビューカラム、テーブルカラム、CSVフィールド、XMLファイルフィールド、およびJSONファイルデータのアセットの値の頻度を表示できます。
値の頻度の設定の詳細については、『Informatica Catalog Administratorガイド10.2』の「Catalog Administratorの概念」の章を参照してください。データアセットの値の頻度を表示するには、『Informatica Enterprise Information Catalog 10.2 User Guide』の「アセットの表示」の章を参照してください。
Enterprise Information Catalogの値の頻度を表示する特権
バージョン10.2では、データアセットの値の頻度を表示するために次の権限と特権が必要です。
- •データアセットの読み取り権限。
- •データ権限: データの表示特権。
- •データ権限: 機密性の高いデータの表示特権。
権限と特権の詳細については、『Enterprise Information Catalog 10.2用Informatica Administratorリファレンス』の「権限の概要」および「特権およびロールの概要」の章を参照してください。
Azure HDInsightのデプロイメントサポート
バージョン10.2では、Azure HDInsight HadoopディストリビューションにEnterprise Information Catalogをデプロイできます。
詳細については、『Informatica Enterprise Information Catalog 10.2インストール&環境設定ガイド』の「アプリケーションサービスの作成」の章を参照してください。