Enterprise Data Catalog
In diesem Abschnitt werden die neuen Funktionen von Enterprise Data Catalog in Version 10.4.0 beschrieben.
Zuweisen von benutzerdefinierten Attributen zu Ressourcen und Klassen
Ab Version 10.4.0 können Sie benutzerdefinierte Attribute zu bestimmten Ressourcen und Klassen im Katalog oder zu allen Ressourcen und Klassen im Katalog hinzufügen. Sie können diese Aufgabe ausführen, wenn Sie ein benutzerdefiniertes Attribut erstellen oder ändern.
Weitere Informationen finden Sie im Informatica 10.4.0 Catalog Administrator-Handbuch.
Neue Ressourcen
Ab Version 10.4.0 stehen in Enterprise Data Catalog die folgenden neuen Ressourcen zur Verfügung:
- •AWS Glue
- •Microsoft Power BI
- •Apache Cassandra
- •Snowflake
- •Google Cloud Storage
Aus allen obigen Ressourcen können Sie Metadaten-, Beziehungs- und Herkunftsinformationen extrahieren. Weitere Informationen finden Sie im Konfigurationshandbuch zu Informatica 10.4.0 Enterprise Data Catalog Scanner.
Referenzressourcen und Referenzobjekte
Ab Version 10.4.0 können Sie Ressourcen konfigurieren, um Metadaten über Datenquellen oder andere Ressourcen im Katalog zu extrahieren, der von der Ressource referenziert wird. Beispiele sind Quell- und Zieltabellen in PowerCenter-Zuordnungen oder Quelltabellen und ‑Dateien aus Tableau-Berichten. Diese referenzierten Datenquellen werden als Referenzressourcen bezeichnet, und die in den Datenquellen enthaltenen Objekte werden als Referenzobjekte bezeichnet. Sie können die Referenzressourcen und Referenzobjekte in Enterprise Data Catalog-Anwendungen anzeigen. Um die vollständige Herkunft in Enterprise Data Catalog anzuzeigen, können Sie Verbindungszuordnungen für die Referenzressourcen durchführen. Sie können Verbindungszuordnungen zwischen Referenzressourcen und den Ressourcen, die Sie in Enterprise Data Catalog konfigurieren, für die Datenquellen der Referenzressourcen durchführen.
Sie können die folgenden Ressourcen konfigurieren, um Metadaten über Datenquellen oder andere Ressourcen im Katalog zu extrahieren, der von der Ressource referenziert wird:
- •PowerCenter
- •AWS Glue
- •Tableau Server
- •Coudera Navigator
- •Apache Atlas
- •Informatica Intelligent Cloud Services
- •Informatica Platform
- •SQL Server Integration Service
Weitere Informationen finden Sie im Informatica 10.4.0 Catalog-Administratorhandbuch und im Informatica 10.4.0 Enterprise Data Catalog-Benutzerhandbuch.
Objekte aus Suchergebnissen exportieren
Ab Version 10.4.0 können Sie alle Objekte, die in den Suchergebnissen angezeigt werden, in die CSV-Datei (Datei mit kommagetrennten Werten) exportieren und die CSV-Datei zurück in Enterprise Data Catalog importieren. Exportieren Sie Objekte, nachdem Sie die Suchergebnisse auf einer beliebigen Suchregisterkarte optimiert haben.
Weitere Informationen finden Sie im Kapitel Objektaufgaben im Informatica 10.4.0 Enterprise Data Catalog-Benutzerhandbuch.
Herkunfts- und Auswirkungsfilter
Ab Version 10.4.0 können Sie Filter für die Ansicht „Herkunft und Auswirkung“ erstellen. Verwenden Sie Filter, um die Ergebnisse in der Ansicht „Herkunft und Auswirkung“ einzuschränken. Erstellen Sie benutzerdefinierte Filter mit verschiedenen Kombinationen von Filteroptionen, gestützt auf die verfügbaren Objekttypen in der Ansicht „Herkunft und Auswirkung“.
Weitere Informationen finden Sie im Kapitel Anzeigen von Herkunft und Auswirkung im Informatica 10.4.0 Enterprise Data Catalog-Benutzerhandbuch.
Übersicht über Objektsteuerung
Ab Version 10.4.0 können Sie Ablaufsteuerungsobjekte auf der Registerkarte Übersicht über Objektsteuerung für Tabellen- und Dateiobjekttypen anzeigen. Eine Ablaufsteuerung wendet Einschränkungen oder Bedingungen auf den Datenablauf an. Beispielsweise kann eine SQL-Abfrage Einschränkungen in der WHERE-Klausel enthalten, oder Zuordnungen können Umwandlungen enthalten.
Weitere Informationen finden Sie im Kapitel Anzeigen von Herkunft und Auswirkung im Informatica 10.4.0 Enterprise Data Catalog-Benutzerhandbuch.
Regeln und Scorecards
Ab Version 10.4.0 können Sie Regeln und Scorecard-Ergebnisse aus dem Profiling Warehouse extrahieren und sie im Enterprise Data Catalog anzeigen. Sie können die Spaltenergebnisse für eine Regel und Scorecard anzeigen, um die Datenqualität der Datenquelle zu messen.
Weitere Informationen finden Sie im Kapitel Anzeigen von Objekten im Informatica 10.4.0 Enterprise Data Catalog-Benutzerhandbuch.
Eindeutige Schlüsselableitung
Ab Version 10.4.0 können Sie Kandidaten für eindeutige Schlüssel aus den Spalten im Datenquellenobjekt generieren. Sie können die Ableitungsergebnisse für eindeutige Schlüssel anzeigen, um Datenqualitätsprobleme zu verstehen, indem Sie die Spalten identifizieren, die doppelte Werte aufweisen.
Sie können die Ableitungsergebnisse für eindeutige Schlüssel akzeptieren oder ablehnen. Nachdem Sie die Ableitung für eindeutige Schlüssel akzeptiert oder abgelehnt haben, können Sie die Ableitung des eindeutigen Schlüssels zurücksetzen, um den abgeleiteten Status wiederherzustellen.
Weitere Informationen finden Sie im Kapitel Anzeigen von Objekten im Informatica 10.4.0 Enterprise Data Catalog-Benutzerhandbuch.
Datendomänenerkennung für den CLOB-Dateityp
Ab Version 10.4.0 können Sie die Datendomänenerkennung für den CLOB-Dateityp durchführen.
Weitere Informationen finden Sie im Kapitel Enterprise Data Catalog-Konzepte im Informatica 10.4.0 Enterprise Data Catalog-Administratorhandbuch.
Data Discovery und Stichprobenoptionen auf der Spark-Engine
Ab Version 10.4.0 können Sie Profile zum Erkennen von Datendomänen ausführen und Stichprobenoptionen für die Spark-Engine wählen.
- Datendomänenerkennung auf der Spark-Engine
- Sie können die Datendomänenerkennung auf der Spark-Engine durchführen.
- Stichprobenoptionen auf der Spark-Engine
- Sie können die folgenden Stichprobenoptionen wählen, um Datendomänen auf der Spark-Engine zu erkennen:
- - Mit der Stichprobenoption Limit n wird ein Profil basierend auf der Anzahl der Zeilen im Datenobjekt ausgeführt. Wenn Sie Datendomänen in der Hadoop-Umgebung erkennen möchten, sammelt die Spark-Engine Stichproben aus mehreren Partitionen des Datenobjekts und überträgt die Stichproben an einen einzelnen Knoten, um die Stichprobengröße zu berechnen.
- - Mit der Stichprobenoption Random percentage wird ein Profil basierend auf dem Prozentsatz der Zeilen im Datenobjekt ausgeführt.
Weitere Informationen finden Sie im Kapitel Enterprise Data Catalog-Konzepte im Informatica 10.4.0 Enterprise Data Catalog-Administratorhandbuch.
Nachverfolgen der technischen Vorschau
Enterprise Data Catalog Version 10.4.0 enthält Funktionen, die für die technische Vorschau zur Verfügung stehen.
Funktionen für die technische Vorschau sind noch nicht produktionsreif und werden daher zwar unterstützt, aber nicht garantiert. Informatica empfiehlt, diese Funktionen nur außerhalb von Produktionsumgebungen einzusetzen. Informatica beabsichtigt, die Vorschaufunktionen in kommenden GA-Versionen für die Produktion bereitzustellen. Ob dies aber tatsächlich geschieht, hängt von verschiedenen marktbezogenen oder technischen Faktoren ab. Weitere Informationen erhalten Sie beim globalen Kundensupport von Informatica.
- •Ab Version 10.4.0 können Sie die kompakte Ansicht „Herkunft und Auswirkung“ anzeigen. Die kompakte Ansicht „Herkunft und Auswirkung“ zeigt das Herkunfts- und Auswirkungsdiagramm zusammengefasst auf Ressourcenebene an.
Weitere Informationen finden Sie im Kapitel Anzeigen von Herkunft und Auswirkung im Informatica 10.4.0 Enterprise Data Catalog-Benutzerhandbuch.
- •Ab Version 10.4.0 können Sie Metadaten aus SAP Business Warehouse-, SAP BW/4HANA-, IBM InfoSphere DataStage- und Oracle Data Integrator-Quellen extrahieren, wenn diese zur Laufzeit nicht erreichbar oder offline sind.
Weitere Informationen finden Sie im Informatica 10.4.0 Catalog Administrator-Handbuch.
- •Ab Version 10.4.0 können Sie Metadaten aus den SAP Business Warehouse- und SAP BW/4HANA-Datenquellen extrahieren.
Weitere Informationen finden Sie im Konfigurationshandbuch zu Informatica 10.4.0 Enterprise Data Catalog Scanner.
Datenvorschau und Bereitstellung
Ab Version 10.4.0 können Sie die Datenbereitstellung durchführen, nachdem Sie die Datenerkennung im Katalog abgeschlossen haben. Die Datenbereitstellung hilft Ihnen dabei, Daten zur weiteren Analyse in ein Ziel zu verschieben. Sie können eine Datenvorschau für relationale Quellen anzeigen, um die Daten zu bewerten, bevor Sie sie an das Ziel verschieben.
Weitere Informationen zur Datenvorschau und zur Bereitstellung von Daten finden Sie im Informatica 10.4.0 Catalog-Administratorhandbuch und im Informatica 10.4.0 Enterprise Data Catalog-Benutzerhandbuch.
Unterstützte Ressourcentypen für das Standalone Scanner Utility
Ab Version 10.4 können Sie Metadaten aus den folgenden externen Quellen extrahieren, wenn zur Laufzeit nicht auf sie zugegriffen werden kann oder sie offline sind:
- •Amazon Redshift
- •Amazon S3
- •Apache Cassandra
- •Axon
- •Azure Data Lake Store
- •Azure Microsoft SQL Data Warehouse
- •Azure Microsoft SQL Server
- •Business Glossary
- •Benutzerdefinierte Herkunft
- •Datenbankskripts
- •Erwin
- •Glue
- •Google BigQuery
- •Google Cloud Storage
- •Informatica Cloud Service
- •IBM Cognos
- •Microsoft Azure Blob Storage
- •Microsoft SQL Server Integration Services
- •PowerBI
- •QlikView Business Intelligence
- •Salesforce
- •SAP HANA
- •SAP PowerDesigner
- •SnowFlake
- •Workday
Weitere Informationen finden Sie im Kapitel „Metadaten-Extraktion aus Offline- und nicht zugreifbaren Ressourcen“ im Administratorhandbuch zu Informatica 10.4 Enterprise Data Catalog.
REST-APIs
Ab Version 10.4 können Sie die folgenden Informatica Enterprise Data Catalog REST-APIs verwenden:
- •Datenbereitstellungs-REST-APIs. Zusätzlich zu den vorhandenen REST-APIs können Sie anzeigen, ob die Datenbereitstellung für den Benutzer verfügbar ist, und die Ressourcen auflisten, die die Datenbereitstellung unterstützen.
- •Herkunftsfilter-REST-APIs. Sie können einen Herkunftsfilter erstellen, aktualisieren, auflisten oder löschen.
- •Modellinformations-REST-APIs. Zusätzlich zu den vorhandenen REST-APIs können Sie die vordefinierten Schieberegler-Facets, Schieberegler-Facet-Definitionen und Herkunftsfilterdefinitionen auflisten.
- •REST-API für Modelländerungen Zusätzlich zu den vorhandenen REST-APIs können Sie eine Schieberegler-Facet-Definition erstellen, aktualisieren und löschen.
- •Überwachungsinformations-REST-APIs. Sie können Jobs senden oder auflisten; dazu zählen Jobs vom Objektexporttyp, Objektimporttyp, Ressourcenexporttyp und Suchexporttyp.
- •REST-API zur Zählung von untergeordneten Objekten. Sie können die Gesamtzahl der untergeordneten Elemente für ein Objekt auflisten.
- •Produktinformations-REST-APIs. Sie können die Details zu Enterprise Data Catalog auflisten, darunter die Release-Version, die Build-Version und das Build-Datum.
Weitere Informationen zu den REST-APIs finden Sie im Informatica 10.4 Enterprise Data Catalog REST-API-Benutzerhandbuch.