Handbuch für Informatica-Anwendungsdienst > Katalogdienst > Erstellen eines Katalogdiensts
  

Erstellen eines Katalogdiensts

Erstellen Sie einen Katalogdienst, um die Enterprise Data Catalog-Anwendung auszuführen und die Verbindungen zwischen Enterprise Data Catalog-Komponenten zu verwalten. Sie können die allgemeinen Eigenschaften des Katalogdiensts sowie dessen Eigenschaften für den Anwendungsdienst und für die Sicherheit konfigurieren.
Wenn Sie Enterprise Data Catalog auf mehreren Knoten bereitstellen möchten, stellen Sie sicher, dass Sie den Informatica-Clusterdienst und den Katalogdienst auf separaten Knoten konfigurieren.
HINWEIS: Der Katalogdienst weist dieselben Berechtigungen auf wie das Benutzerkonto, mit dem er erstellt wird. Stellen Sie sicher, dass das Benutzerkonto nicht über Berechtigungen zum Lesen oder Ändern vertraulicher Dateien auf dem System verfügt.
    1Wählen Sie im Administrator Tool eine Domäne aus, und klicken Sie auf die Registerkarte Dienste und Knoten.
    2Klicken Sie im Menü "Aktionen" auf Neu > Katalogdienst.
    Das Dialogfeld Neuer Katalogdienst – Schritt 1 von 4 wird geöffnet.
    3Konfigurieren Sie die allgemeinen Eigenschaften im Dialogfeld.
    In der folgenden Tabelle werden die Eigenschaften beschrieben:
    Eigenschaft
    Beschreibung
    Name
    Name des Diensts. Der Name unterliegt nicht der Groß- und Kleinschreibung und muss innerhalb der Domäne eindeutig sein. Der Name darf maximal 128 Zeichen umfassen und nicht mit @ beginnen. Der Name darf keine Leerzeichen enthalten. Die Zeichen im Namen müssen mit der Codepage des Modellrepositorys kompatibel sein, das Sie mit dem Katalogdienst verknüpfen.
    Der Name darf folgende Zeichen nicht enthalten:
    ` ~ % ^ * + = { } \ ; : ' " / ? . , < > | ! ( ) ] [
    Beschreibung
    Beschreibung des Diensts. Die Beschreibung darf nicht mehr als 765 Zeichen enthalten.
    Speicherort
    Domäne, in der der Dienst ausgeführt wird.
    Lizenz
    Lizenz für die Zuweisung zum Katalogdienst. Wählen Sie die mit Informatica installierte Lizenz aus.
    Knoten
    Knoten in der Informatica-Domäne, auf dem der Katalogdienst ausgeführt wird. Wenn Sie den Knoten ändern, müssen Sie den Katalogdienst deaktivieren und erneut aktivieren.
    Backup-Knoten
    Wenn die Lizenz hohe Verfügbarkeit einschließt, sind dies die Knoten, auf denen der Dienst ausgeführt werden kann, wenn der primäre Knoten nicht verfügbar ist.
    4Klicken Sie auf Weiter.
    Das Dialogfeld Neuer Katalogdienst – Schritt 2 von 4 wird geöffnet.
    5 Konfigurieren Sie die Eigenschaften des Anwendungsdiensts im Dialogfeld.
    In der folgenden Tabelle werden die Eigenschaften beschrieben:
    Eigenschaft
    Beschreibung
    Modellrepository-Dienst
    Modellrepository-Dienst für die Zuordnung zum Katalogdienst. Der Modellrepository-Dienst verwaltet das von Enterprise Data Catalog verwendete Modellrepository. Wenn Sie die Eigenschaft aktualisieren, um einen anderen Modellrepository-Dienst anzugeben, müssen Sie den Katalogdienst deaktivieren und erneut aktivieren.
    Benutzername
    Der Datenbankbenutzername für das Modellrepository.
    Passwort
    Eine verschlüsselte Version des Datenbankpassworts für das Modellrepository.
    Sicherheitsdomäne
    Name der Sicherheitsdomäne, die den Benutzernamen enthält.
    6Klicken Sie auf Weiter.
    Das Dialogfeld Neuer Katalogdienst – Schritt 3 von 4 wird geöffnet.
    7 Konfigurieren Sie die Sicherheitseigenschaften im Dialogfeld.
    In der folgenden Tabelle werden die Eigenschaften beschrieben:
    Eigenschaft
    Beschreibung
    HTTP-Port
    Eine eindeutige HTTP-Portnummer, die für jeden Datenintegrationsdienst-Prozess verwendet wird. Der Standard ist 8085.
    TLS (Transport Layer Security) aktivieren
    Gibt an, dass der Katalogdienst HTTPS verwenden muss. Wenn Sie den Datenintegrationsdienst nicht für die Verwendung von HTTPS konfiguriert haben, wird der Katalogdienst nicht gestartet.
    HTTPS-Port
    Portnummer für die HTTPS-Verbindung.
    Schlüsselspeicherdatei
    Pfad und Dateiname der Schlüsselspeicherdatei. Die Schlüsselspeicherdatei enthält die Schlüssel und Zertifikate, die bei Verwendung des SSL-Sicherheitsprotokolls mit Catalog Administrator erforderlich sind. Erforderlich, wenn Sie die Option TLS (Transport Layer Security) aktivieren auswählen.
    Wenn Enterprise Data Catalog den Katalogdienst erstellt, exportiert es den Schlüsselspeicher in ein Zertifikat und speichert das Zertifikat im Schlüsselspeicherverzeichnis. Stellen Sie sicher, dass Sie die Lese-und Schreibberechtigungen für das Verzeichnis für Enterprise Data Catalog so konfigurieren, dass das Zertifikat erfolgreich gespeichert wird.
    Schlüsselspeicherpasswort
    Passwort für die Schlüsselspeicherdatei. Erforderlich, wenn Sie die Option TLS (Transport Layer Security) aktivieren auswählen.
    SSL-Protokoll
    Zu verwendendes Secure Sockets Layer-Protokoll.
    8Klicken Sie auf Weiter.
    Das Dialogfeld Neuer Katalogdienst – Schritt 4 von 4 wird geöffnet.
    9 Konfigurieren Sie die Hadoop-Clustereigenschaften im Dialogfeld.
    In der folgenden Tabelle werden die Eigenschaften beschrieben:
    Eigenschaft
    Beschreibung
    Cluster-Typ
    Wählen Sie eine der folgenden Optionen aus, um den Bereitstellungstyp für Enterprise Data Catalog anzugeben:
    • - Externer Cluster. Bereitstellung von Enterprise Data Catalog in einem externen Hadoop-Cluster auf Hortonworks, ClouderaManager oder Azure HDInsight.
    • - Interner Cluster. Bereitstellung von Enterprise Data Catalog im eingebetteten Hadoop-Cluster auf Hortonworks.
    Hadoop-Verteilung
    Anwendbar, wenn Sie die Option Externer Cluster als Clustertyp auswählen. Wählen Sie eine der folgenden Optionen aus, um die Hadoop-Verteilung anzugeben:
    • - ClouderaManager. Verwenden Sie diese Option, wenn Sie eine ClouderaManager-Hadoop-Verteilung verwenden möchten.
    • - Hortonworks. Verwenden Sie diese Option, wenn Sie eine Hortonworks-Hadoop-Verteilung verwenden möchten.
    • HINWEIS: Wenn Sie ClouderaManager oder Hortonworks als Hadoop-Verteilung auswählen, erkennt Enterprise Data Catalog automatisch die folgenden Eigenschaften für den Hadoop-Verteilungstyp:
      • - ZooKeeper-Cluster-URI
      • - HDFS-NameNode-URI
      • - URI des Yarn-Ressourcenmanagers
      • - HTTPS- oder HTTP-URI des Yarn-Ressourcenmanagers
      • - HTTP-URI des Verlaufsservers
      • - Name des HDFS-Diensts für hohe Verfügbarkeit
      • - URI des Yarn-Ressourcenmanager-Schedulers
    • - HDInsight. Verwenden Sie diese Option, wenn Sie eine Azure HDInsight-Hadoop-Verteilung verwenden möchten.
    • - Andere. Verwenden Sie diese Option, wenn Sie alle Eigenschaften für eine ClouderaManager-, Hortonworks- oder Azure HDInsight-Hadoop-Verteilung manuell angeben möchten. Konfigurieren Sie die folgenden benutzerdefinierten Optionen für den Katalogdienst:
      • - LdmCustomOptions.yarn-site.yarn.application.classpath
      • - LdmCustomOptions.yarn-site.yarn.nodemanager.webapp.address
      • - LdmCustomOptions.yarn-site.yarn.nodemanager.webapp.https.address
    • - Wenn Sie ClouderaManager oder Hortonworks auswählen, müssen Sie die folgenden Eigenschaften mit den anderen erforderlichen Eigenschaften konfigurieren:
      • - Cluster-URL. Die Cluster-URL für den Zugriff auf die ausgewählte Hadoop-Verteilung.
      • - Cluster-URL-Benutzername. Der Benutzername für den Zugriff auf die Cluster-URL.
      • - Cluster-URL-Passwort. Das dem Cluster-URL-Benutzernamen zugeordnete Passwort.
    ZooKeeper-Cluster-URI
    Gilt für externe Cluster. Mehrere ZooKeeper-Adressen in einer durch Kommas getrennten Liste.
    HDFS-NameNode-URI
    Gilt für externe Cluster. Der URI für den Zugriff auf HDFS.
    Verwenden Sie das folgende Format, um den NameNode-URI in der Cloudera-Verteilung anzugeben: <Hostname>:<Port>
    Wobei
    • - <Hostname> der Hostname bzw. die IP-Adresse von NameNode ist.
    • - <Portnummer> die Nummer des Ports ist, den der NameNode auf Remoteprozedurabrufe (RPC) abhört.
    URI des Yarn-Ressourcenmanagers
    Gilt für externe Cluster. Der Dienst innerhalb von Hadoop, der die MapReduce-Aufgaben an bestimmte Knoten im Cluster sendet.
    Verwenden Sie das folgende Format:<Hostname>:<Port>
    Wobei
    • - <Hostname> der Hostname bzw. die IP-Adresse des Yarn-Ressourcenmanagers ist.
    • - <Portnummer> die Nummer des Ports ist, den der Yarn-Ressourcenmanager auf Remoteprozeduraufrufe (RPC) abhört.
    HTTPS- oder HTTP-URI des Yarn-Ressourcenmanagers
    Gilt für externe Cluster. HTTPS- oder HTTP-URI-Wert für den Yarn-Ressourcenmanager.
    HTTP-URI des Verlaufsservers
    Gilt für externe Cluster. Geben Sie einen Wert für die Generierung von YARN-Zuordnungsprotokolldateien für Scanner an. Catalog Administrator zeigt die Protokoll-URL im Zuge der Aufgabenüberwachung an.
    Name des HDFS-Diensts für hohe Verfügbarkeit
    Gilt für hochverfügbare externe Cluster. Geben Sie den HDFS-Dienstnamen an.
    URI des Yarn-Ressourcenmanager-Schedulers
    Gilt für externe Cluster. Der Scheduler-URI-Wert für den Yarn-Ressourcenmanager.
    Dienst-Clustername
    Gilt sowohl für interne als auch für externe Cluster. Name des Dienst-Clusters. Stellen Sie sicher, dass in HDFS ein Verzeichnis /Informatica/LDM/<ServiceClusterName> in HDFS vorhanden ist.
    HINWEIS: Wenn Sie keinen Dienst-Clusternamen angeben, betrachtet Enterprise Data Catalog DomainName_CatalogServiceName als Standardwert. Das Verzeichnis /Informatica/LDM/<DomainName>_<CatalogServiceName> muss sich dann in HDFS befinden. Andernfalls kann der Katalogdienst fehlschlagen.
    Ladetyp
    Wählen Sie eine der folgenden Optionen aus, um die Datengröße anzugeben, die Sie im Katalog laden möchten:
    • - Demo
    • - Niedrig
    • - Mittel
    • - Hoch
    Weitere Informationen zur Datengröße, zu Ladetypen und zu den Werten der Leistungsoptimierungsparameter, die Enterprise Data Catalog für jeden Ladetyp konfiguriert, finden Sie im Artikel Optimieren der Leistung von Enterprise Data Catalog in der Informatica-Ratgeber-Bibliothek.
    Aktivieren der Kerberos-Authentifizierung
    Wählen Sie diese Option aus, um die Kerberos-Authentifizierung für den externen Cluster zu aktivieren.
    HDFS-Dienstprinzipalname
    Gilt für die Kerberos-Authentifizierung. Prinzipalname für den HDFS-Dienst.
    YARN-Dienstprinzipalname
    Gilt für die Kerberos-Authentifizierung. Prinzipalname für den YARN-Dienst.
    Dienst-Keytab-Speicherort
    Gilt für die Kerberos-Authentifizierung. Pfad zur Keytab-Datei.
    Kerberos-Domänenname
    Gilt für die Kerberos-Authentifizierung. Der Name der Kerberos-Domäne.
    Cluster-SSL aktivieren
    Wählen Sie diese Option aus, um die SSL-Authentifizierung für sichere Kommunikation im externen Cluster zu aktivieren.
    Solr-Schlüsselspeicher
    Gilt für die SSL-Authentifizierung. Pfad zur Solr-Schlüsselspeicherdatei.
    Solr-Schlüsselspeicherpasswort
    Gilt für die SSL-Authentifizierung. Passwort für die Solr-Schlüsselspeicherdatei.
    Benachrichtigungen per E-Mail erhalten
    Gilt sowohl für interne als auch für externe Cluster. Wählen Sie diese Option, um E-Mail-Benachrichtigungen über den Status des Katalogdiensts zu erhalten.
    HINWEIS: Wenn Sie diese Option auswählen, müssen Sie den E-Mail-Dienst aktivieren.
    Weitere Informationen zum Aktivieren des E-Mail-Diensts finden Sie im Handbuch Administrator-Referenz für Enterprise Data Catalog.
    Katalogdienst aktivieren
    Gilt sowohl für interne als auch für externe Cluster. Wählen Sie diese Option aus, um den Katalogdienst zu aktivieren.
    Informatica-Cluster-Dienst
    Gilt für interne Cluster. Name des Informatica-Cluster-Diensts, bei dem es sich um einen Anwendungsdienst handelt, den Enterprise Data Catalog in der internen Clusterbereitstellung verwendet.
    10Klicken Sie auf Fertig stellen.

Konfigurieren des Katalogdiensts für Azure HDInsight

Wenn HDInsight als Clustertyp verwendet wird, konfigurieren Sie die folgenden benutzerdefinierten Eigenschaften in Informatica Administrator für den Katalogdienst:
LdmCustomOptions.deployment.azure.account.key
Der Schlüssel zum Authentifizieren des Katalogdiensts für die Verbindung mit dem Azure-Speicherkonto. Der Wert des Azure-Speicherkontoschlüssels kann verschlüsselt oder unverschlüsselt sein. Sie können den Wert aus der Eigenschaft fs.azure.account.key.<Name des Speicherkontos> in der Datei core-site.xml abrufen, die sich im Azure HDInsight-Cluster befindet.
LdmCustomOptions.deployment.azure.key.decryption.script.path
Wenn der Schlüssel in der Eigenschaft LdmCustomOptions.deployment.azure.account.key im verschlüsselten Format vorliegt, können Sie das Entschlüsselungs-Shell-Skript verwenden, um den Schlüssel mit dem Schlüsselzertifikat zu entschlüsseln. Sie müssen das Entschlüsselungs-Shell-Skript und die Schlüsselzertifikatdatei auf den Domänencomputer (unter demselben Pfad wie der Clustercomputer) kopieren, bevor Sie den Katalogdienst aktivieren. Den Pfad im Azure HDInsight-Clustercomputer müssen Sie für die kopierten Dateien im Domänencomputer beibehalten. Der Wert für die Eigenschaft ist der Speicherort des Entschlüsselungs-Shell-Skripts. Beispiel: /usr/lib/python2.7/dist-packages/hdinsight_common/decrypt.sh. Die Schlüsselzertifikatdatei „key_decryption_cert.prv“ befindet sich im Verzeichnis /usr/lib/hdinsight-common/certs/key_decryption_cert.prv des Azure HDInsight-Clusters.
LdmCustomOptions.deployment.hdfs.default.fs
Adresse des WASB-Speicherkontos, mit dem der Katalogdienst eine Verbindung herstellen muss. Die Adresse enthält den Namen des WASB-Speichercontainers mit dem Namen des Speicherkontos. Der Wert für die Eigenschaft ist die vollständige WASB-Adresse mit den Namen des Containers und des Speicherkontos. Sie können den Wert für die Eigenschaft aus der Eigenschaft fs.defaultFS in der Datei core-site.xml abrufen, die sich im Azure HDInsight-Cluster befindet.