Handbuch für Informatica-Anwendungsdienst > Datenintegrationsdienst > Data Integration Service-Eigenschaften
  

Data Integration Service-Eigenschaften

Um die Eigenschaften des Data Integration Service anzuzeigen, wählen Sie den Dienst im Domänennavigator aus und klicken auf die Registerkarte Eigenschaften. Sie können die Eigenschaften ändern, während der Dienst ausgeführt wird, aber Sie müssen den Dienst neu starten, damit die Eigenschaften wirksam werden.

Allgemeine Eigenschaften

Zu den allgemeinen Eigenschaften eines Datenintegrationsdienstes gehören Name, Lizenz und Knotenzuweisung.
In der folgenden Tabelle werden die allgemeinen Eigenschaften für den Dienst beschrieben:
Allgemeine Eigenschaften
Beschreibung
Name
Name des Diensts. Der Name unterliegt nicht der Groß-/Kleinschreibung und muss innerhalb der Domäne eindeutig sein. Er darf weder mehr als 128 Zeichen enthalten noch mit @ beginnen. Außerdem darf er weder Leerzeichen noch die folgenden Sonderzeichen enthalten:
` ~ % ^ * + = { } \ ; : ' " / ? . , < > | ! ( ) ] [
Nachdem Sie den Dienst erstellt haben, können Sie seinen Namen nicht mehr ändern.
Beschreibung
Beschreibung des Diensts. Die Beschreibung darf nicht mehr als 765 Zeichen enthalten.
Lizenz
Lizenzobjekt für die Verwendung des Diensts.
Zuweisen
Knoten oder Gitter, auf dem der Datenintegrationsdienst ausgeführt wird.
Knoten
Knoten, auf dem der Dienst ausgeführt wird.
Gitter
Name des Gitters, auf dem der Datenintegrationsdienst ausgeführt wird, wenn der Dienst auf einem Gitter ausgeführt wird. Klicken Sie auf den Gitternamen, um die Gitterkonfiguration anzuzeigen.
Backup-Knoten
Wenn die Lizenz hohe Verfügbarkeit einschließt, sind dies die Knoten, auf denen der Dienst ausgeführt werden kann, wenn der primäre Knoten nicht verfügbar ist.

Modellrepository-Eigenschaften

In der folgenden Tabelle werden die Modellrepository-Eigenschaften des Datenintegrationsdienst beschrieben:
Eigenschaft
Beschreibung
Modell-Repository Service
Dienst, der Laufzeitmetadaten speichert, die zur Ausführung von Zuordnungen und SQL-Datendiensten erforderlich sind.
Benutzername
Benutzername für den Zugriff auf das Modellrepository. Der Benutzer muss über die Berechtigung zum Erstellen von Projekten für den Modellrepository-Dienst verfügen.
Nicht verfügbar für eine Domäne mit Kerberos-Authentifizierung.
Passwort
Benutzerpasswort für den Zugriff auf das Modellrepository.
Nicht verfügbar für eine Domäne mit Kerberos-Authentifizierung.

Ausführungsoptionen

In der folgenden Tabelle werden die Ausführungsoptionen für den Datenintegrationsdienst beschrieben:
Eigenschaft
Beschreibung
Betriebssystemprofile und Identitätswechsel verwenden
Führt Mappings, Arbeitsabläufe und Profiling-Jobs mit Betriebssystemprofilen aus.
In einer Hadoop-Umgebung verwendet der Datenintegrationsdienst den Hadoop-Benutzer für den Identitätswechsel, um Mappings, Arbeitsabläufe und Profiling-Jobs auszuführen.
Sie können diese Option auswählen, wenn der Datenintegrationsdienst unter UNIX oder Linux ausgeführt wird. Starten Sie den Datenintegrationsdienst neu, um die Änderungen zu übernehmen.
Joboptionen starten
Führt Jobs im Datenintegrationsdienstprozess, in separaten DTM-Prozessen auf dem lokalen Knoten oder in separaten DTM-Prozessen auf Remoteknoten aus. Konfigurieren Sie die Eigenschaft basierend auf den vom Datenintegrationsdienst ausgeführten Jobtypen sowie basierend darauf, ob der Datenintegrationsdienst auf einem Einzelknoten oder Gitter ausgeführt wird.
Wählen Sie eine der folgenden Optionen aus:
  • - Im Dienstprozess. Konfigurieren Sie diese Option, wenn Sie Jobs auf einem Einzelknoten oder in einem Gitter ausführen, in dem jeder Knoten sowohl über die Dienst- als auch über die Berechnungsrolle verfügt.
  • - In separaten lokalen Prozessen. Konfigurieren Sie diese Option, wenn Sie Jobs auf einem Einzelknoten oder in einem Gitter ausführen, in dem jeder Knoten sowohl über die Dienst- als auch über die Berechnungsrolle verfügt.
  • - In separaten Remoteprozessen. Konfigurieren Sie diese Option, wenn Sie Mapping-, Profil- und Arbeitsablaufjobs in einem Gitter ausführen, in dem Knoten über eine andere Kombination von Rollen verfügen. Wenn Sie bei Ausführung des Datenintegrationsdiensts auf einem Einzelknoten diese Option auswählen, führt der Dienst Jobs in separaten lokalen Prozessen aus. Sie können SQL-Datendienst- oder Webdienstjobs in separaten Remoteprozessen ausführen.
Standardwert ist „In separaten lokalen Prozessen“.
Wenn der Datenintegrationsdienst Betriebssystemprofile verwendet, konfigurieren Sie diese zur Ausführung von Jobs in separaten lokalen Prozessen.
HINWEIS: Wenn der Datenintegrationsdienst unter UNIX ausgeführt wird und zur Ausführung von Jobs in separaten lokalen Prozessen oder Remoteprozessen konfiguriert ist, stellen Sie sicher, dass die Hostdatei auf jedem Knoten mit der Berechnungsrolle einen „localhost“-Eintrag enthält. Andernfalls schlagen Jobs fehl, die in separaten Prozessen ausgeführt werden.
Maximale Größe des bedarfsabhängigen Ausführungspools
Maximale Anzahl an auf Abruf verfügbaren Jobs, die gleichzeitig ausgeführt werden können. Zu den Jobs gehören Datenvorschauen, Profilerstellungsjobs, REST- und SQL-Abfragen, Webdienstanfragen und Zuordnungen, die vom Developer Tool ausgeführt werden. Alle Jobs, die der Datenintegrationsdienst empfängt, tragen zur Größe des bedarfsabhängigen Pools bei. Der Datenintegrationsdienst führt auf Abruf verfügbare Jobs sofort aus, wenn genügend Ressourcen vorhanden sind. Andernfalls lehnt der Datenintegrationsdienst den Job ab. Standardwert ist 10.
Die maximale Größe des bedarfsabhängigen Pools hängt von der maximalen Anzahl gleichzeitiger Jobs ab, die ein Developer Tool-Client auf einem Datenintegrationsdienst ausführen kann. Die maximale Anzahl gleichzeitiger Jobs, die vom Developer Tool-Client ausgeführt werden können, beträgt 10.
Maximale Größe des nativen Stapelausführungspools
Maximale Anzahl an bereitgestellten Jobs, die gleichzeitig in der nativen Umgebung ausgeführt werden können. Der Datenintegrationsdienst verschiebt native Zuordnungsjobs aus der Warteschlange in den nativen Job-Pool, wenn genügend Ressourcen verfügbar sind. Standardwert ist 10.
Maximale Größe des Hadoop-Stapelausführungspools
Maximale Anzahl an bereitgestellten Jobs, die gleichzeitig in der Hadoop-Umgebung ausgeführt werden können. Der Datenintegrationsdienst verschiebt Hadoop-Jobs aus der Warteschlange in den Hadoop-Job-Pool, wenn genügend Ressourcen verfügbar sind. Standardwert ist 100.
Maximale Speichergröße
Die maximale Speichermenge in Byte, die der Datenintegrationsdienst für die gleichzeitige Ausführung aller Anfragen zuordnen kann, wenn der Dienst Jobs in dem Prozess des Datenintegrationsdiensts ausführt. Wenn der Datenintegrationsdienst Jobs in separaten lokalen Prozessen oder Remoteprozessen ausführt, ignoriert der Dienst diesen Wert. Wenn Sie die Speichergröße, die der Datenintegrationsdienst zuordnen kann, nicht einschränken möchten, legen Sie diese Eigenschaft auf 0 fest.
Wenn der Wert größer als 0 ist, verwendet der Datenintegrationsdienst die Eigenschaft zur Berechnung des maximalen Gesamtspeicherplatzes, der für die gleichzeitige Ausführung aller Anfragen zulässig ist. Der Datenintegrationsdienst berechnet den maximalen Gesamtspeicherplatz folgendermaßen:
Maximale Speichergröße + maximale Heap-Größe + zum Laden von Programmkomponenten erforderlicher Speicherplatz
Standardwert ist 0.
HINWEIS: Wenn Sie Profile oder Datenqualitäts-Mappings ausführen, müssen Sie diese Eigenschaft auf 0 festlegen.
Maximaler Parallelismus
Maximale Anzahl paralleler Threads, die eine einzelne Zuordnungs-Pipeline-Stage verarbeiten.
Wenn Sie einen Wert größer als 1 festlegen, aktiviert der Datenintegrationsdienst die Partitionierung für Mappings, Spalten-Profiling und Datendomänenerkennung. Der Dienst führt eine dynamische Skalierung der Anzahl an Partitionen für eine Zuordnungs-Pipeline zur Laufzeit durch. Erhöhen Sie den Wert basierend auf der Anzahl der CPUs, die auf den Knoten verfügbar sind, auf denen Jobs ausgeführt werden.
Im Developer Tool können Entwickler den Wert für den maximalen Parallelismus je Zuordnung festlegen. Wenn maximaler Parallelismus sowohl für den Datenintegrationsdienstprozess als auch für die Zuordnung eingerichtet wurde, verwendet der Datenintegrationsdienst den Minimalwert beim Ausführen der Zuordnung.
Sie können den Wert für den maximalen Parallelismus für jedes Profil nicht ändern. Wenn der Datenintegrationsdienst einen Profiljob in ein oder mehrere Mappings konvertiert, verwenden die Mappings für den maximalen Mapping-Parallelismus immer die Einstellung „Auto“.
HINWEIS: Sie müssen den maximalen Parallelismus nicht festlegen, damit der Datenintegrationsdienst mehrere Partitionen in der Hadoop-Umgebung verwenden kann.
Standardwert ist 1. Maximalwert ist 64.
Hadoop-Kerberos-Dienst-Prinzipalname
Dienstprinzipalname (SPN) des Datenintegrationsdiensts zum Herstellen einer Verbindung zu einem Hadoop-Cluster, der Kerberos-Authentifizierung verwendet.
Nicht erforderlich, wenn Sie die MapR Hadoop-Distribution ausführen. Für andere Hadoop-Distributionen erforderlich.
Hadoop-Kerberos-Keytab
Der Dateipfad der Kerberos-Keytab-Datei auf dem Computer, auf dem der Datenintegrationsdienst ausgeführt wird.
Nicht erforderlich, wenn Sie die MapR Hadoop-Distribution ausführen. Für andere Hadoop-Distributionen erforderlich.
Basisverzeichnis
Root-Verzeichnis, auf das vom Knoten aus zugegriffen werden kann. Dies ist das Root-Verzeichnis für andere Dienstverzeichnisse. Standardwert ist <Informatica-Installationsverzeichnis>/tomcat/bin. Wenn Sie den Standardwert ändern, stellen Sie sicher, dass das Verzeichnis vorhanden ist.
Die folgenden Zeichen dürfen nicht im Verzeichnispfad verwendet werden:
* ? < > " | , [ ]
Diese Eigenschaftsänderung erfordert keinen Neustart des Datenintegrationsdiensts.
Temporäre Verzeichnisse
Verzeichnis für temporäre Dateien, die während der Ausführung von Jobs erstellt werden. Standardwert ist <Basisverzeichnis>/disTemp.
Geben Sie eine Liste mit durch Semikola getrennten Verzeichnissen ein, um die Leistung während Profilvorgängen und während der Cache-Partitionierung für Sortierumwandlungen zu optimieren.
Die folgenden Zeichen dürfen nicht im Verzeichnispfad verwendet werden:
* ? < > " | , [ ]
Diese Eigenschaftsänderung erfordert keinen Neustart des Datenintegrationsdiensts.
Cache-Verzeichnis
Verzeichnis für Index- und Daten-Cache-Dateien für Umwandlungen. Standardwert ist <Basisverzeichnis>/cache.
Geben Sie eine Liste mit durch Semikola getrennten Verzeichnissen ein, um die Leistung während der Cache-Partitionierung für Aggregator-, Joiner- und Rangumwandlungen zu optimieren.
Die folgenden Zeichen dürfen nicht im Verzeichnispfad verwendet werden:
* ? < > " | , [ ]
Diese Eigenschaftsänderung erfordert keinen Neustart des Datenintegrationsdiensts.
Quellverzeichnis
Verzeichnis für Einfachdateien der Quelle, die in einem Mapping verwendet werden. Standardwert ist <Basisverzeichnis>/source.
Wenn der Datenintegrationsdienst auf einem Gitter ausgeführt wird, können Sie ein freigegebenes Verzeichnis zum Erstellen eines Verzeichnisses für Quelldateien verwenden. Wenn Sie für jeden Knoten mit der Berechnungsrolle ein anderes Verzeichnis konfigurieren, stellen Sie sicher, dass die Quelldateien in allen Quellverzeichnissen konsistent sind.
Die folgenden Zeichen dürfen nicht im Verzeichnispfad verwendet werden:
* ? < > " | , [ ]
Diese Eigenschaftsänderung erfordert keinen Neustart des Datenintegrationsdiensts.
Zielverzeichnis
Standardverzeichnis für Zieleinfachdateien, die in einem Mapping verwendet werden. Standardwert ist <Basisverzeichnis>/target.
Geben Sie eine Liste mit durch Semikola getrennten Verzeichnissen ein, um die Leistung zu steigern, wenn mehrere Partitionen in das Einfachdateiziel schreiben.
Die folgenden Zeichen dürfen nicht im Verzeichnispfad verwendet werden:
* ? < > " | , [ ]
Diese Eigenschaftsänderung erfordert keinen Neustart des Datenintegrationsdiensts.
Verzeichnis für abgelehnte Dateien
Verzeichnis für Ablehnungsdateien. Ablehnungsdateien enthalten Zeilen, die beim Ausführen eines Mappings zurückgewiesen wurden. Standardwert ist <Basisverzeichnis>/reject.
Die folgenden Zeichen dürfen nicht im Verzeichnispfad verwendet werden:
* ? < > " | , [ ]
Diese Eigenschaftsänderung erfordert keinen Neustart des Datenintegrationsdiensts.
Cluster-Staging-Verzeichnis
Das Verzeichnis im Cluster, in das der Datenintegrationsdienst die Binärdateien verschiebt, um die nativen und nicht nativen Umgebungen zu integrieren und temporäre Dateien während der Verarbeitung zu speichern. Standardwert ist „/tmp“.
Hadoop-Staging-Benutzer
Der HDFS-Benutzer, der Vorgänge im Hadoop-Staging-Verzeichnis ausführt. Der Benutzer benötigt Schreibberechtigungen für das Hadoop-Staging-Verzeichnis. Standardwert ist der Datenintegrationsdienst-Benutzer.
Benutzerdefinierter Hadoop-Betriebssystempfad
Der lokale Pfad zu den Informatica Hadoop-Binärdateien, die mit dem Hadoop-Betriebssystem kompatibel sind. Erforderlich, wenn sich der Hadoop-Cluster und der Datenintegrationsdienst auf verschiedenen unterstützten Betriebssystemen befinden. Laden Sie die Informatica-Binärdateien für den Hadoop-Cluster herunter und extrahieren Sie sie auf den Computer, auf dem der Datenintegrationsdienst gehostet wird. Der Datenintegrationsdienst verwendet die Binärdateien in diesem Verzeichnis, um die Domäne in den Hadoop-Cluster zu integrieren. Der Datenintegrationsdienst kann die folgenden Betriebssysteme synchronisieren:
  • - SUSE 12 und Red Hat 6.7
Änderungen werden wirksam, nachdem Sie den Datenintegrationsdienst wiederverwendet haben.
HINWEIS: Wenn Sie eine Informatica-EBF installieren, müssen Sie sie auch im Pfad des Hadoop-Betriebssystems auf dem Datenintegrationsdienstcomputer installieren.
Data Engineering-Wiederherstellung
Gibt an, ob Mapping-Jobs, die auf der Spark-Engine ausgeführt werden, wiederhergestellt werden, wenn der Verarbeitungsknoten des Datenintegrationsdiensts ausfällt. Standardwert ist FALSE.
Weitere Informationen finden Sie im Administratorhandbuch für Informatica Data Engineering.
Statusspeicherung
Der HDFS-Speicherort auf dem Cluster zum Speichern von Informationen zum Status des Spark-Jobs. Standardwert ist <Home directory >/State Store
Konfigurieren Sie diese Eigenschaft, wenn Sie die Laufzeiteigenschaften einer Streaming-Zuordnung konfigurieren.
Diese Eigenschaftsänderung erfordert keinen Neustart des Datenintegrationsdiensts.
Weitere Informationen zu dieser Eigenschaft finden Sie im Big Data Streaming-Benutzerhandbuch.

Eigenschaften für logisches Datenobjekt/virtuellen Tabellen-Cache

Die folgende Tabelle beschreibt die Eigenschaften eines Datenobjekts und des virtuellen Tabellen-Cache:
Eigenschaft
Beschreibung
Cache-Entfernungszeit
Die Zeit in Millisekunden, die der Datenintegrationsdienst wartet, ehe er den Cache-Speicher nach einer Aktualisierung bereinigt. Standard ist 3.600.000.
Cache-Verbindung
Der Datenbankverbindungsname für die Datenbank, in der der Datenobjekt-Cache gespeichert wird. Wählen Sie einen gültigen Verbindungsobjektnamen aus.
Maximal Anzahl an gleichzeitigen Aktualisierungsanfragen
Maximale Anzahl an gleichzeitig ausführbaren Cache-Aktualisierungen. Beschränken Sie die gleichzeitig ausführbaren Cache-Aktualisierungen, um Systemressourcen zu erhalten.
Geschachtelten LDO-Cache aktivieren
Gibt an, dass der Datenintegrationsdienst Cache-Daten für ein logisches Datenobjekt verwenden kann, das während einer Cache-Aktualisierung in einem anderen logischen Datenobjekt als Quelle oder als Lookup verwendet wird. Bei false greift der Datenintegrationsdienst auf die Quellressourcen zu, auch wenn das Caching für das als Quelle oder Lookup verwendete logische Datenobjekt aktiviert wurde.
Beispiel: Das logische Datenobjekt LDO3 vereint Daten aus den logischen Datenobjekten LDO1 und LDO2. Ein Entwickler erstellt ein Mapping, das LDO3 als Eingabe verwendet, und bezieht das Mapping in einer Anwendung mit ein. Sie aktivieren das Caching für LDO1, LDO2, LDO3. Wenn Sie das Caching für verschachtelte logische Datenobjekte aktivieren, verwendet der Datenintegrationsdienst bei der Aktualisierung der Cache-Tabelle für LDO3 auch Cache-Daten für LDO1 und LDO2. Wenn Sie das Caching für verschachtelte logische Datenobjekte nicht aktivieren, greift der Datenintegrationsdienst bei der Aktualisierung der Cache-Tabelle für LDO3 auf die Quellressourcen für LDO1 und LDO2 zu.
Standardwert ist „false“.

Protokollierungseigenschaften

Die folgende Tabelle beschreibt die Spaltenstatistikeigenschaften:
Eigenschaft
Beschreibung
Protokollierungslevel
Konfigurieren Sie die Protokollierungslevel-Eigenschaft, um die Protokollierungsebene festzulegen. Die folgenden Werte sind gültig:
  • - Schwerwiegend. Schreibt FATAL-Meldungen in das Protokoll. Zu FATAL-Meldungen gehören nicht behebbare Systemfehler, die bewirken, dass der Dienst beendet wird oder nicht mehr verfügbar ist.
  • - Fehler: Schreibt FATAL- und ERROR-Codemeldungen in das Protokoll. Zu ERROR-Meldungen gehören Verbindungsfehler, Fehler beim Speichern oder Abrufen von Metadaten, Dienstfehler.
  • - Warnung. Schreibt FATAL-, WARNING- und ERROR-Meldungen in das Protokoll. WARNING-Fehler beinhalten wiederherstellbare Systemfehler oder Warnungen.
  • - Info. Schreibt FATAL-, INFO-, WARNING- und ERROR-Meldungen in das Protokoll. INFO-Meldungen beinhalten System- und Dienständerungsmeldungen.
  • - Trace. Schreibt FATAL-, TRACE-, INFO-, WARNING- und ERROR-Meldungen in das Protokoll. In TRACE-Meldungen werden fehlerhafte Benutzeranfragen protokolliert.
  • - Debug. Schreibt FATAL-, DEBUG-, TRACE-, INFO-, WARNING- und ERROR-Meldungen in das Protokoll. DEBUG-Meldungen sind Benutzeranfrageprotokolle.

Bereitstellungsoptionen

Die folgende Tabelle beschreibt die Bereitstellungsoptionen für den Data Integration Service:
Eigenschaft
Beschreibung
Standardbereitstellungsmodus
Bestimmt, ob eine Anwendung nach der Bereitstellung an den Data Integration Service aktiviert oder gestartet wird. Der Standardbereitstellungsmodus wirkt sich auf Anwendungen aus, die Sie vom Developer Tool, der Befehlszeile und dem Administrator Tool bereitstellen.
Wählen Sie eine der folgenden Optionen:
  • - Aktivieren und starten. Aktiviert die Anwendung und startet sie.
  • - Nur aktivieren Aktiviert die Anwendung, aber startet sie nicht.
  • - Deaktivieren Aktiviert die Anwendung nicht.

Pass-Through-Sicherheitseigenschaften

In der folgenden Tabelle werden die Eigenschaften der Pass-Through-Sicherheit beschrieben:
Eigenschaft
Beschreibung
Caching zulassen
Datenobjekt-Caching für alle Pass-Through-Verbindungen im Data Integration Service. Der Data Object Cache wird mit den Anmeldedaten aus dem Verbindungsobjekt gefüllt.
HINWEIS: Wenn Sie für das Datenobjekt-Caching die Pass-Through-Sicherheit aktivieren, können Sie den Benutzern den Zugang zu den Daten in der Cache-Datenbank gewähren, die ihnen in einer nicht zwischengespeicherten Umgebung eventuell nicht zur Verfügung stehen.

Module

Standardmäßig sind alle Datenintegrationsdienst-Module aktiviert. Sie können einige der Module deaktivieren.
Beim Testen oder bei begrenzten Ressourcen auf dem Computer möchten Sie möglicherweise ein Modul deaktivieren. Sie können Speicher sparen, indem Sie die Datenintegrationsdienst-Funktionalität einschränken. Bevor Sie ein Modul deaktivieren, müssen Sie den Datenintegrationsdienst deaktivieren.
In der folgenden Tabelle werden die Datenintegrationsdienst-Module beschrieben:
Modul
Beschreibung
Webdienstmodul
Führt Vorgangs-Mappings für Webdienste durch.
Zuordnungsdienstmodul
Führt Mappings und Vorschauen aus.
Profilerstellungsdienst-Modul
Führt Profile aus und erzeugt Scorecards.
SQL-Dienstmodul
Führt SQL-Abfragen von Client-Tools anderer Hersteller an einen SQL-Datendienst aus.
Arbeitsablauf-Orchestration-Dienstmodul
Führt Arbeitsabläufe aus.

HTTP-Proxy-Server - Eigenschaften

Die folgende Tabelle beschreibt die Eigenschaften des HTTP-Proxy-Servers:
Eigenschaft
Beschreibung
HTTP-Proxy-Server - Host
Name des HTTP-Proxy-Servers
HTTP-Proxy-Server - Port
Portnummer des HTTP-Proxy-Servers
Voreingestellt ist 8080.
HTTP-Proxy-Server - Benutzer
Authentifizierter Benutzername für den HTTP-Proxy-Server Dies ist erforderlich, wenn der Proxy-Server die Authentifizierung verlangt.
HTTP-Proxy-Server - Passwort
Passwort für den authentifizierten Benutzer Der Service Manager verschlüsselt das Passwort. Dies ist erforderlich, wenn der Proxy-Server die Authentifizierung verlangt.
HTTP-Proxy-Server - Domäne
Domäne für die Authentifizierung

HTTP-Konfigurationseigenschaften

Die folgende Tabelle beschreibt die HTTP-Konfigurationseigenschaften:
Eigenschaft
Beschreibung
Zulässige IP-Adressen
Liste der Konstanten oder regulären Java-Expressionsmuster im Vergleich zur IP-Adresse des anfragenden Computers. Trennen Sie mehrere Konstanten oder Expressionen durch ein Leerzeichen.
Wenn Sie diese Eigenschaft konfigurieren, nimmt der Data Integration Service Anfragen von IP-Adressen an, die mit dem zugelassenen Adressmuster übereinstimmen. Haben Sie diese Eigenschaft nicht konfiguriert, bestimmt der Data Integration Service, welche Clients Anfragen senden dürfen, anhand der Eigenschaft Nicht zulässige IP-Adressen.
Zulässige Hostnamen
Liste der Konstanten oder regulären Java-Expressionsmuster im Vergleich zu den Hostnamen des anfragenden Computers. Die Hostnamen sind groß- bzw. kleinschreibungsempfindlich. Trennen Sie mehrere Konstanten oder Expressionen durch ein Leerzeichen.
Wenn Sie diese Eigenschaft konfigurieren, nimmt der Data Integration Service Anfragen von Hosts an, deren Namen mit dem zulässigen Hostnamensmuster übereinstimmt. Konfigurieren Sie diese Eigenschaft dagegen nicht, bestimmt der Data Integration Service anhand der Eigenschaft Nicht zulässige Hostnamen, welche Clients Anfragen senden dürfen.
Nicht zulässige IP-Adressen
Liste der Konstanten oder regulären Java-Expressionsmuster im Vergleich zur IP-Adresse des anfragenden Computers. Trennen Sie mehrere Konstanten oder Expressionen durch ein Leerzeichen.
Wenn Sie diese Eigenschaft konfigurieren, nimmt der Data Integration Service Anfragen von IP-Adressen an, die nicht mit dem unzulässigen IP-Adressmuster übereinstimmen. Wenn Sie diese Eigenschaft nicht konfigurieren, verwendet der Data Integration Service die Eigenschaft Zulässige IP-Adressen, um zu bestimmen, welche Clients Anfragen senden dürfen.
Nicht zulässige Hostnamen
Liste der Konstanten oder regulären Java-Expressionsmuster im Vergleich zu den Hostnamen des anfragenden Computers. Die Hostnamen sind groß- bzw. kleinschreibungsempfindlich. Trennen Sie mehrere Konstanten oder Expressionen durch ein Leerzeichen.
Wenn Sie diese Eigenschaft konfigurieren, nimmt der Data Integration Service Anfragen von Hosts an, deren Namen nicht mit dem Muster der unzulässigen Hostnamen übereinstimmen. Konfigurieren Sie diese Eigenschaft dagegen nicht, bestimmt der Data Integration Service anhand der Eigenschaft Zulässige Hostnamen, welche Clients Anfragen senden dürfen.
HTTP-Protokolltyp
Sicherheitsprotokoll, das vom Data Integration Service verwendet wird. Wählen Sie einen der folgenden Werte aus:
  • - HTTP. Anfragen an den Dienst müssen eine HTTP-URL verwenden.
  • - HTTPS. Anfragen an den Dienst müssen eine HTTPS-URL verwenden.
  • - HTTP&HTTPS. Anfragen an den Dienst, die entweder eine HTTP- oder eine HTTPS-URL verwenden können.
Wenn Sie den HTTP-Protokolltyp auf HTTPS oder HTTP&HTTPS einstellen, aktivieren Sie TLS (Transport Layer Security) für den Dienst.
Sie können TLS auch für jeden Webdienst aktivieren, der einer Anwendung bereitgestellt ist. Wenn Sie HTTPS für den Data Integration Service und TLS für den Webdienst aktivieren, verwendet der Webdienst eine HTTPS-URL. Wenn Sie HTTPS für den Data Integration Service und nicht für den Webdienst aktivieren, kann der Webdienst eine HTTP-URL oder eine HTTPS-URL nutzen. Wenn Sie TLS für einen Webdienst aktivieren, aber HTTPS nicht für den Data Integration Service aktivieren, startet der Webdienst nicht.
Der Standardwert ist HTTP.

Eigenschaften des Ergebnissatz-Cache

In der folgenden Tabelle werden die Ergebnissatz-Cache-Eigenschaften beschrieben:
Eigenschaft
Beschreibung
Dateinamenpräfix
Das Präfix für die Namen aller Ergebnissatz-Cachedateien, die auf dem Datenträger gespeichert sind. Standardwert ist RSCACHE.
Verschlüsselung aktivieren
Gibt an, ob die Ergebnissatz-Cachedateien mit der 128-Bit-AES-Verschlüsselung verschlüsselt werden. Gültige Werte sind „True“ oder „False“. Standardwert ist „True“.

Mapping Service-Eigenschaften

In der folgenden Tabelle werden die Eigenschaften des Zuordnungsdienstmoduls für den Datenintegrationsdienst beschrieben:
Eigenschaft
Beschreibung
Maximale Thread-Poolgröße für Benachrichtigungen
Maximale Anzahl gleichzeitiger Benachrichtigungen über die Fertigstellung von Jobs, die das Zuordnungsdienstmodul an externe Clients sendet, nachdem der Datenintegrationsdienst die Jobs abgeschlossen hat. Das Zuordnungsdienstmodul ist eine Komponente des Datenintegrationsdiensts, die Anfragen zur Ausführung von Mappings verwaltet. Standardwert ist 5.
Maximale Speichergröße pro Anfrage
Das Verhalten von „Maximale Speichergröße pro Anfrage“ richtet sich nach den folgenden Datenintegrationsdienst-Konfigurationen:
  • - Der Dienst führt Jobs in lokalen Prozessen oder Remoteprozessen aus oder die Diensteigenschaft „Maximale Speichergröße“ lautet 0 (Standardeinstellung).
  • In diesem Fall stellt „Maximale Speichergröße pro Anfrage“ die maximale Speichermenge in Byte dar, die der Datenintegrationsdienst allen Umwandlungen zuordnen kann, die den automatischen Cache-Modus in einer einzelnen Anfrage verwenden. Der Dienst weist Arbeitspeicher separat zu Umwandlungen zu, die über eine bestimmte Cache-Größe verfügen. Der von der Anfrage verwendete Gesamtspeicher kann den Wert für „Maximale Speichergröße pro Anfrage“ überschreiten.
  • - Der Dienst führt Jobs in dem Prozess des Datenintegrationsdiensts aus und die Diensteigenschaft „Maximale Speichergröße“ ist größer als 0.
  • In diesem Fall stellt „Maximale Speichergröße pro Anfrage“ die maximale Speichermenge in Byte dar, die der Datenintegrationsdienst einer einzelnen Anfrage zuordnen kann. Der von der Anfrage verwendete Gesamtspeicher darf den Wert für „Maximale Speichergröße pro Anfrage“ nicht überschreiten.
Standardwert ist 536.870.912.
Anfragen beinhalten Mappings. Diese werden von Mapping-Aufgaben aus innerhalb eines Arbeitsablaufs ausgeführt.

Profiling-Warehouse-Datenbankeigenschaften

In der folgenden Tabelle werden die Profiling-Warehouse-Datenbankeigenschaften beschrieben:
Eigenschaft
Beschreibung
Profiling-Warehouse-Datenbank
Die Verbindung zum Profiling-Warehouse.
Wählen Sie den Namen des Verbindungsobjekts aus.
Maximale Anzahl an Rängen
Anzahl der minimalen und maximalen für ein Profil anzuzeigenden Werte. Standardwert ist 5.
Maximale Anzahl an Mustern
Maximale Anzahl an für ein Profil anzuzeigenden Mustern. Standardwert ist 10.
Maximale Profilausführungspoolgröße
Maximale Anzahl an Threads zum Ausführen des Profiling. Standardwert ist 10.
Maximale Anzahl an Datenbankverbindungen
Maximale Anzahl an Datenbankverbindungen für jeden Profiling-Job. Standardwert ist 5.
Exportpfad für Profilergebnisse
Temporärer Speicherort, an den der Datenintegrationsdienst die Profilergebnisdatei exportiert. Nach dem Export wird die Datei von dem Server gelöscht, auf dem der Datenintegrationsdienst ausgeführt wird.
Wenn der Datenintegrationsdienst und der Analyst-Dienst auf verschiedenen Knoten ausgeführt werden, müssen beide Dienste auf diesen Speicherort zugreifen können. Andernfalls schlägt der Export fehl.
Maximale Speichergröße pro Anfrage
Die maximale Speichermenge in Byte, die der Datenintegrationsdienst für jede Mapping-Ausführung für eine einzelne Profilanfrage zuordnen kann.
Standardwert ist 536.870.912.

Erweiterte Profiling-Eigenschaften

Die folgende Tabelle beschreibt die erweiterten Profiling-Eigenschaften:
Eigenschaft
Beschreibung
Prozentsatz für Musterschwellenwert
Minimale Anzahl an Werten, die zum Ableiten eines Musters erforderlich sind. Der Standard ist 5.
Maximale Anzahl an Wertfrequenzpaaren
Maximale Anzahl der im Profiling-Warehouse zu speichernden Wertfrequenzpaare. Standardwert ist 16.000.
Maximale Zeichenfolgenlänge
Maximale Länge einer Zeichenfolge, die der Profilerstellungsdienst verarbeiten kann. Voreingestellt ist 255.
Maximale numerische Präzision
Maximale Anzahl der Stellen für einen numerischen Wert. Voreingestellt ist 38.
Maximale Anzahl an gleichzeitigen Profil-Jobs
Die maximale Anzahl der gleichzeitigen Profil-Threads zum Ausführen eines Profils für Einfachdateien und relationale Quellen. Bleibt dieser Parameter unausgefüllt, bestimmt das Profilerstellungsdienst-Plugin die beste Anzahl basierend auf den laufenden Jobs und anderen Umgebungsfaktoren.
Maximale Anzahl an gleichzeitigen Spalten
Maximale Anzahl der Spalten, die Sie für Profiling-Einfachdateien in einem einzelnen Ausführungspool-Thread kombinieren können. Der Standard ist 5.
Maximale Anzahl an gleichzeitigen Profil-Threads
Die maximale Anzahl gleichzeitiger Ausführungspool-Threads zum Ausführen eines Profils für Einfachdateien oder relationale Datenquellen. Standardwert ist 1.
Maximale Spalten-Heap-Größe
Speichermenge, die für das Spalten-Profiling in jeder Spalte erforderlich ist. Voreingestellt sind 64 Megabyte.
Reservierte Profil-Threads
Anzahl der Threads der maximalen Ausführungspoolgröße für Prioritätsanfragen. Standardwert ist 1.

SQL-Eigenschaften

In der folgenden Tabelle werden die SQL-Eigenschaften beschrieben:
Eigenschaft
Beschreibung
DTM-Keep-Alive-Zeit
Anzahl der Millisekunden, für die die DTM-Instanz geöffnet bleibt, nachdem sie die letzte Anfrage abgeschlossen hat. Identische SQL-Abfragen können die offene Instanz wiederverwenden. Verwenden Sie die Keep Alive-Zeit, um die Leistung zu erhöhen, wenn die für die Verarbeitung der SQL-Abfrage erforderliche Zeit im Vergleich zur Dauer der Initialisierung der DTM-Instanz gering ist. Wenn die Abfrage fehlschlägt, wird die DTM-Instanz beendet.
Muss größer oder gleich 0 sein. 0 bedeutet, dass der Datenintegrationsdienst die DTM-Instanz nicht im Speicher behält. Standardwert ist 0.
Sie können diese Eigenschaft auch für jeden SQL-Datendienst festlegen, der auf dem Datenintegrationsdienst bereitgestellt wird. Wenn Sie diese Eigenschaft für einen bereitgestellten SQL-Datendienst festlegen, überschreibt der Wert für den bereitgestellten SQL-Datendienst den Wert, den Sie für den Datenintegrationsdienst festgelegt haben.
Tabellenspeicherverbindung
Relationale Datenbankverbindung, die temporäre Tabellen für SQL-Datendienste speichert. Standardmäßig ist keine Verbindung ausgewählt.
Maximale Speichergröße pro Anfrage
Das Verhalten von „Maximale Speichergröße pro Anfrage“ richtet sich nach den folgenden Datenintegrationsdienst-Konfigurationen:
  • - Der Dienst führt Jobs in lokalen Prozessen oder Remoteprozessen aus oder die Diensteigenschaft „Maximale Speichergröße“ lautet 0 (Standardeinstellung).
  • In diesem Fall stellt „Maximale Speichergröße pro Anfrage“ die maximale Speichermenge in Byte dar, die der Datenintegrationsdienst allen Umwandlungen zuordnen kann, die den automatischen Cache-Modus in einer einzelnen Anfrage verwenden. Der Dienst weist Arbeitspeicher separat zu Umwandlungen zu, die über eine bestimmte Cache-Größe verfügen. Der von der Anfrage verwendete Gesamtspeicher kann den Wert für „Maximale Speichergröße pro Anfrage“ überschreiten.
  • - Der Dienst führt Jobs in dem Prozess des Datenintegrationsdiensts aus und die Diensteigenschaft „Maximale Speichergröße“ ist größer als 0.
  • In diesem Fall stellt „Maximale Speichergröße pro Anfrage“ die maximale Speichermenge in Byte dar, die der Datenintegrationsdienst einer einzelnen Anfrage zuordnen kann. Der von der Anfrage verwendete Gesamtspeicher darf den Wert für „Maximale Speichergröße pro Anfrage“ nicht überschreiten.
Standardwert ist 50.000.000.
Protokolldateien überspringen
Hindert den Datenintegrationsdienst daran, Protokolldateien zu erstellen, wenn die SQL-Datendienstanfrage erfolgreich abgeschlossen wird und die Tracing-Ebene auf INFO oder höher festgelegt ist. Standardwert ist „false“.

Eigenschaften des Arbeitsablauf-Orchestration-Diensts

In der folgenden Tabelle werden die Eigenschaften des Arbeitsablauf-Orchestration-Diensts für den Datenintegrationsdienst beschrieben:
Eigenschaft
Beschreibung
Arbeitsablauf-Verbindung
Der Verbindungsname der Datenbank, in der die Laufzeit-Konfigurationsdaten für die Arbeitsabläufe gespeichert werden, die der Datenintegrationsdienst ausführt. Wählen Sie in der Ansicht „Verbindungen“ eine Datenbank aus.
Erstellen Sie die Datenbankinhalte für einen Arbeitsablauf, bevor Sie diesen ausführen. Verwenden Sie zum Erstellen der Inhalte die Optionen des Menüs „Aktionen“ für den Datenintegrationsdienst im Administrator Tool.
HINWEIS: Recyceln Sie den Datenintegrationsdienst nach der Konfiguration der Datenbankverbindung des Arbeitsablaufs und vor der Erstellung von Datenbankinhalten für den Arbeitsablauf.
Maximale Anzahl an Worker-Threads
Die maximale Anzahl an Threads, die vom Datenintegrationsdienst verwendet werden können, um parallele Aufgaben zwischen einem Paar inklusiver Gateways in einem Arbeitsablauf auszuführen. Der Standardwert ist 10.
Wenn die Anzahl der Aufgaben zwischen den inklusiven Gateways größer als der Maximalwert ist, führt der Datenintegrationsdienst die Aufgaben in vom Wert angegebenen Batches aus. Wenn der Wert für die maximale Anzahl an Worker-Threads beispielsweise auf 10 festgelegt wurde, führt der Datenintegrationsdienst die Aufgaben in Batches zu je zehn Blöcken aus.

Webdienst-Eigenschaften

In der folgenden Tabelle werden die Eigenschaften des Webdienstes beschrieben:
Eigenschaft
Beschreibung
DTM-Keep-Alive-Zeit
Anzahl der Millisekunden, für die die DTM-Instanz geöffnet bleibt, nachdem sie die letzte Anfrage abgeschlossen hat. Webdienstanfragen für denselben Vorgang können die offene Instanz wiederverwenden. Verwenden Sie die Keep Alive-Zeit, um die Leistung zu erhöhen, wenn die für die Verarbeitung der Anfrage erforderliche Zeit im Vergleich zur Dauer der Initialisierung der DTM-Instanz gering ist. Wenn die Anfrage fehlschlägt, wird die DTM-Instanz beendet.
Muss größer oder gleich 0 sein. 0 bedeutet, dass der Datenintegrationsdienst die DTM-Instanz nicht im Speicher behält. Standardwert ist 5000.
Sie können diese Eigenschaft auch für jeden Webdienst festlegen, der auf dem Datenintegrationsdienst bereitgestellt wird. Wenn Sie diese Eigenschaft für einen bereitgestellten Webdienst festlegen, überschreibt der Wert für den bereitgestellten Webdienst den Wert, den Sie für den Datenintegrationsdienst festgelegt haben.
Logische URL
Präfix für die WSDL-URL, wenn Sie einen externen HTTP-Load Balancer verwenden. Beispiel:
http://loadbalancer:8080
Der Datenintegrationsdienst benötigt einen externen HTTP-Load Balancer, um einen Webdienst auf einem Gitter auszuführen. Wenn Sie den Datenintegrationsdienst auf einem Einzelknoten ausführen, müssen Sie keine logische URL angeben.
Maximale Speichergröße pro Anfrage
Das Verhalten von „Maximale Speichergröße pro Anfrage“ richtet sich nach den folgenden Datenintegrationsdienst-Konfigurationen:
  • - Der Dienst führt Jobs in lokalen Prozessen oder Remoteprozessen aus oder die Diensteigenschaft „Maximale Speichergröße“ lautet 0 (Standardeinstellung).
  • In diesem Fall stellt „Maximale Speichergröße pro Anfrage“ die maximale Speichermenge in Byte dar, die der Datenintegrationsdienst allen Umwandlungen zuordnen kann, die den automatischen Cache-Modus in einer einzelnen Anfrage verwenden. Der Dienst weist Arbeitspeicher separat zu Umwandlungen zu, die über eine bestimmte Cache-Größe verfügen. Der von der Anfrage verwendete Gesamtspeicher kann den Wert für „Maximale Speichergröße pro Anfrage“ überschreiten.
  • - Der Dienst führt Jobs in dem Prozess des Datenintegrationsdiensts aus und die Diensteigenschaft „Maximale Speichergröße“ ist größer als 0.
  • In diesem Fall stellt „Maximale Speichergröße pro Anfrage“ die maximale Speichermenge in Byte dar, die der Datenintegrationsdienst einer einzelnen Anfrage zuordnen kann. Der von der Anfrage verwendete Gesamtspeicher darf den Wert für „Maximale Speichergröße pro Anfrage“ nicht überschreiten.
Standardwert ist 50.000.000.
Protokolldateien überspringen
Hindert den Datenintegrationsdienst daran, Protokolldateien zu erstellen, wenn die Webdienstanfrage erfolgreich abgeschlossen wird und die Tracing-Ebene auf INFO oder höher festgelegt ist. Standardwert ist „False“.

Benutzerdefinierte Eigenschaften für den Datenintegrationsdienst

Konfigurieren Sie benutzerdefinierte Eigenschaften, die für bestimmte Umgebungen eindeutig sind.
In speziellen Fällen ist die Anwendung von benutzerdefinierten Eigenschaften erforderlich. Wenn Sie eine benutzerdefinierte Eigenschaft definieren, geben Sie den Eigenschaftennamen und einen Anfangswert ein. Definieren Sie die benutzerdefinierten Eigenschaften nur auf Anforderung des globalen Kundensupports von Informatica.
Sie haben die Möglichkeit, Laufzeiteigenschaften für die Hadoop-Umgebung im Datenintegrationsdienst, in der Hadoop-Verbindung und im Mapping zu konfigurieren. Eine auf einer hohen Ebene konfigurierte Eigenschaft können Sie durch Festlegen des Werts auf einer unteren Ebene überschreiben. Wenn Sie z. B. eine Eigenschaft in den benutzerdefinierten Eigenschaften des Datenintegrationsdiensts konfigurieren, können Sie diese in der Hadoop-Verbindung oder im Mapping überschreiben. Der Datenintegrationsdienst verarbeitet Überschreibungen von Eigenschaften auf der Grundlage der folgenden Prioritäten:
  1. 1Zuordnung der mit dem Befehl infacmd ms runMapping und der Option -cp festgelegten benutzerdefinierten Eigenschaften
  2. 2Zuordnung der Laufzeiteigenschaften für die Hadoop-Umgebung
  3. 3Erweiterte Eigenschaften der Hadoop-Verbindung für Laufzeit-Engines
  4. 4Erweiterte allgemeine Eigenschaften, Umgebungsvariablen und Klassenpfade der Hadoop-Verbindung
  5. 5Benutzerdefinierte Eigenschaften des Datenintegrationsdiensts
HINWEIS: Wenn eine Zuordnung Hive-Server 2 zum Ausführen eines Jobs oder von Teilen eines Jobs verwendet, können Sie keine Eigenschaften überschreiben, die auf Cluster-Ebene in PreSQL- oder Post-SQL-Abfragen oder SQL-Überschreibungsanweisungen konfiguriert sind.
Problemumgehung: Statt die Clusterkonfiguration in der Domäne zum Überschreiben von Cluster-Eigenschaften zu verwenden, übergeben Sie die Überschreibungseinstellungen an die JDBC-URL. Beispiel: beeline -u "jdbc:hive2://<domain host>:<port_number>/tpch_text_100" --hiveconf hive.execution.engine=tez