Maximale Anzahl gleichzeitiger Jobs in einem Gitter
Sie können die Anzahl der bereitgestellten und auf Abruf verfügbaren Jobs festlegen, die vom Datenintegrationsdienst gleichzeitig ausgeführt werden können.
Sie können die folgenden Eigenschaften für den Datenintegrationsdienst konfigurieren:
- Maximale Größe des bedarfsabhängigen Ausführungspools
- Bestimmt die maximale Anzahl von auf Abruf verfügbaren Jobs, die gleichzeitig ausgeführt werden können. Zu den auf Abruf verfügbaren Jobs gehören Datenvorschauen, Profiling-Jobs, SQL-Abfragen und Webdienstanfragen. Der Datenintegrationsdienst führt auf Abruf verfügbare Jobs sofort aus, wenn genügend Ressourcen vorhanden sind. Andernfalls lehnt der Datenintegrationsdienst den Job ab. Der Standardwert ist 10.
- Maximale Größe des nativen Stapelausführungspools
- Bestimmt die maximale Anzahl an Jobs, die in der nativen Umgebung gleichzeitig ausgeführt werden können. Der Datenintegrationsdienst verschiebt bereitgestellte native Jobs aus der Warteschlange in den nativen Batch-Pool, wenn genügend Ressourcen verfügbar sind. Der Standardwert ist 10.
- Maximale Größe des Hadoop-Stapelausführungspools
- Bestimmt die maximale Anzahl der bereitgestellten Jobs, die in der Hadoop-Umgebung gleichzeitig ausgeführt werden können. Der Datenintegrationsdienst verschiebt bereitgestellte Hadoop-Jobs aus der Warteschlange in den Hadoop-Batch-Pool, wenn genügend Ressourcen verfügbar sind. Der Standardwert ist 100.
Bei Ausführung des Datenintegrationsdiensts in einem Gitter wird die maximale Anzahl von bereitgestellten und auf Abruf verfügbaren Jobs, die im Gitter gleichzeitig ausgeführt werden kann, folgendermaßen berechnet:
Maximum on-demand pool size * Number of running service processes
Maximum native batch pool size * Number of running service processes
Maximum Hadoop batch pool size * Number of running service processes
Ein Datenintegrationsdienstgitter enthält beispielsweise drei laufende Dienstprozesse. Wenn Sie die Größe des Hadoop-Batch-Pools auf 10 festlegen, können im Datenintegrationsdienstprozess bis zu 10 bereitgestellte Hadoop-Jobs gleichzeitig ausgeführt werden. Insgesamt 30 bereitgestellte Hadoop-Jobs können gleichzeitig im Gitter ausgeführt werden. Wenn Sie mehr als 30 Hadoop-Jobs ausführen möchten, verschiebt der Datenintegrationsdienst die Jobs solange in die Warteschlange, bis ausreichend Speicherplatz im Pool verfügbar ist.
Wenn Sie die Werte für die Pool-Größe erhöhen, verwendet der Datenintegrationsdienst mehr Hardwareressourcen, wie z. B. CPU, Arbeitsspeicher und System-E/A. Legen Sie diesen Wert auf der Grundlage der auf den Knoten im Gitter verfügbaren Ressourcen fest. Berücksichtigen Sie beispielsweise die Anzahl der CPUs auf den Computern, auf denen die Datenintegrationsdienst-Prozesse ausgeführt werden, und die Menge an Arbeitsspeicher, die für den Datenintegrationsdienst verfügbar ist.
HINWEIS: Bei Ausführung von Jobs im Datenintegrationsdienstgitter in separaten Remoteprozessen werden weitere gleichzeitige Jobs nach einer Erhöhung des Werts dieser Eigenschaften möglicherweise nicht auf Rechenknoten ausgeführt. Unter Umständen müssen Sie Rechenknotenattribute überschreiben, um die Anzahl der gleichzeitigen Jobs auf jedem Rechenknoten zu erhöhen. Weitere Informationen hierzu finden Sie unter
Überschreiben von Rechenknotenattributen zur Erhöhung der Anzahl gleichzeitiger Jobs.