Versionsaufgaben
In diesem Abschnitt werden Versionsaufgaben in Version 10.2.2 beschrieben. Versionsaufgaben sind Aufgaben, die Sie nach dem Upgrade auf Version 10.2.2 ausführen müssen.
Big Data Management
In diesem Abschnitt werden Versionsaufgaben für Big Data Management in Version 10.2.2 beschrieben.
Decimal-Datentypen
Wenn Sie ein Upgrade auf Version 10.2.2 ausführen, muss bei Mappings, die für den Hochpräzisionsmodus aktiviert sind und auf der Spark-Engine ausgeführt werden, ein Skalierungsargument für die Funktionen TO_DECIMAL und TO_DECIMAL38 verwendet werden. Wenn für die Funktionen kein Skalierungsargument vorhanden ist, scheitern die Mappings.
Wird bei einem Mapping vor dem Upgrade beispielsweise der Hochpräzisionsmodus verwendet, und ist der Ausdruck TO_DECIMAL(3) enthalten, müssen Sie ein Skalierungsargument festlegen, bevor Sie das aktualisierte Mapping auf der Spark-Engine ausführen können. Wenn der Ausdruck ein Skalierungsargument enthält, könnte der Ausdruck TO_DECIMAL(3,2) sein.
Weitere Informationen finden Sie im Informatica Big Data Management 10.2.2-Benutzerhandbuch.
Massenerfassung
Ab Version 10.2.2 können Sie das Tool für die Massenerfassung verwenden, um Daten mit einem inkrementellen Ladenvorgang zu erfassen.
Wenn Sie ein Upgrade auf Version 10.2.2 ausführen, werden Massenerfassungsspezifikationen dahingehend aktualisiert, dass inkrementelles Laden deaktiviert ist. Führen Sie vor dem Ausführen inkrementeller Ladevorgänge bei vorhandenen Spezifikationen die folgenden Schritte aus:
- 1Bearbeiten Sie die Spezifikation.
- 2Wählen Sie auf der Seite Definition die Option Inkrementelles Laden aktivieren aus.
- 3Konfigurieren Sie auf den Seiten Quelle und Ziel die Optionen für das inkrementelle Laden.
- 4Speichern Sie die Spezifikation.
- 5Implementieren Sie die Spezifikation für den Datenintegrationsdienst neu.
HINWEIS: Die neu implementierte Massenerfassungsspezifikation wird auf der Spark-Engine ausgeführt.
Weitere Informationen finden Sie im Massenerfassungshandbuch zu Informatica Big Data Management 10.2.2.
Python-Umwandlung
Wenn Sie ein Upgrade auf Version 10.2.2 ausführen, kann die Python-Umwandlung Daten in Big Data Management effizienter verarbeiten.
Um von der Leistungssteigerung zu profitieren, sollten Sie bei der Hadoop-Verbindung die folgenden erweiterten Spark-Eigenschaften konfigurieren:
- infaspark.pythontx.exec
Erforderlich, um eine Python-Umwandlung auf der Spark-Engine für Data Engineering Integration auszuführen. Der Speicherort der ausführbaren Python-Binärdatei auf den Worker-Knoten im Hadoop-Cluster.
Legen Sie die Eigenschaft z. B. fest auf:
infaspark.pythontx.exec=/usr/bin/python3.4
Wenn Sie die Installation von Python auf dem Computer des Datenintegrationsdiensts verwenden, legen Sie den Wert auf die ausführbare Python-Binärdatei im Informatica-Installationsverzeichnis auf dem Computer des Datenintegrationsdiensts fest.
Legen Sie die Eigenschaft z. B. fest auf:
infaspark.pythontx.exec=INFA_HOME/services/shared/spark/python/lib/python3.4
- infaspark.pythontx.executorEnv.PYTHONHOME
Erforderlich, um eine Python-Umwandlung auf der Spark-Engine für Data Engineering Integration und Data Engineering Streaming auszuführen. Der Speicherort des Python-Installationsverzeichnisses auf den Worker-Knoten im Hadoop-Cluster.
Legen Sie die Eigenschaft z. B. fest auf:
infaspark.pythontx.executorEnv.PYTHONHOME=/usr
Wenn Sie die Installation von Python auf dem Computer des Datenintegrationsdiensts verwenden, verwenden Sie den Speicherort des Python-Installationsverzeichnisses auf dem Computer des Datenintegrationsdiensts.
Legen Sie die Eigenschaft z. B. fest auf:
infaspark.pythontx.executorEnv.PYTHONHOME=
INFA_HOME/services/shared/spark/python/
Wenn Sie die erweiterten Eigenschaften entsprechend konfiguriert haben, verwendet die Spark-Engine zum Ausführen von Python-Code in der Python-Umwandlung nicht Jep.
Informationen zur Installation von Python finden Sie im Informatica Big Data Management 10.2.2-Integrationshandbuch.
Big Data Streaming
In diesem Abschnitt werden Versionsaufgaben für Big Data Streaming in Version 10.2.2 beschrieben.
Kafka-Ziel
Ab Version 10.2.2 ist der Datentyp des Schlüsselheader-Ports im Kafka-Ziel „Binary“. Zuvor entsprach der Schlüsselheader-Port dem Datentyp String.
Nach dem Upgrade müssen Sie zum Ausführen eines vorhandenen Streaming-Mappings das Datenobjekt neu erstellen und das Streaming-Mapping mit dem neu erstellten Datenobjekt aktualisieren.
Weitere Informationen zur Neuerstellung des Datenobjekts finden Sie im Big Data Management 10.2.2-Integrationshandbuch.
Kafka-Verbindungseigenschaften
Konfigurieren Sie die Version des Kafka-Messaging-Brokers für eine Kafka-Verbindung nach dem Upgrade auf 0.10.1.x bis 2.0.0.
PowerExchange-Adapter für Informatica
In diesem Abschnitt werden Versionsaufgaben für Informatica-Adapter in Version 10.2.2 erläutert.
PowerExchange for HBase
Ab Version 10.2.2 müssen Sie ein Mapping für die Spark-Engine ausführen, um Daten in einer HBase-Ressource nachzuschlagen.
Wenn Sie zum Nachschlagen von Daten in einer HBase-Ressource zuvor ein Mapping zur Ausführung in der nativen Umgebung konfiguriert haben, müssen Sie die Ausführungs-Engine nach dem Upgrade auf Version 10.2.2 für Spark aktualisieren. Anderenfalls scheitert das Mapping.
Weitere Informationen finden Sie im Informatica PowerExchange for HBase 10.2.2-Benutzerhandbuch.
PowerExchange for Microsoft Azure SQL Data Warehouse
Nach dem Upgrade von einer früheren Version auf Version 10.2.2 scheitern die bestehenden Mappings, die die folgenden Datentypen enthalten, auf der Spark-Engine zur Laufzeit:
- •Binary
- •Varbinary
- •Datetime2
- •Datetimeoffset
Um die vorhandenen Mappings erfolgreich auszuführen, müssen Sie diese Datentypen dem Datentyp String zuordnen oder das Objekt neu importieren.
- •Binary -> String (n)
- •Varbinary -> String (n)
- •Datetime2 -> String (27)
- •Datetimeoffset -> String (34)
Weitere Informationen finden Sie im Informatica PowerExchange for Microsoft Azure SQL Data Warehouse 10.2.2-Benutzerhandbuch.