Data Engineering
In diesem Abschnitt finden Sie weitere Informationen zu den Änderungen an Data Engineering-Produkten in Version 10.5.
Dokumentation
Ab Version 10.5 finden Sie Anweisungen zur Integration von Informatica in einen Google Dataproc-Cluster im Data Engineering-Integrationshandbuch.
Zuvor wurden Anweisungen zur Dataproc-Integration in H2L-Artikeln (How-To Library) veröffentlicht. Sie können diese Artikel, die sich mit der Dataproc-Integration in Data Engineering 10.4 befassen, auf der Registerkarte „How-to Library“ im
Informatica Documentation Portal anzeigen.
Leistung
Ab Version 10.5 verbraucht die PERCENTILE-Funktion in der Spark-Engine weniger Arbeitsspeicher, insbesondere wenn mehrere Spalten die PERCENTILE-Funktion für denselben Datensatz mit unterschiedlichen Perzentilen berechnen.
Verarbeiten ungültiger Werte
Ab Version 10.5 schreibt die Spark-Engine NULL-Werte in das Ziel, wenn die Zuordnung bestimmte ungültige Werte enthält.
Die Spark-Engine schreibt NULL-Werte in den folgenden Situationen:
- •Das Argument terms in PV-, FV-, PMT- und RATE-Finanzfunktionen übergibt einen 0-Wert. Der Wert von terms muss eine Ganzzahl größer 0 sein.
- •Das Argument month in der MAKE_DATE_TIME-Funktion übergibt einen ungültigen Wert. Der Wert von month muss zwischen 1 und 12 liegen.
Zuvor hat die Spark-Engine Zufallswerte geschrieben.
HINWEIS: Der Datenintegrationsdienst lehnt Zeilen mit ungültigen Werten ab. Wenn Zeilen mit ungültigen Werten abgelehnt und nicht in das Ziel geschrieben werden sollen, führen Sie die Zuordnung in der nativen Umgebung aus.