Begriffsglossar

Eine wiederverwendbare Darstellung des Schemas der Daten, auf die Sie in einem struct-Port oder in einem komplexen Port, der Elemente des Typs struct enthält, verweisen. Einer oder mehrere komplexe Ports können die Definition für komplexe Datentypen verwenden.

Definition für rekursive Datentypen

Eine Definition für geschachtelte Datentypen, in der eine der Definitionen für komplexe Datentypen auf einer Ebene mit der eines übergeordneten Datentyps identisch ist.

einfacher Datentyp

Ein Datentyp, der es Ihnen ermöglicht, einen einzelnen Datenwert in einer einzelnen Spaltenposition darzustellen.

geschachtelter Datentyp

Ein komplexer Datentyp, der mindestens ein Element eines komplexen Datentyps enthält. Ein Beispiel ist ein struct-Datentyp, der ein Element vom Typ Array enthält.

geschachtelter komplexer Port

Ein komplexer Port, der eine Definition für geschachtelte komplexe Datentypen enthält.

hierarchische Daten

Eine Gruppe von Daten, die hierarchisch verwandt sind. Die hierarchische Beziehung wird als Schema dargestellt. Informatica-Transformationen verwenden komplexe Datentypen, um hierarchische Daten darzustellen.

komplexe Funktion

Ein Typ einer vordefinierten Funktion, in der die Eingabe oder der Rückgabetyp ein komplexer Datentyp ist.

komplexer Datentyp

Ein Datentyp, der es Ihnen ermöglicht, mehrere Datenwerte in einer einzelnen Spaltenposition darzustellen. Die Datenwerte werden als Elemente bezeichnet.

komplexer Operator

Ein Typ von Operator, um auf Elementnamen zu verweisen oder auf Elemente in einem komplexen Datentyp zuzugreifen.

komplexer Port

Ein Port-Typ, der einem komplexen Datentyp, z. B. Array, Struktur oder Zuordnung, zum Übergeben hierarchischer Daten zugewiesen wird.

Schema

Eine Definition der Struktur von Daten. Komplexe Ports des struct-Datentyps verwenden Definitionen für komplexe Datentypen zur Schemadarstellung.

Typdefinitionsbibliothek

Ein Objekt im Modellrepository, in dem Definitionen für komplexe Datentypen für eine Zuordnung oder ein Mapplet gespeichert werden.

Typkonfiguration

Eine Reihe komplexer Porteigenschaften, die den Datentyp der komplexen Datentypelemente oder das Schema der Daten angeben.

Abgeleiteter Schlüssel

Eine vom Analyst-Tool oder Developer-Tool als Schlüsselkandidat auf der Grundlage von Spaltendaten abgeleitete Spalte oder Reihe von Spalten.

Abhängige Spalte

In einer funktionalen Abhängigkeit die Spalte mit den Werten, die von einer Determinantenspalte festgelegt werden.

anwendung

Ein Objekt, das einem Datenintegrationsdienst bereitgestellt werden kann. Es kann Datenobjekte, Zuordnungen, SQL-Datendienste, Webdienste und Arbeitsabläufe enthalten.

Anwendungs-Patch

Ein Objekt, das einem Datenintegrationsdienst bereitgestellt werden kann. Es enthält die Metadaten, die zum Aktualisieren einer bereitgestellten inkrementellen Anwendung verwendet werden können.

Anwendungsdienst

Ein Dienst, der auf einem oder mehreren Knoten in der Informatica-Domäne ausgeführt wird. Sie erstellen und verwalten Anwendungsdienste in Informatica Administrator oder über das infacmd-Befehlsprogramm. Anwendungsdienste beinhalten Dienste, die über mehrere Instanzen in der Domäne verfügen können, und Systemdienste, die über eine einzelne Instanz in der Domäne verfügen können. Konfigurieren Sie jeden Anwendungsdienst basierend auf den Anforderungen Ihrer Umgebung.

Arbeitsablauf

Eine grafische Darstellung einer Reihe von Ereignissen, Aufgaben und Entscheidungen, die einen Geschäftsprozess definieren. Verwenden Sie das Developer Tool, um Objekte einem Arbeitsablauf hinzuzufügen und die Objekte mit Sequenzflüssen zu verbinden. Der Datenintegrationsdienst verwendet die im Arbeitsablauf konfigurierten Anweisungen, um die Objekte auszuführen.

Arbeitsablauf-Dienstmodul

Eine Komponente im Data Integration Service, der Anforderungen zur Ausführung von Arbeitsabläufen verwaltet.

Arbeitsablaufinstanz

Die Darstellung eines Arbeitsablaufs zur Laufzeit. Wenn Sie einen Arbeitsablauf in einer bereitgestellten Anwendung ausführen, führen Sie eine Instanz des Arbeitsablaufs aus. Sie können mehrere Instanzen desselben Arbeitsablaufs gleichzeitig ausführen.

Arbeitsablaufinstanz-ID

Eine Zahl, die eine ausgeführte Arbeitsablaufinstanz eindeutig identifiziert.

Arbeitsablaufparameter

Ein konstanter Wert, den Sie vor der Ausführung des Arbeitsablaufs ausführen. Parameter behalten denselben Wert während der gesamten Ausführung des Arbeitsablaufs bei. Definieren Sie den Wert des Parameters in einer Parameterdatei. Alle Arbeitsablaufparameter sind benutzerdefiniert.

Arbeitsablaufvariable

Ein Wert, der sich während eines Arbeitsablaufs ändern kann. Verwenden Sie Arbeitsablaufvariablen, um auf Werte und Laufzeitinformationen zu Datensätzen zu verweisen. Sie können System- oder benutzerdefinierte Arbeitsablaufvariablen verwenden.

Audit

Eine Reihe von Regeln und Bedingungen, die Daten an der Quelle und am Ziel eines Mappings validieren. Auditregeln berechnen einen Gesamtwert für eine Datenspalte in der Quelle oder im Ziel. Die Auditbedingungen vergleichen mehrere Auditregeln miteinander oder Auditregeln mit konstanten Werten.

Aufgabe

Ein Arbeitsablaufobjekt, das eine einzelne Arbeitseinheit im Arbeitsablauf ausführt, wie zum Beispiel die Ausführung eines Mappings, das Senden einer E-Mail oder das Ausführen eines Shell-Befehls. Eine Aufgabe stellt eine Aktion dar, die während eines Arbeitsablaufs durchgeführt wird. Der Editor zeigt Aufgaben als Quadrate an.

Aufgabenausgabe

Daten, die von einer Aufgabe an Arbeitsablaufvariablen übergeben werden. Beim Konfigurieren einer Aufgabe geben Sie die Aufgabenausgabewerte an, die Sie Arbeitsablaufvariablen zuweisen möchten. Wenn die Aufgabe abgeschlossen wird, kopiert der Data Integration Service die Aufgabenausgabewerte in die Arbeitsablaufvariablen. Der Data Integration Service kann auf diese Werte über die Arbeitsablaufvariablen zugreifen, wenn er Ausdrücke konditionalen Sequenzflüssen bewertet und weitere Objekte im Arbeitsablauf ausführt.

Aufgabeneingabe

Daten, die von Arbeitsablaufparametern und -variablen an eine Aufgabe übergeben werden. Die Aufgabe verwendet die Eingabedaten, um eine Arbeitseinheit abzuschließen.

Ausgabedokument

Ein Dokument, das das Ergebnis einer Datenprozessorumwandlung ist.

Befehlsaufgabe

Die Vorverarbeitungs- oder Nachbearbeitungsaufgabe für lokale Daten für einen Blaze-Engine-Arbeitsablauf.

Beispiel-Quelldokument

Ein Beispiel für ein Dokument, das von einer Datenprozessorumwandlung verarbeitet wird.

benutzerdefinierte Arbeitsablaufvariable

Eine Arbeitsablaufvariable, die die von Ihnen angegebenen Aufgabenausgabekriterien erfasst. Nachdem Sie eine benutzerdefinierte Arbeitsablaufvariable erstellt haben, konfigurieren Sie den Arbeitsablauf, um der Variable einen Laufzeitwert zuzuweisen.

Benutzerrolle

Eine Sammlung von Berechtigungen, die Sie einem Benutzer oder einer Gruppe zuordnen. Sie ordnen Benutzern und Gruppen für die Domäne und für einige Anwendungsdienste in der Domäne Rollen zu.

bereitstellen

Das Verfügbarmachen von Objekten in einer Anwendung für Endbenutzer. Endbenutzer können dann je nach den Typen von Objekten in der Anwendung Abfragen für die Objekte ausführen, auf Web-Dienste zugreifen oder Mappings oder Arbeitsabläufe ausführen.

Betriebssystemprofil

Ein Sicherheitstyp, der vom Datenintegrationsdienst unter UNIX oder Linux zum Isolieren der Laufzeitbenutzerumgebung verwendet wird. Das Betriebssystemprofil enthält den Namen des Betriebssystembenutzers, Dienstprozessvariablen, Umgebungsvariablen und Berechtigungen. Der Datenintegrationsdienst führt Zuordnungen, Arbeitsabläufe, Profiling-Jobs und Scorecards mit den Systemberechtigungen des Betriebssystembenutzers und den Eigenschaften aus, die im Betriebssystemprofil definiert sind.

Big Data

Ein Datensatz, der so groß und komplex ist, dass er nicht mit standardmäßigen Datenbankverwaltungstools verarbeitet werden kann.

Blaze Executor

Eine Komponente des DTM, die ein Mapping vereinfachen und es in einen Blaze-Ausführungsplan umwandeln kann, der auf einem Hadoop-Cluster ausgeführt wird.

CompressionCodec

Hadoop-Komprimierungsschnittstelle. Bei einem Codec handelt es sich um die Implementierung eines Komprimierungs-Dekomprimierungs-Algorithmus. In Hadoop wird ein Codec durch eine Implementierung der CompressionCodec-Schnittstelle dargestellt.

Container

Eine Zuweisung von Speicher- und CPU-Ressourcen auf einem Knoten mit der Berechnungsrolle. Ein Anwendungsdienst verwendet die Container, um Berechnungen auf dem Knoten remote durchzuführen. Beispiel: Ein Datenintegrationsdienst, der auf einem Gitter ausgeführt wird, kann ein Mapping innerhalb eines Containers auf einem Knoten mit Berechnungsrolle remote ausführen.

Data Transformation Manager (DTM) für die Ausführung

Die Berechnungskomponente des Datenintegrationsdiensts, die Daten für den Abschluss eines Datenumwandlungsjobs extrahiert, umwandelt und lädt.

DataNode

Ein HDFS-Knoten, der Daten im Hadoop-Dateisystem speichert. Ein HDFS-Cluster kann über mehr als einen DataNode mit darauf replizierten Daten verfügen.

Datendienst

Eine Sammlung von wiederverwendbaren Vorgängen, die Sie für den Zugriff auf Daten und die Umwandlung von Daten ausführen können. Ein Datendienst stellt ein einheitliches Datenmodell bereit, auf das Sie über einen Web-Dienst zugreifen können oder für das Sie eine SQL-Abfrage ausführen können.

Datendomäne

Ein vordefiniertes oder benutzerdefiniertes Modellrepository-Objekt, das die funktionelle Bedeutung einer Spalte auf der Basis der Spaltendaten oder des Spaltennamens darstellt. Beispiele hierfür sind Sozialversicherungsnummer, Kreditkartennummer und E-Mail-ID.

Datendomänenerkennung

Der Prozess, der alle Datendomänen identifiziert, die mit einer Spalte auf der Basis der Spaltenwerte oder des Namens verknüpft sind.

Datendomänenglossar

Ein Container für alle Datendomänen und Datendomänengruppen im Analyst oder Developer Tool.

Datendomänengruppe

Eine Sammlung von Datendomänen unter einer bestimmten Datendomänenkategorie.

Datenintegrationsdienst

Ein Anwendungsdienst, der Datenintegrationsaufgaben für Informatica Analyst, Informatica Developer und externe Clients ausführt. Zu den Datenintegrationsaufgaben gehören die Datenvorschau sowie das Ausführen von Mappings, Profilen, SQL-Datendiensten, Webdiensten und Arbeitsabläufen.

Datenobjekt-Lesevorgang

Repository-Objekt, das Eigenschaften enthält, die zum Ausführen bestimmter Laufzeitvorgänge für Quellen erforderlich sind. Ein Datenobjekt-Lesevorgang ist einem Quell-Datenobjekt zugeordnet.

Datenobjekt-Schreibvorgang

Repository-Objekt, das Eigenschaften enthält, die zum Ausführen bestimmter Laufzeitvorgänge für Ziele erforderlich sind. Ein Datenobjekt-Schreibvorgang wird einem Ziel-Datenobjekt zugeordnet.

Datenobjektprofil

Ein Repository-Objekt, das den Typ der Analyse definiert, die Sie mit einer Datenquelle ausführen.

Datenprozessor-Ereignis

Ein Vorkommnis, das während einer Datenprozessorumwandlung eintritt.

Datenregel:

Wiederverwendbare Business-Logik, die eine Spalte anhand ihrer Werte als zu einer bestimmten Datendomäne gehörend identifiziert.

Determinantenspalte

In einer funktionalen Abhängigkeit eine Gruppe von Spalten, die den Wert der abhängigen Spalte festlegt. Wenn der Determinant keine Spalten aufweist, handelt es sich bei der abhängigen Spalte um eine Konstante.

Direkter Match

In einer globalen Suche ist ein direkter Match ein Objekt, das mit der gesamten Suchanfrage übereinstimmt. In der Erkennungssuche ist ein direkter Match eine Übereinstimmung mit einigen oder allen Metadaten des Objekts, das mit der Suchanfrage übereinstimmt.

Distribution von Cloudera einschließlich Apache Hadoop (CDH)

Cloudera-Version des Open-Source-Software-Frameworks für Hadoop.

Dokumentierter Schlüssel

Ein deklarierter Primärschlüssel in der Quelldatenbank.

Dokumentprozessor

Eine Komponente, die auf einem Dokument als Ganzem operiert. Im Allgemeinen nimmt sie vor dem Parsen vorläufige Umwandlungen vor.

DTM-Instanz

Eine bestimmte, logische Darstellung des Data Transformation Manager (DTM) für die Ausführung, den der Datenintegrationsdienst für die Ausführung eines Jobs erstellt. DTM-Instanzen können basierend darauf, wie Sie den Datenintegrationsdienst konfigurieren, im Datenintegrationsdienst-Prozess, in einem separaten DTM-Prozess auf dem lokalen Knoten oder in einem separaten DTM-Prozess auf einem Remoteknoten ausgeführt werden.

DTM-Prozess

Ein Betriebssystemprozess, der vom Datenintegrationsdienst zur Ausführung von DTM-Instanzen gestartet wird. Je nach Konfiguration Ihres Datenintegrationsdienstes kann der Dienst jede DTM-Instanz in einem separaten DTM-Prozess auf dem lokalen Knoten oder Remoteknoten ausführen.

dynamische E-Mail-Adresse

Eine in einem Arbeitsablaufparameter oder einer -variable definierte E-Mail-Adresse.

Dynamische Quelle

Eine Einfachdatei oder relationale Quelle für ein Mapping, das zur Laufzeit geändert werden kann. Lese- und Lookup-Umwandlungen können Definitionen oder Änderungen bei Metadaten direkt von der Quelle erhalten. Wenn Sie einen Parameter für die Quelle verwenden, können Sie die Quelle zur Laufzeit ändern.

Dynamischer E-Mail-Inhalt

In einem Arbeitsablaufparameter oder einer -variable definierter E-Mail-Inhalt.

dynamischer Empfänger

In einem Arbeitsablaufparameter oder einer -variable definierter Benachrichtigungsempfänger.

Dynamischer Port

Ein Port, der von einer vorgelagerten Umwandlung mindestens eine Spalte erhalten und für jede Spalte einen generierten Port erstellen kann.

Dynamisches Mapping

Ein Mapping, bei dem Sie Quellen, Ziele und Umwandlungslogik basierend auf von Ihnen definierten Parametern und Regeln zur Laufzeit ändern können. Sie können dynamische Zuordnungen konfigurieren, um Metadatenänderungen an Quellen und Zielen zuzulassen. Sie können die Ports bestimmen, die von einer Umwandlung empfangen und die in der Umwandlungslogik verwendet werden. Außerdem können Sie die Verknüpfungen festlegen, die zwischen Umwandlungsgruppen erstellt werden können.

Dynamisches Ziel

Eine Einfachdatei oder ein relationales Ziel für ein Mapping, das zur Laufzeit geändert werden kann. Schreibumwandlungen können Zielspalten basierend auf dem Mapping-Fluss oder von einem zugeordneten Ziel zur Laufzeit definieren. Schreibumwandlungen können auch die Zieltabelle zur Laufzeit entfernen und ersetzen.

Eingaberegel

Eine Regel für die Bestimmung darüber, welche generierten Ports innerhalb eines dynamischen Ports erstellt werden sollen.

Empfänger

Ein Benutzer oder eine Gruppe in der Informatica-Domäne, die während eines Arbeitsablaufs eine Benachrichtigung empfängt.

Enterprise-Erkennung

Der Prozess, der Spaltenprofilstatistiken, Datendomänen, Primärschlüssel und Fremdschlüssel in einer großen Anzahl von Datenquellen über mehrere Verbindungen oder Schemata hinweg findet.

Enterprise-Erkennungsprofil

Ein Profiltyp, der zum Durchführen einer Enterprise-Erkennung verwendet wird.

Entwurfszeitanwendung

Eine Anwendung, die im Developer Tool bearbeitet wird. Die Anwendung enthält Entwurfszeitinstanzen von Anwendungsobjekten.

Ereignis

Ein Arbeitsablaufobjekt startet oder beendet den Arbeitsablauf. Ein Ereignis stellt etwas dar, was passiert, wenn der Arbeitsablauf ausgeführt wird. Der Editor zeigt Ereignisse als Kreise an.

Ergebnissatz-Cache

Ein Cache, der die Ergebnisse jeder SQL-Datendienst-Abfrage oder SQL-Web-Dienst-Abfrage enthält. Der Data Integration Service gibt mit dem Ergebnissatz-Cache im Cache abgelegte Ergebnisse zurück, wenn Benutzer identische Abfragen ausführen. Der Ergebnissatz-Cache verringert die Laufzeit für identische Abfragen.

Erkennungssuche

Ein Suchtyp im Analyst-Tool, um Objekte anhand von direkten Übereinstimmungen mit der Suchabfrage sowie Beziehungen mit anderen Objekten, die mit der Suchabfrage übereinstimmen, zu identifizieren.

Erzeugter Port

Ein Port innerhalb eines dynamischen Ports, der eine einzelne Spalte darstellt. Das Developer Tool generiert Ports basierend auf einer oder mehreren Eingaberegeln.

Exklusives Gateway

Ein Gateway, das eine in einem Arbeitsablauf getroffene Entscheidung darstellt. Wenn ein exklusives Gateway den Arbeitsablauf aufteilt, trifft der Data Integration Service die Entscheidung, einen der ausgehenden Zweige zu übernehmen. Wenn ein exklusives Gateway den Arbeitsablauf zusammenführt, wartet der Data Integration Service auf den Abschluss eines eingehenden Zweigs, bevor der ausgehende Zweig ausgelöst wird.

Fremdschlüsselerkennung

Der Prozess, der Spalten in einer Datenquelle sucht, die mit den Primärschlüssel-Spalten in der übergeordneten Datenquelle übereinstimmt.

frühe Auswahloptimierung

Eine Optimierungsmethode, mit der die Anzahl von Zeilen reduziert wird, die das Mapping durchlaufen. Mit früher Auswahloptimierung bringt der Data Integration Service Filter näher an die Mapping-Quelle in der Pipeline.

frühe Projektionsoptimierung

Eine Optimierungsmethode, mit der die Menge von Daten zwischen Umwandlungen im Mapping reduziert wird. Mit früher Projektionsoptimierung erkennt der Data Integration Service nicht verwendete Ports und entfernt die Links zwischen den Ports in einem Mapping.

Funktionale Abhängigkeit

Die Beziehung zwischen einer Gruppe von Spalten in einer bestimmten Tabelle, in der die Determinantenspalte die abhängige Spalte funktional festlegt.

Funktionale Abhängigkeitserkennung

Der Prozess, der funktionale Abhängigkeitsverhältnisse zwischen Spalten in einer Datenquelle sucht.

Gateway

Ein Arbeitsablaufobjekt, dass Pfade in einem Arbeitsablauf basierend auf der Evaluierung von Ausdrücken in konditionalen Sequenzflüssen durch den Data Integration Service aufteilt und zusammenführt. Der Editor zeigt Gateways als Rauten an.

Gitteraufgabe

Eine Jobanfrage für die parallele Verarbeitung. Wenn das Mapping in der Hadoop-Umgebung ausgeführt wird, sendet der Blaze-Engine Executor die Anfrage an den Gitter-Manager. Wenn das Mapping in der nativen Umgebung und der Datenintegrationsdienst im Remote-Modus ausgeführt wird, sendet der Datenintegrationsdienst-Prozess die Anfrage an den Dienstmanager auf dem Masterrechenknoten.

Hadoop-Cluster

Ein Cluster von Computern, der für die Ausführung von Hadoop-Anwendungen und -Diensten konfiguriert wurde. Eine typischer Hadoop-Cluster enthält einen Masterknoten und mehrere Worker-Knoten. Die Masterknoten führt die Master-Daemons JobTracker und NameNode aus. Ein Worker-Knoten führt die DataNode- und TaskTracker-Daemons aus. In kleinen Clustern kann der Masterknoten auch die Worker-Daemons ausführen.

Hadoop-Umgebung

Eine Umgebung, die Sie für die Ausführung eines Mappings oder eines Profils auf einem Hadoop-Cluster konfigurieren können. Sie müssen Hadoop als Validierungs- und Laufzeitumgebung konfigurieren.

Hive

Eine Data Warehouse-Infrastruktur, die über Hadoop aufgebaut ist. Hive unterstützt eine SQL-ähnliche Sprache namens HiveQL für die Datenzusammenfassung, -abfrage, und -analyse.

Hive Executor

Eine Komponente des DTM, die ein Mapping oder ein Profil vereinfachen und dieses in einen Hive-Ausführungsplan umwandeln kann, der auf einem Hadoop-Cluster ausgeführt wird.

Hive-Aufgabe

Eine Aufgabe im Hive-Ausführungsplan. Ein Hive-Ausführungsplan umfasst viele Hive-Aufgaben. Eine Hive-Aufgabe enthält ein Hive-Skript.

Hive-Ausführungsplan

Eine Reihe von Hive-Aufgaben, die der Hive Executor nach der Verarbeitung eines Mappings oder eines Profils generiert. Ein Hive-Ausführungsplan kann auch als Hive-Arbeitsablauf bezeichnet werden.

Hive-Skripts

Skript in Hive-Abfragesprache, das Hive-Abfragen und Hive-Befehle zur Ausführung des Mappings enthält.

Indirekte Übereinstimmung

Eine Übereinstimmung bei Ergebnissen der Ergebnissuche, die mit demjenigen Objekt verknüpft ist, das mit einigen oder allen Suchabfragen übereinstimmt.

Informatica Administrator

Informatica Administrator (das Administrator Tool) ist eine Anwendung, die die administrativen Tasks für Domänenobjekte, z. B. Dienste, Knoten, Lizenzen und Gitter, konsolidiert. Sie verwalten die Domäne und die Sicherheit der Domäne mithilfe des Administrator-Tools.

Informatica Developer

Informatica Developer (das Developer Tool) ist eine Anwendung, mit der Sie Datenintegrationslösungen entwerfen. Die Objekte, die Sie im Developer Tool erstellen, werden im Model Repository gespeichert.

Informatica Mass Ingestion

Informatica Mass Ingestion (das Massenerfassungs-Tool) ist eine Anwendung, die Sie zum Konfigurieren, Bereitstellen, Ausführen und Überwachen von Massenerfassungsspezifikationen verwenden können.

Informatica Monitoring-Tool

Informatica Monitoring (das Monitoring Tool) ist eine Anwendung, die eine direkte Verknüpfung zur Registerkarte „Verwalten“ des Administrator Tools bereitstellt. Auf der Registerkarte „Überwachen“ werden Eigenschaften, Laufzeitstatistiken und Laufzeitberichte zu den Integrationsobjekten angezeigt, die in einem Datenintegrationsdienst ausgeführt werden.

Inkrementelle Anwendung

Eine Anwendung, die durch Bereitstellen eines Anwendungs-Patchs im Datenintegrationsdienst aktualisiert werden kann.

Intelligente Struktur

Ein Modell des Musters und der Typen von Feldern mit Daten, die von der intelligenten Strukturerkennung in einer Eingabedatei erkannt werden. Das Modell enthält je nach der Organisation der Daten in der Datei einfache und komplexe Elemente.

Intelligente Strukturerkennung

Ein Dienst in Informatica Intelligent Cloud Services, der Algorithmen für maschinelles Lernen zum automatischen Erkennen der Informationstypen in einer Eingabedatei verwendet. Bei der intelligenten Strukturerkennung werden eine intelligente Struktur sowie ein Modell des Musters und der Typen von Feldern mit in der Datei erkannten Daten erstellt. Das Modell enthält je nach der Organisation der Daten in der Datei einfache und komplexe Elemente.

JobTracker

Ein Hadoop-Dienst, der die Mapping- und Reduzierungsaufgaben koordiniert und diese für die Ausführung auf TaskTrackers plant.

Join-Profil

Ein Profiltyp, der den Grad der Überschneidung zwischen einer Gruppe von einer oder mehreren Spalten in einer Datenquelle und eine ähnliche Gruppe in derselben oder einer anderen Datenquelle festlegt.

Knoten

Eine Darstellung auf einer Ebene in der Hierarchie einer Web-Dienst-Meldung.

Knotenrolle

Der Zweck eines Knotens. Ein Knoten mit der Dienstrolle kann Anwendungsdienste ausführen. Ein Knoten mit der Berechnungsrolle kann Berechnungen durchführen, die von Remote-Anwendungsdiensten angefragt werden. Ein Knoten mit beiden Rollen kann Anwendungsdienste ausführen und lokal Berechnungen für diese Dienste durchführen.

Konditionaler Sequenzfluss

Ein Sequenzfluss, der einen Ausdruck beinhaltet, den der Data Integration Service als "true" oder "false" bewertet. Wenn der Ausdruck als "true" bewertet wird, führt der Data Integration Service das nächste Objekt im Arbeitsablauf aus. Wenn der Ausdruck als "false" bewertet wird, führt der Data Integration Service das nächste Objekt im Arbeitsablauf nicht aus.

konfiguriertes Datenobjekt

Ein physisches Datenobjekt, das ein oder mehrere relationale Ressourcen oder relationale Datenobjekte als Quellen verwendet. Sie können mit einem konfigurierten Datenobjekt beispielsweise Daten aus entsprechenden Ressourcen oder Filterzeilen verknüpfen. Ein konfiguriertes Datenobjekt verwendet eine einzelne Verbindung und SQL-Anweisung für die Quelltabellen.

kostenbasierte Optimierung

Eine Optimierungsmethode, mit der die Laufzeit von Mappings verringert wird, die Join-Vorgänge ausführen. Mit kostenbasierter Optimierung erstellt der Data Integration Service unterschiedliche Pläne zum Ausführen eines Mappings und berechnet die Kosten für die einzelnen Pläne. Der Data Integration Service führt den Plan aus, der die geringsten Kosten aufweist. Der Data Integration Service berechnet die Kosten auf Grundlage von Datenbankstatistiken, E/A, CPU, Netzwerk und Speicher.

Laufzeitanwendung

Eine Anwendung, die auf einem Datenintegrationsdienst bereitgestellt wird und Laufzeitinstanzen von Anwendungsobjekten enthält.

Laufzeitumgebung

Die Umgebung, die Sie für die Ausführung eines Mappings oder eines Profils konfigurieren. Die Laufzeitumgebung kann nativ oder Hive sein.

Laufzeitverknüpfung

Eine Verknüpfung von Gruppen, die eine Richtlinie oder einen Parameter oder beides verwendet, um zu bestimmen, welche Ports zwischen den Gruppen zur Laufzeit verknüpft werden sollen.

Lesezuordnung eines logischen Datenobjekts

Ein Mapping, das eine Datenansicht über ein logisches Datenobjekt bietet. Es enthält ein oder mehrere logische Datenobjekte als Quellen und ein logisches Datenobjekt als Mapping-Ausgabe.

Logischer Data Transformation Manager (LDTM)

Eine Dienstkomponente des Datenintegrationsdiensts, die Jobs optimiert und kompiliert und diese anschließend an Data Transformation Manager (DTM) für die Ausführung sendet.

logisches Datenobjekt

Ein Objekt, das eine logische Entität in einem Unternehmen beschreibt. Es beinhaltet Attribute und Schlüssel und beschreibt Beziehungen zwischen Attributen.

logisches Datenobjektmodell

Ein Datenmodell, dass die Daten in einem Unternehmen und die Beziehung zwischen den Daten beschreibt. Es enthält logische Datenobjekte und definiert ihre Beziehungen untereinander.

Mapplet

Ein wiederverwendbares Objekt, das einen Satz von Umwandlungen enthält, die Sie in mehreren Mappings verwenden oder als Regel validieren können.

MapReduce

Ein Programmierungsmodell für die parallele Verarbeitung großer Datenmengen.

MapReduce-Job

Eine Arbeitseinheit, die aus den Eingabedaten, dem MapReduce-Programm und Konfigurationsinformationen besteht. Hadoop führt den MapReduce-Job mithilfe der Unterteilung in Mapping- und Reduzierungsaufgaben aus.

Massenerfassung

Die Verschiebung großer Datenmengen zwischen einer relationalen Datenbank und einem Data Lake oder einem Hadoop-Cluster.

Massenerfassungsdienst

Ein Anwendungsdienst, der die Massenerfassungsspezifikationen verwaltet, die im Massenerfassungs-Tool erstellt werden. Der Massenerfassungsdienst validiert Spezifikationen, plant Spezifikationen zur Ausführung in einem Datenintegrationsdienst und überwacht die Erfassungsstatistiken.

Massenerfassungsspezifikation

Ein Konfiguration, die angibt, wie Quelldaten aus einer relationalen Datenbank an einem bestimmten Speicherort in einem Data Lake oder einem Hadoop-Cluster erfasst werden.

Metastore

Eine Datenbank, die Hive für das Speichern von in HDFS gespeicherten Metadaten der Hive-Tabellen verwendet. Metastores können lokal, eingebettet oder ausgelagert sein.

Metrik

Eine Spalte einer Datenquelle oder Ausgabe einer Regel, die Teil einer Scorecard ist

Metrik-Score

Der Prozentsatz der gültigen Werte in einer Metrik

Metrikgewichtung

Eine Ganzzahl größer als oder gleich 0 für eine Metrik. Eine Metrikgewichtung definiert den Beitrag der Metrik zum Metrikgruppen-Score.

Metrikgruppe

Eine benutzerdefinierte Gruppe von Metriken

Metrikgruppen-Score

Der errechnete gewichtete Durchschnitt aller Metrik-Scores in der Metrikgruppe

Modellrepository-Dienst

Ein Anwendungsdienst in der Informatica-Domäne, der das Model Repository ausführt und verwaltet. Im Model Repository werden die von Informatica-Produkten erstellten Metadaten in einer relationalen Datenbank gespeichert, um die Zusammenarbeit zwischen den Produkten zu ermöglichen.

NameNode

Ein Knoten im Hadoop-Cluster, der das Dateisystem-Namespace verwaltet und die Dateisystem-Baumstruktur sowie die Metadaten für alle Dateien und Verzeichnisse in der Baumstruktur pflegt.

Native Umgebung

Die Standardumgebung in der Informatica-Domäne für die Ausführung von Mappings, Arbeitsabläufen oder Profilen. Der Datenintegrationsdienst führt die Extraktion, die Umwandlung und das Laden von Daten durch. Alternativ kann der Datenintegrationsdienst die Verarbeitung auch in eine nicht-native Umgebung verlagern, bei der es sich um einen verteilten Cluster außerhalb der Informatica-Domäne handelt, wie z. B. Hadoop oder Databricks.

Nicht-native Umgebung

Ein verteilter Cluster außerhalb der Informatica-Domäne, wie z. B. Hadoop oder Databricks, auf den der Datenintegrationsdienst die Laufzeitverarbeitung verlagern kann. Wenn der Datenintegrationsdienst die Verarbeitung nicht auf eine nicht-native Umgebung verlagert, wird der Job in der nativen Umgebung der Informatica-Domäne verarbeitet.

Ordner

Ein Container für Objekte im Modellrepository. Verwenden Sie Ordner, um Objekte in einem Projekt zu organisieren, und erstellen Sie Ordner, um Objekte basierend auf den jeweiligen Geschäftsanforderungen zu gruppieren.

Partitionierung

Der Vorgang der Unterteilung der zugrunde liegenden Daten in Teilmengen, die in mehreren Verarbeitungs-Threads ausgeführt werden können. Wenn Administratoren den Datenintegrationsdienst für das Maximieren des Parallelismus aktivieren, erhöht sich die Anzahl der Verarbeitungs-Threads, wodurch die Mapping- und Profiling-Leistung optimiert werden kann.

Partitionspunkt

Eine Begrenzung zwischen Phasen in einer Mapping-Pipeline. Wenn die Partitionierung aktiviert ist, kann der Datenintegrationsdienst die Neuverteilung von Datenzeilen an Partitionspunkte durchführen.

physisches Datenobjekt

Eine physische Darstellung von Daten, die verwendet wird, um aus Ressourcen zu lesen, Ressourcen zu suchen oder in Ressourcen zu schreiben.

Pipeline

Eine Quelle und sämtliche Umwandlungen und Ziele, die Daten aus dieser Quelle empfangen. Jedes Mapping enthält eine oder mehrere Pipelines.

Präprozessor

Ein Dokumentprozessor, mit dem ein Quelldokument vor der eigentlichen Datenumwandlung umfassend bearbeitet wird.

Primärschlüsselerkennung

Ein Prozess zur Erkennung einer Spalte oder Kombination von Spalten mit einer einmaligen Kennung für eine Zeile in einer Datenquelle.

Profil

Ein Objekt, das Regeln zum Erkennen von Mustern in einer Datenquelle enthält. Führen Sie ein Profil zum Evaluieren der Datenstruktur aus und stellen Sie sicher, dass Datenspalten die erwarteten Informationstypen enthalten.

Profiling-Regel

Wiederverwendbare Geschäftslogik, die Bedingungen definiert, welche auf Daten angewendet werden, wenn ein Profil ausgeführt wird. Verwenden Sie Regeln zur weiteren Validierung von Daten in einem Profil und zur Messung des Fortschritts in der Datenqualität. Sie können eine Regel in Informatica Analyst oder Informatica Developer erstellen.

Profiling-Warehouse

Eine relationale Datenbank, die Profiling-Informationen speichert, wie beispielsweise Profil- und Scorecard-Ergebnisse.

Projekt

Der oberste Container zum Speichern von in Informatica Analyst und Informatica Developer erstellten Objekten. Erstellen Sie Projekte basierend auf Geschäftszielen oder Geschäftsanforderungen. Projekte werden in Informatica Analyst und Informatica Developer angezeigt.

Pushdown-Optimierung

Eine Optimierungsmethode, die Umwandlungslogik in eine Quell- oder Target-Datenbank überträgt. Der Data Integration Service übersetzt mit Pushdown-Optimierung die Umwandlungslogik in SQL-Abfragen und sendet diese an die Datenbank. Die Datenbank führt die SQL-Abfragen aus, um die Daten zu verarbeiten.

Quelldokument

Ein Dokument, das die Eingabe für eine Datenprozessorumwandlung ist.

Rastersegment

Teil einer Rasterzuordnung in einer Gitteraufgabe.

Rasterzuordnung

Ein Informatica-Mapping, das die Blaze-Engine kompiliert und über einen Cluster von Knoten hinweg verteilt.

Ressourcenmanager-Dienst

Ein Systemdienst, der Rechneressourcen in der Domäne verwaltet und Jobs verteilt, um eine optimale Leistung und Skalierbarkeit erreichen zu können. Der Ressourcenmanager-Dienst sammelt Informationen über Knoten mit der Berechnungsrolle. Der Dienst gleicht die Jobanforderungen mit der Ressourcenverfügbarkeit ab und ermittelt so den besten Berechnungsknoten für die Ausführung des Jobs. Der Ressourcenmanager-Dienst kommuniziert mit Berechnungsknoten in einem Datenintegrationsdienstgitter. Aktivieren Sie den Ressourcenmanager-Dienst, wenn Sie ein Datenintegrationsdienstgitter für die Ausführung von Jobs in separaten Remoteprozessen konfigurieren.

Schlüsselkandidat

Eine Spalte oder eine Reihe von Spalten, die jede Quellzeile in einer Datenbanktabelle eindeutig identifiziert.

Schreibzuordnung eines logischen Datenobjekts

Ein Mapping, das die Daten in Ziele schreibt, indem ein logisches Datenobjekt als Eingabe verwendet wird. Es enthält ein oder mehrere logische Datenobjekte als Eingabe und ein physisches Datenobjekt als Ziel.

Scorecard

Eine grafische Darstellung von gültigen Werten für eine Spalte oder die Ausgabe einer Regel in Profilergebnissen. Mit Scorecards können Sie den Fortschritt der Datenqualität messen.

Scorecard-Herkunft

Hierbei handelt es sich um ein Diagramm, das für eine Metrik oder Metrikgruppe in einer Scorecard den Ursprung der Daten zeigt, den Pfad beschreibt und den Datenfluss verdeutlicht. In der Scorecard-Herkunftsanalyse stellen Kästchen oder Knotenpunkte verschiedene Objekte dar. Pfeile symbolisieren Datenflussbeziehungen.

Semi-Join-Optimierung

Eine Optimierungsmethode, mit der die Anzahl der aus der Quelle extrahierten Zeilen reduziert wird. Der Data Integration Service ändert mit Semi-Join-Optimierung die Join-Vorgänge in einem Mapping. Der Data Integration Service wendet die Semi-Join-Optimierungsmethode auf eine Joiner-Umwandlung an, wenn eine größere Eingabegruppe Zeilen enthält, die nicht mit einer kleineren Eingabegruppe in der Join-Bedingung übereinstimmen. Der Data Integration Service liest die Zeilen aus der kleineren Gruppe, sucht die übereinstimmenden Zeilen in der größeren Gruppe und führt den Join-Vorgang aus.

Sequenzfluss

Ein Konnektor zwischen Arbeitsablaufobjekten, der die Reihenfolge angibt, in der der Data Integration Service Objekt ausführt. Der Editor zeigt Sequenzflüsse als Pfeile an.

Sonderfall

Ein Muster, ein Wert oder eine Häufigkeit für eine Spalte in den Profilergebnissen wird als Sonderfall angesehen, wenn das Muster, der Wert oder die Häufigkeit außerhalb des erwarteten Wertebereichs liegt.

Spaltennamenregel:

Wiederverwendbare Business-Logik, die eine Spalte anhand ihres Namens als zu einer bestimmten Datendomäne gehörend identifiziert.

Spaltenprofil

Ein Profiltyp, der die Eigenschaften von Spalten in einer Datenquelle bestimmt, wie z. B. Werthäufigkeit, Prozentsätze, Muster und Datentypen.

Sparkline

Sparklines sind Liniendiagramme, die die Variation in einem Nullwert, eindeutigen Wert oder nicht eindeutigen Wert in den fünf letzten aufeinanderfolgenden Profilausführungen anzeigen.

SQL-Datendienst

Eine virtuelle Datenbank, die Sie abfragen können. Sie enthält virtuelle Objekte und bietet eine einheitliche Ansicht von Daten aus ungleichartigen, heterogenen Datenquellen.

SQL-Dienstmodul

Der Komponentendienst im Data Integration Service, der die SQL-Abfragen verwaltet, die von Client-Tools anderer Hersteller an einen SQL-Datendienst gesendet wurden.

Standardsequenzfluss

Die ausgehende Sequenzfluss aus einem exklusiven Gateway, der immer als "true" bewertet wird. Wenn alle anderen konditionalen Sequenzflüsse mit "false" bewertet werden, führt der Data Integration Service das mit dem ausgehenden Standardsequenzfluss verbundene Objekt aus.

Startkomponente

Die ausführbare Komponente, die Data Transformation bei einer Datenprozessorumwandlung zuerst startet.

statusbehafteter variabler Port

System-Arbeitsablaufvariable

Eine Arbeitsablaufvariable, die Informationen zur Systemlaufzeit zurückgibt, wie zum Beispiel die Arbeitsablaufinstanz-ID, der Benutzer, der den Arbeitsablauf gestartet hat, oder die Startzeit des Arbeitsablaufs.

Systemdienst

Ein Anwendungsdienst, der in der Domäne über eine einzelne Instanz verfügen kann. Die Systemdienste werden beim Erstellen der Domäne angelegt. Systemdienste können aktiviert, deaktiviert und konfiguriert werden.

Tasklet

Eine Partition eines Rastersegments, die auf einem separaten DTM ausgeführt wird.

TaskTracker

Ein Knoten im Hadoop-Cluster, der Aufgaben wie z. B. Mapping- oder Reduzierungsaufgaben durchführt. TaskTrackers senden Fortschrittsberichte an den JobTracker.

teambasierte Entwicklung

Die Zusammenarbeit von Teammitgliedern an einem Entwicklungsprojekt. Die Zusammenarbeit beinhaltet eine breite Funktionspalette: von der Versionsverwaltung bis hin zum Auschecken und Einchecken von Repository-Objekten, um nur einige zu nennen.

Umwandlung

Ein Repository-Objekt in einem Mapping, das Daten generiert, ändert oder übergibt. Jede Umwandlung führt eine andere Funktion aus.

Validierungsumgebung

Die Umgebung, die Sie für die Validierung eines Mappings oder eines Profils konfigurieren. Validieren Sie ein Mapping bzw. ein Profil, um sicherzustellen, dass es in einer Laufzeitumgebung ausgeführt werden kann. Die Validierungsumgebung kann Hive, nativ oder beides sein.

Verteiltes Hadoop-Dateisystem (HDFS)

Ein verteiltes Dateispeichersystem, das von Hadoop-Anwendungen verwendet wird.

virtuelle Daten

Die Informationen, die Sie erhalten, wenn Sie in einem SQL-Datendienst virtuelle Tabellen abfragen oder gespeicherte Prozeduren ausführen.

virtuelle Datenansicht

Eine durch einen SQL-Datendienst definierte virtuelle Datenbank, die Sie wie eine physische Datenbank abfragen können.

virtuelle Datenbank

Ein SQL-Datendienst, den Sie abfragen können. Sie enthält virtuelle Objekte und bietet eine einheitliche Ansicht von Daten aus ungleichartigen, heterogenen Datenquellen.

virtuelle gespeicherte Prozedur

Ein Satz von prozeduralen oder Datenflussinstruktionen in einem SQL-Datendienst.

virtuelle Tabelle

Eine Tabelle in einer virtuellen Datenbank.

virtuelles Schema

Ein Schema in einer virtuellen Datenbank, das die Datenbankstruktur definiert.

virtuelles Tabellen-Mapping

Ein Mapping, das eine virtuelle Tabelle als Target enthält.

Vollständige Anwendung

Eine Anwendung, die nach dem Bearbeiten von Anwendungsobjekten erneut für den Datenintegrationsdienst bereitgestellt werden muss.

Vorgangs-Mapping

Ein Mapping, das die Web-Dienst-Operation für den Web-Dienst Client ausführt. Ein Operation-Mapping kann eine Eingabeumwandlung, eine Ausgabeumwandlung und mehrere Fehlerumwandlungen enthalten.

Vorhersage-Expression

Eine Expression, die die Daten in einem Mapping filtert. Eine Vorhersage-Expression gibt true oder false zurück.

Vorhersageoptimierung

Eine Optimierungsmethode, die die Vorhersage-Expressionen in einem Mapping vereinfacht oder neu schreibt. Der Data Integration Service versucht mit Vorhersageoptimierung zu einem möglichst frühen Zeitpunkt Vorhersage-Expressionen anzuwenden, um die Mapping-Leistung zu erhöhen.

Web-Dienst-Modul

Eine Komponente des Data Integration Service, die Web-Dienst-Operationsanfragen verwaltet, die von einem Web-Dienst-Client an den Web-Dienst gesendet werden.

Web-Dienst-Umwandlung

Eine Umwandlung, die Web-Dienst-Anfragen oder Web-Dienst-Antworten verarbeitet. Beispiele für Web-Dienst-Umwandlungen sind Eingabeumwandlung, Ausgabeumwandlung, Fehlerumwandlung und die Web-Dienst-Verbraucher-Umwandlung.

Wiederherstellung

Der Prozess des Validierens und Verwaltens erkannter Metadaten einer Datenquelle, um die Metadaten für ihre Verwendung und die Berichterstellung anzupassen.

XMap

Ein ein Datenprozessor-Umwandlungsobjekt, das XML-Eingabedokument einem anderen XML-Dokument zuordnet.

XML-Schema

Eine Definition der in XML-Dokumenten verwendeten Elemente, Attribute und Struktur. Das Schema entspricht dem Standard-XML-Schema des World Wide Web Consortium und wird als XSD-Datei gespeichert.

XPath

Eine Abfragesprache, die verwendet wird, um Knoten in einem XML-Dokument auszuwählen und Berechnungen durchzuführen.

XSD-Schemadatei

Eine XSD-Datei mit einem XML-Schema, die die Elemente, die Attribute und die Struktur von XML-Dokumenten definiert.

Zuordnung

Ein Satz von Eingaben und Ausgaben, die durch Umwandlungsobjekte verknüpft sind, die die Regeln für die Datenumwandlung definieren.

Zuordnung logischer Datenobjekte

Ein Mapping, das ein logisches Datenobjekt mit einem oder mehreren physischen Datenobjekten verknüpft. Es kann Umwandlungslogik enthalten.