Begriffsglossar
Definition für geschachtelte Datentypen
Eine Definition für komplexe Datentypen, die auf andere Definitionen für komplexe Datentypen verweist.
Definition für komplexe Datentypen
Eine wiederverwendbare Darstellung des Schemas der Daten, auf die Sie in einem struct-Port oder in einem komplexen Port, der Elemente des Typs struct enthält, verweisen. Einer oder mehrere komplexe Ports können die Definition für komplexe Datentypen verwenden.
Definition für rekursive Datentypen
Eine Definition für geschachtelte Datentypen, in der eine der Definitionen für komplexe Datentypen auf einer Ebene mit der eines übergeordneten Datentyps identisch ist.
einfacher Datentyp
Ein Datentyp, der es Ihnen ermöglicht, einen einzelnen Datenwert in einer einzelnen Spaltenposition darzustellen.
geschachtelter Datentyp
Ein komplexer Datentyp, der mindestens ein Element eines komplexen Datentyps enthält. Ein Beispiel ist ein struct-Datentyp, der ein Element vom Typ Array enthält.
geschachtelter komplexer Port
Ein komplexer Port, der eine Definition für geschachtelte komplexe Datentypen enthält.
hierarchische Daten
Eine Gruppe von Daten, die hierarchisch verwandt sind. Die hierarchische Beziehung wird als Schema dargestellt. Informatica-Transformationen verwenden komplexe Datentypen, um hierarchische Daten darzustellen.
komplexe Funktion
Ein Typ einer vordefinierten Funktion, in der die Eingabe oder der Rückgabetyp ein komplexer Datentyp ist.
komplexer Datentyp
Ein Datentyp, der es Ihnen ermöglicht, mehrere Datenwerte in einer einzelnen Spaltenposition darzustellen. Die Datenwerte werden als Elemente bezeichnet.
komplexer Operator
Ein Typ von Operator, um auf Elementnamen zu verweisen oder auf Elemente in einem komplexen Datentyp zuzugreifen.
komplexer Port
Ein Port-Typ, der einem komplexen Datentyp, z. B. Array, Struktur oder Zuordnung, zum Übergeben hierarchischer Daten zugewiesen wird.
Schema
Eine Definition der Struktur von Daten. Komplexe Ports des struct-Datentyps verwenden Definitionen für komplexe Datentypen zur Schemadarstellung.
Typdefinitionsbibliothek
Ein Objekt im Modellrepository, in dem Definitionen für komplexe Datentypen für eine Zuordnung oder ein Mapplet gespeichert werden.
Typkonfiguration
Eine Reihe komplexer Porteigenschaften, die den Datentyp der komplexen Datentypelemente oder das Schema der Daten angeben.
Abgeleiteter Schlüssel
Eine vom Analyst-Tool oder Developer-Tool als Schlüsselkandidat auf der Grundlage von Spaltendaten abgeleitete Spalte oder Reihe von Spalten.
Abhängige Spalte
In einer funktionalen Abhängigkeit die Spalte mit den Werten, die von einer Determinantenspalte festgelegt werden.
anwendung
Ein Objekt, das einem Datenintegrationsdienst bereitgestellt werden kann. Es kann Datenobjekte, Zuordnungen, SQL-Datendienste, Webdienste und Arbeitsabläufe enthalten.
Anwendungs-Patch
Ein Objekt, das einem Datenintegrationsdienst bereitgestellt werden kann. Es enthält die Metadaten, die zum Aktualisieren einer bereitgestellten inkrementellen Anwendung verwendet werden können.
Anwendungsdienst
Ein Dienst, der auf einem oder mehreren Knoten in der Informatica-Domäne ausgeführt wird. Sie erstellen und verwalten Anwendungsdienste in Informatica Administrator oder über das infacmd-Befehlsprogramm. Anwendungsdienste beinhalten Dienste, die über mehrere Instanzen in der Domäne verfügen können, und Systemdienste, die über eine einzelne Instanz in der Domäne verfügen können. Konfigurieren Sie jeden Anwendungsdienst basierend auf den Anforderungen Ihrer Umgebung.
Arbeitsablauf
Eine grafische Darstellung einer Reihe von Ereignissen, Aufgaben und Entscheidungen, die einen Geschäftsprozess definieren. Verwenden Sie das Developer Tool, um Objekte einem Arbeitsablauf hinzuzufügen und die Objekte mit Sequenzflüssen zu verbinden. Der Datenintegrationsdienst verwendet die im Arbeitsablauf konfigurierten Anweisungen, um die Objekte auszuführen.
Arbeitsablauf-Dienstmodul
Eine Komponente im Data Integration Service, der Anforderungen zur Ausführung von Arbeitsabläufen verwaltet.
Arbeitsablaufinstanz
Die Darstellung eines Arbeitsablaufs zur Laufzeit. Wenn Sie einen Arbeitsablauf in einer bereitgestellten Anwendung ausführen, führen Sie eine Instanz des Arbeitsablaufs aus. Sie können mehrere Instanzen desselben Arbeitsablaufs gleichzeitig ausführen.
Arbeitsablaufinstanz-ID
Eine Zahl, die eine ausgeführte Arbeitsablaufinstanz eindeutig identifiziert.
Arbeitsablaufparameter
Ein konstanter Wert, den Sie vor der Ausführung des Arbeitsablaufs ausführen. Parameter behalten denselben Wert während der gesamten Ausführung des Arbeitsablaufs bei. Definieren Sie den Wert des Parameters in einer Parameterdatei. Alle Arbeitsablaufparameter sind benutzerdefiniert.
Arbeitsablaufvariable
Ein Wert, der sich während eines Arbeitsablaufs ändern kann. Verwenden Sie Arbeitsablaufvariablen, um auf Werte und Laufzeitinformationen zu Datensätzen zu verweisen. Sie können System- oder benutzerdefinierte Arbeitsablaufvariablen verwenden.
Audit
Eine Reihe von Regeln und Bedingungen, die Daten an der Quelle und am Ziel eines Mappings validieren. Auditregeln berechnen einen Gesamtwert für eine Datenspalte in der Quelle oder im Ziel. Die Auditbedingungen vergleichen mehrere Auditregeln miteinander oder Auditregeln mit konstanten Werten.
Aufgabe
Ein Arbeitsablaufobjekt, das eine einzelne Arbeitseinheit im Arbeitsablauf ausführt, wie zum Beispiel die Ausführung eines Mappings, das Senden einer E-Mail oder das Ausführen eines Shell-Befehls. Eine Aufgabe stellt eine Aktion dar, die während eines Arbeitsablaufs durchgeführt wird. Der Editor zeigt Aufgaben als Quadrate an.
Aufgabenausgabe
Daten, die von einer Aufgabe an Arbeitsablaufvariablen übergeben werden. Beim Konfigurieren einer Aufgabe geben Sie die Aufgabenausgabewerte an, die Sie Arbeitsablaufvariablen zuweisen möchten. Wenn die Aufgabe abgeschlossen wird, kopiert der Data Integration Service die Aufgabenausgabewerte in die Arbeitsablaufvariablen. Der Data Integration Service kann auf diese Werte über die Arbeitsablaufvariablen zugreifen, wenn er Ausdrücke konditionalen Sequenzflüssen bewertet und weitere Objekte im Arbeitsablauf ausführt.
Aufgabeneingabe
Daten, die von Arbeitsablaufparametern und -variablen an eine Aufgabe übergeben werden. Die Aufgabe verwendet die Eingabedaten, um eine Arbeitseinheit abzuschließen.
Ausgabedokument
Ein Dokument, das das Ergebnis einer Datenprozessorumwandlung ist.
Befehlsaufgabe
Die Vorverarbeitungs- oder Nachbearbeitungsaufgabe für lokale Daten für einen Blaze-Engine-Arbeitsablauf.
Beispiel-Quelldokument
Ein Beispiel für ein Dokument, das von einer Datenprozessorumwandlung verarbeitet wird.
benutzerdefinierte Arbeitsablaufvariable
Eine Arbeitsablaufvariable, die die von Ihnen angegebenen Aufgabenausgabekriterien erfasst. Nachdem Sie eine benutzerdefinierte Arbeitsablaufvariable erstellt haben, konfigurieren Sie den Arbeitsablauf, um der Variable einen Laufzeitwert zuzuweisen.
Benutzerrolle
Eine Sammlung von Berechtigungen, die Sie einem Benutzer oder einer Gruppe zuordnen. Sie ordnen Benutzern und Gruppen für die Domäne und für einige Anwendungsdienste in der Domäne Rollen zu.
bereitstellen
Das Verfügbarmachen von Objekten in einer Anwendung für Endbenutzer. Endbenutzer können dann je nach den Typen von Objekten in der Anwendung Abfragen für die Objekte ausführen, auf Web-Dienste zugreifen oder Mappings oder Arbeitsabläufe ausführen.
Betriebssystemprofil
Ein Sicherheitstyp, der vom Datenintegrationsdienst unter UNIX oder Linux zum Isolieren der Laufzeitbenutzerumgebung verwendet wird. Das Betriebssystemprofil enthält den Namen des Betriebssystembenutzers, Dienstprozessvariablen, Umgebungsvariablen und Berechtigungen. Der Datenintegrationsdienst führt Zuordnungen, Arbeitsabläufe, Profiling-Jobs und Scorecards mit den Systemberechtigungen des Betriebssystembenutzers und den Eigenschaften aus, die im Betriebssystemprofil definiert sind.
Big Data
Ein Datensatz, der so groß und komplex ist, dass er nicht mit standardmäßigen Datenbankverwaltungstools verarbeitet werden kann.
Blaze Executor
Eine Komponente des DTM, die ein Mapping vereinfachen und es in einen Blaze-Ausführungsplan umwandeln kann, der auf einem Hadoop-Cluster ausgeführt wird.
CompressionCodec
Hadoop-Komprimierungsschnittstelle. Bei einem Codec handelt es sich um die Implementierung eines Komprimierungs-Dekomprimierungs-Algorithmus. In Hadoop wird ein Codec durch eine Implementierung der CompressionCodec-Schnittstelle dargestellt.
Container
Eine Zuweisung von Speicher- und CPU-Ressourcen auf einem Knoten mit der Berechnungsrolle. Ein Anwendungsdienst verwendet die Container, um Berechnungen auf dem Knoten remote durchzuführen. Beispiel: Ein Datenintegrationsdienst, der auf einem Gitter ausgeführt wird, kann ein Mapping innerhalb eines Containers auf einem Knoten mit Berechnungsrolle remote ausführen.
Data Transformation Manager (DTM) für die Ausführung
Die Berechnungskomponente des Datenintegrationsdiensts, die Daten für den Abschluss eines Datenumwandlungsjobs extrahiert, umwandelt und lädt.
DataNode
Ein HDFS-Knoten, der Daten im Hadoop-Dateisystem speichert. Ein HDFS-Cluster kann über mehr als einen DataNode mit darauf replizierten Daten verfügen.
Datendienst
Eine Sammlung von wiederverwendbaren Vorgängen, die Sie für den Zugriff auf Daten und die Umwandlung von Daten ausführen können. Ein Datendienst stellt ein einheitliches Datenmodell bereit, auf das Sie über einen Web-Dienst zugreifen können oder für das Sie eine SQL-Abfrage ausführen können.
Datendomäne
Ein vordefiniertes oder benutzerdefiniertes Modellrepository-Objekt, das die funktionelle Bedeutung einer Spalte auf der Basis der Spaltendaten oder des Spaltennamens darstellt. Beispiele hierfür sind Sozialversicherungsnummer, Kreditkartennummer und E-Mail-ID.
Datendomänenerkennung
Der Prozess, der alle Datendomänen identifiziert, die mit einer Spalte auf der Basis der Spaltenwerte oder des Namens verknüpft sind.
Datendomänenglossar
Ein Container für alle Datendomänen und Datendomänengruppen im Analyst oder Developer Tool.
Datendomänengruppe
Eine Sammlung von Datendomänen unter einer bestimmten Datendomänenkategorie.
Datenintegrationsdienst
Ein Anwendungsdienst, der Datenintegrationsaufgaben für Informatica Analyst, Informatica Developer und externe Clients ausführt. Zu den Datenintegrationsaufgaben gehören die Datenvorschau sowie das Ausführen von Mappings, Profilen, SQL-Datendiensten, Webdiensten und Arbeitsabläufen.
Datenobjekt-Lesevorgang
Repository-Objekt, das Eigenschaften enthält, die zum Ausführen bestimmter Laufzeitvorgänge für Quellen erforderlich sind. Ein Datenobjekt-Lesevorgang ist einem Quell-Datenobjekt zugeordnet.
Datenobjekt-Schreibvorgang
Repository-Objekt, das Eigenschaften enthält, die zum Ausführen bestimmter Laufzeitvorgänge für Ziele erforderlich sind. Ein Datenobjekt-Schreibvorgang wird einem Ziel-Datenobjekt zugeordnet.
Datenobjektprofil
Ein Repository-Objekt, das den Typ der Analyse definiert, die Sie mit einer Datenquelle ausführen.
Datenprozessor-Ereignis
Ein Vorkommnis, das während einer Datenprozessorumwandlung eintritt.
Datenregel:
Wiederverwendbare Business-Logik, die eine Spalte anhand ihrer Werte als zu einer bestimmten Datendomäne gehörend identifiziert.
Determinantenspalte
In einer funktionalen Abhängigkeit eine Gruppe von Spalten, die den Wert der abhängigen Spalte festlegt. Wenn der Determinant keine Spalten aufweist, handelt es sich bei der abhängigen Spalte um eine Konstante.
Direkter Match
In einer globalen Suche ist ein direkter Match ein Objekt, das mit der gesamten Suchanfrage übereinstimmt. In der Erkennungssuche ist ein direkter Match eine Übereinstimmung mit einigen oder allen Metadaten des Objekts, das mit der Suchanfrage übereinstimmt.
Distribution von Cloudera einschließlich Apache Hadoop (CDH)
Cloudera-Version des Open-Source-Software-Frameworks für Hadoop.
Dokumentierter Schlüssel
Ein deklarierter Primärschlüssel in der Quelldatenbank.
Dokumentprozessor
Eine Komponente, die auf einem Dokument als Ganzem operiert. Im Allgemeinen nimmt sie vor dem Parsen vorläufige Umwandlungen vor.
DTM-Instanz
Eine bestimmte, logische Darstellung des Data Transformation Manager (DTM) für die Ausführung, den der Datenintegrationsdienst für die Ausführung eines Jobs erstellt. DTM-Instanzen können basierend darauf, wie Sie den Datenintegrationsdienst konfigurieren, im Datenintegrationsdienst-Prozess, in einem separaten DTM-Prozess auf dem lokalen Knoten oder in einem separaten DTM-Prozess auf einem Remoteknoten ausgeführt werden.
DTM-Prozess
Ein Betriebssystemprozess, der vom Datenintegrationsdienst zur Ausführung von DTM-Instanzen gestartet wird. Je nach Konfiguration Ihres Datenintegrationsdienstes kann der Dienst jede DTM-Instanz in einem separaten DTM-Prozess auf dem lokalen Knoten oder Remoteknoten ausführen.
dynamische E-Mail-Adresse
Eine in einem Arbeitsablaufparameter oder einer -variable definierte E-Mail-Adresse.
Dynamische Quelle
Eine Einfachdatei oder relationale Quelle für ein Mapping, das zur Laufzeit geändert werden kann. Lese- und Lookup-Umwandlungen können Definitionen oder Änderungen bei Metadaten direkt von der Quelle erhalten. Wenn Sie einen Parameter für die Quelle verwenden, können Sie die Quelle zur Laufzeit ändern.
Dynamischer E-Mail-Inhalt
In einem Arbeitsablaufparameter oder einer -variable definierter E-Mail-Inhalt.
dynamischer Empfänger
In einem Arbeitsablaufparameter oder einer -variable definierter Benachrichtigungsempfänger.
Dynamischer Port
Ein Port, der von einer vorgelagerten Umwandlung mindestens eine Spalte erhalten und für jede Spalte einen generierten Port erstellen kann.
Dynamisches Mapping
Ein Mapping, bei dem Sie Quellen, Ziele und Umwandlungslogik basierend auf von Ihnen definierten Parametern und Regeln zur Laufzeit ändern können. Sie können dynamische Zuordnungen konfigurieren, um Metadatenänderungen an Quellen und Zielen zuzulassen. Sie können die Ports bestimmen, die von einer Umwandlung empfangen und die in der Umwandlungslogik verwendet werden. Außerdem können Sie die Verknüpfungen festlegen, die zwischen Umwandlungsgruppen erstellt werden können.
Dynamisches Ziel
Eine Einfachdatei oder ein relationales Ziel für ein Mapping, das zur Laufzeit geändert werden kann. Schreibumwandlungen können Zielspalten basierend auf dem Mapping-Fluss oder von einem zugeordneten Ziel zur Laufzeit definieren. Schreibumwandlungen können auch die Zieltabelle zur Laufzeit entfernen und ersetzen.
Eingaberegel
Eine Regel für die Bestimmung darüber, welche generierten Ports innerhalb eines dynamischen Ports erstellt werden sollen.
Empfänger
Ein Benutzer oder eine Gruppe in der Informatica-Domäne, die während eines Arbeitsablaufs eine Benachrichtigung empfängt.
Enterprise-Erkennung
Der Prozess, der Spaltenprofilstatistiken, Datendomänen, Primärschlüssel und Fremdschlüssel in einer großen Anzahl von Datenquellen über mehrere Verbindungen oder Schemata hinweg findet.
Enterprise-Erkennungsprofil
Ein Profiltyp, der zum Durchführen einer Enterprise-Erkennung verwendet wird.
Entwurfszeitanwendung
Eine Anwendung, die im Developer Tool bearbeitet wird. Die Anwendung enthält Entwurfszeitinstanzen von Anwendungsobjekten.
Ereignis
Ein Arbeitsablaufobjekt startet oder beendet den Arbeitsablauf. Ein Ereignis stellt etwas dar, was passiert, wenn der Arbeitsablauf ausgeführt wird. Der Editor zeigt Ereignisse als Kreise an.
Ergebnissatz-Cache
Ein Cache, der die Ergebnisse jeder SQL-Datendienst-Abfrage oder SQL-Web-Dienst-Abfrage enthält. Der Data Integration Service gibt mit dem Ergebnissatz-Cache im Cache abgelegte Ergebnisse zurück, wenn Benutzer identische Abfragen ausführen. Der Ergebnissatz-Cache verringert die Laufzeit für identische Abfragen.
Erkennungssuche
Ein Suchtyp im Analyst-Tool, um Objekte anhand von direkten Übereinstimmungen mit der Suchabfrage sowie Beziehungen mit anderen Objekten, die mit der Suchabfrage übereinstimmen, zu identifizieren.
Erzeugter Port
Ein Port innerhalb eines dynamischen Ports, der eine einzelne Spalte darstellt. Das Developer Tool generiert Ports basierend auf einer oder mehreren Eingaberegeln.
Exklusives Gateway
Ein Gateway, das eine in einem Arbeitsablauf getroffene Entscheidung darstellt. Wenn ein exklusives Gateway den Arbeitsablauf aufteilt, trifft der Data Integration Service die Entscheidung, einen der ausgehenden Zweige zu übernehmen. Wenn ein exklusives Gateway den Arbeitsablauf zusammenführt, wartet der Data Integration Service auf den Abschluss eines eingehenden Zweigs, bevor der ausgehende Zweig ausgelöst wird.
Fremdschlüsselerkennung
Der Prozess, der Spalten in einer Datenquelle sucht, die mit den Primärschlüssel-Spalten in der übergeordneten Datenquelle übereinstimmt.
frühe Auswahloptimierung
Eine Optimierungsmethode, mit der die Anzahl von Zeilen reduziert wird, die das Mapping durchlaufen. Mit früher Auswahloptimierung bringt der Data Integration Service Filter näher an die Mapping-Quelle in der Pipeline.
frühe Projektionsoptimierung
Eine Optimierungsmethode, mit der die Menge von Daten zwischen Umwandlungen im Mapping reduziert wird. Mit früher Projektionsoptimierung erkennt der Data Integration Service nicht verwendete Ports und entfernt die Links zwischen den Ports in einem Mapping.
Funktionale Abhängigkeit
Die Beziehung zwischen einer Gruppe von Spalten in einer bestimmten Tabelle, in der die Determinantenspalte die abhängige Spalte funktional festlegt.
Funktionale Abhängigkeitserkennung
Der Prozess, der funktionale Abhängigkeitsverhältnisse zwischen Spalten in einer Datenquelle sucht.
Gateway
Ein Arbeitsablaufobjekt, dass Pfade in einem Arbeitsablauf basierend auf der Evaluierung von Ausdrücken in konditionalen Sequenzflüssen durch den Data Integration Service aufteilt und zusammenführt. Der Editor zeigt Gateways als Rauten an.
Gitteraufgabe
Eine Jobanfrage für die parallele Verarbeitung. Wenn das Mapping in der Hadoop-Umgebung ausgeführt wird, sendet der Blaze-Engine Executor die Anfrage an den Gitter-Manager. Wenn das Mapping in der nativen Umgebung und der Datenintegrationsdienst im Remote-Modus ausgeführt wird, sendet der Datenintegrationsdienst-Prozess die Anfrage an den Dienstmanager auf dem Masterrechenknoten.
Hadoop-Cluster
Ein Cluster von Computern, der für die Ausführung von Hadoop-Anwendungen und -Diensten konfiguriert wurde. Eine typischer Hadoop-Cluster enthält einen Masterknoten und mehrere Worker-Knoten. Die Masterknoten führt die Master-Daemons JobTracker und NameNode aus. Ein Worker-Knoten führt die DataNode- und TaskTracker-Daemons aus. In kleinen Clustern kann der Masterknoten auch die Worker-Daemons ausführen.
Hadoop-Umgebung
Eine Umgebung, die Sie für die Ausführung eines Mappings oder eines Profils auf einem Hadoop-Cluster konfigurieren können. Sie müssen Hadoop als Validierungs- und Laufzeitumgebung konfigurieren.
Hive
Eine Data Warehouse-Infrastruktur, die über Hadoop aufgebaut ist. Hive unterstützt eine SQL-ähnliche Sprache namens HiveQL für die Datenzusammenfassung, -abfrage, und -analyse.
Hive Executor
Eine Komponente des DTM, die ein Mapping oder ein Profil vereinfachen und dieses in einen Hive-Ausführungsplan umwandeln kann, der auf einem Hadoop-Cluster ausgeführt wird.
Hive-Aufgabe
Eine Aufgabe im Hive-Ausführungsplan. Ein Hive-Ausführungsplan umfasst viele Hive-Aufgaben. Eine Hive-Aufgabe enthält ein Hive-Skript.
Hive-Ausführungsplan
Eine Reihe von Hive-Aufgaben, die der Hive Executor nach der Verarbeitung eines Mappings oder eines Profils generiert. Ein Hive-Ausführungsplan kann auch als Hive-Arbeitsablauf bezeichnet werden.
Hive-Skripts
Skript in Hive-Abfragesprache, das Hive-Abfragen und Hive-Befehle zur Ausführung des Mappings enthält.
Indirekte Übereinstimmung
Eine Übereinstimmung bei Ergebnissen der Ergebnissuche, die mit demjenigen Objekt verknüpft ist, das mit einigen oder allen Suchabfragen übereinstimmt.
Informatica Administrator
Informatica Administrator (das Administrator Tool) ist eine Anwendung, die die administrativen Tasks für Domänenobjekte, z. B. Dienste, Knoten, Lizenzen und Gitter, konsolidiert. Sie verwalten die Domäne und die Sicherheit der Domäne mithilfe des Administrator-Tools.
Informatica Developer
Informatica Developer (das Developer Tool) ist eine Anwendung, mit der Sie Datenintegrationslösungen entwerfen. Die Objekte, die Sie im Developer Tool erstellen, werden im Model Repository gespeichert.
Informatica Mass Ingestion
Informatica Mass Ingestion (das Massenerfassungs-Tool) ist eine Anwendung, die Sie zum Konfigurieren, Bereitstellen, Ausführen und Überwachen von Massenerfassungsspezifikationen verwenden können.
Informatica Monitoring-Tool
Informatica Monitoring (das Monitoring Tool) ist eine Anwendung, die eine direkte Verknüpfung zur Registerkarte „Verwalten“ des Administrator Tools bereitstellt. Auf der Registerkarte „Überwachen“ werden Eigenschaften, Laufzeitstatistiken und Laufzeitberichte zu den Integrationsobjekten angezeigt, die in einem Datenintegrationsdienst ausgeführt werden.
Inkrementelle Anwendung
Eine Anwendung, die durch Bereitstellen eines Anwendungs-Patchs im Datenintegrationsdienst aktualisiert werden kann.
Intelligente Struktur
Ein Modell des Musters und der Typen von Feldern mit Daten, die von der intelligenten Strukturerkennung in einer Eingabedatei erkannt werden. Das Modell enthält je nach der Organisation der Daten in der Datei einfache und komplexe Elemente.
Intelligente Strukturerkennung
Ein Dienst in Informatica Intelligent Cloud Services, der Algorithmen für maschinelles Lernen zum automatischen Erkennen der Informationstypen in einer Eingabedatei verwendet. Bei der intelligenten Strukturerkennung werden eine intelligente Struktur sowie ein Modell des Musters und der Typen von Feldern mit in der Datei erkannten Daten erstellt. Das Modell enthält je nach der Organisation der Daten in der Datei einfache und komplexe Elemente.
JobTracker
Ein Hadoop-Dienst, der die Mapping- und Reduzierungsaufgaben koordiniert und diese für die Ausführung auf TaskTrackers plant.
Join-Profil
Ein Profiltyp, der den Grad der Überschneidung zwischen einer Gruppe von einer oder mehreren Spalten in einer Datenquelle und eine ähnliche Gruppe in derselben oder einer anderen Datenquelle festlegt.
Knoten
Eine Darstellung auf einer Ebene in der Hierarchie einer Web-Dienst-Meldung.
Knotenrolle
Der Zweck eines Knotens. Ein Knoten mit der Dienstrolle kann Anwendungsdienste ausführen. Ein Knoten mit der Berechnungsrolle kann Berechnungen durchführen, die von Remote-Anwendungsdiensten angefragt werden. Ein Knoten mit beiden Rollen kann Anwendungsdienste ausführen und lokal Berechnungen für diese Dienste durchführen.
Konditionaler Sequenzfluss
Ein Sequenzfluss, der einen Ausdruck beinhaltet, den der Data Integration Service als "true" oder "false" bewertet. Wenn der Ausdruck als "true" bewertet wird, führt der Data Integration Service das nächste Objekt im Arbeitsablauf aus. Wenn der Ausdruck als "false" bewertet wird, führt der Data Integration Service das nächste Objekt im Arbeitsablauf nicht aus.
konfiguriertes Datenobjekt
Ein physisches Datenobjekt, das ein oder mehrere relationale Ressourcen oder relationale Datenobjekte als Quellen verwendet. Sie können mit einem konfigurierten Datenobjekt beispielsweise Daten aus entsprechenden Ressourcen oder Filterzeilen verknüpfen. Ein konfiguriertes Datenobjekt verwendet eine einzelne Verbindung und SQL-Anweisung für die Quelltabellen.
kostenbasierte Optimierung
Eine Optimierungsmethode, mit der die Laufzeit von Mappings verringert wird, die Join-Vorgänge ausführen. Mit kostenbasierter Optimierung erstellt der Data Integration Service unterschiedliche Pläne zum Ausführen eines Mappings und berechnet die Kosten für die einzelnen Pläne. Der Data Integration Service führt den Plan aus, der die geringsten Kosten aufweist. Der Data Integration Service berechnet die Kosten auf Grundlage von Datenbankstatistiken, E/A, CPU, Netzwerk und Speicher.
Laufzeitanwendung
Eine Anwendung, die auf einem Datenintegrationsdienst bereitgestellt wird und Laufzeitinstanzen von Anwendungsobjekten enthält.
Laufzeitumgebung
Die Umgebung, die Sie für die Ausführung eines Mappings oder eines Profils konfigurieren. Die Laufzeitumgebung kann nativ oder Hive sein.
Laufzeitverknüpfung
Eine Verknüpfung von Gruppen, die eine Richtlinie oder einen Parameter oder beides verwendet, um zu bestimmen, welche Ports zwischen den Gruppen zur Laufzeit verknüpft werden sollen.
Lesezuordnung eines logischen Datenobjekts
Ein Mapping, das eine Datenansicht über ein logisches Datenobjekt bietet. Es enthält ein oder mehrere logische Datenobjekte als Quellen und ein logisches Datenobjekt als Mapping-Ausgabe.
Logischer Data Transformation Manager (LDTM)
Eine Dienstkomponente des Datenintegrationsdiensts, die Jobs optimiert und kompiliert und diese anschließend an Data Transformation Manager (DTM) für die Ausführung sendet.
logisches Datenobjekt
Ein Objekt, das eine logische Entität in einem Unternehmen beschreibt. Es beinhaltet Attribute und Schlüssel und beschreibt Beziehungen zwischen Attributen.
logisches Datenobjektmodell
Ein Datenmodell, dass die Daten in einem Unternehmen und die Beziehung zwischen den Daten beschreibt. Es enthält logische Datenobjekte und definiert ihre Beziehungen untereinander.
Mapplet
Ein wiederverwendbares Objekt, das einen Satz von Umwandlungen enthält, die Sie in mehreren Mappings verwenden oder als Regel validieren können.
MapReduce
Ein Programmierungsmodell für die parallele Verarbeitung großer Datenmengen.
MapReduce-Job
Eine Arbeitseinheit, die aus den Eingabedaten, dem MapReduce-Programm und Konfigurationsinformationen besteht. Hadoop führt den MapReduce-Job mithilfe der Unterteilung in Mapping- und Reduzierungsaufgaben aus.
Massenerfassung
Die Verschiebung großer Datenmengen zwischen einer relationalen Datenbank und einem Data Lake oder einem Hadoop-Cluster.
Massenerfassungsdienst
Ein Anwendungsdienst, der die Massenerfassungsspezifikationen verwaltet, die im Massenerfassungs-Tool erstellt werden. Der Massenerfassungsdienst validiert Spezifikationen, plant Spezifikationen zur Ausführung in einem Datenintegrationsdienst und überwacht die Erfassungsstatistiken.
Massenerfassungsspezifikation
Ein Konfiguration, die angibt, wie Quelldaten aus einer relationalen Datenbank an einem bestimmten Speicherort in einem Data Lake oder einem Hadoop-Cluster erfasst werden.
Metastore
Eine Datenbank, die Hive für das Speichern von in HDFS gespeicherten Metadaten der Hive-Tabellen verwendet. Metastores können lokal, eingebettet oder ausgelagert sein.
Metrik
Eine Spalte einer Datenquelle oder Ausgabe einer Regel, die Teil einer Scorecard ist
Metrik-Score
Der Prozentsatz der gültigen Werte in einer Metrik
Metrikgewichtung
Eine Ganzzahl größer als oder gleich 0 für eine Metrik. Eine Metrikgewichtung definiert den Beitrag der Metrik zum Metrikgruppen-Score.
Metrikgruppe
Eine benutzerdefinierte Gruppe von Metriken
Metrikgruppen-Score
Der errechnete gewichtete Durchschnitt aller Metrik-Scores in der Metrikgruppe
Modellrepository-Dienst
Ein Anwendungsdienst in der Informatica-Domäne, der das Model Repository ausführt und verwaltet. Im Model Repository werden die von Informatica-Produkten erstellten Metadaten in einer relationalen Datenbank gespeichert, um die Zusammenarbeit zwischen den Produkten zu ermöglichen.
NameNode
Ein Knoten im Hadoop-Cluster, der das Dateisystem-Namespace verwaltet und die Dateisystem-Baumstruktur sowie die Metadaten für alle Dateien und Verzeichnisse in der Baumstruktur pflegt.
Native Umgebung
Die Standardumgebung in der Informatica-Domäne für die Ausführung von Mappings, Arbeitsabläufen oder Profilen. Der Datenintegrationsdienst führt die Extraktion, die Umwandlung und das Laden von Daten durch. Alternativ kann der Datenintegrationsdienst die Verarbeitung auch in eine nicht-native Umgebung verlagern, bei der es sich um einen verteilten Cluster außerhalb der Informatica-Domäne handelt, wie z. B. Hadoop oder Databricks.
Nicht-native Umgebung
Ein verteilter Cluster außerhalb der Informatica-Domäne, wie z. B. Hadoop oder Databricks, auf den der Datenintegrationsdienst die Laufzeitverarbeitung verlagern kann. Wenn der Datenintegrationsdienst die Verarbeitung nicht auf eine nicht-native Umgebung verlagert, wird der Job in der nativen Umgebung der Informatica-Domäne verarbeitet.
Ordner
Ein Container für Objekte im Modellrepository. Verwenden Sie Ordner, um Objekte in einem Projekt zu organisieren, und erstellen Sie Ordner, um Objekte basierend auf den jeweiligen Geschäftsanforderungen zu gruppieren.
Partitionierung
Der Vorgang der Unterteilung der zugrunde liegenden Daten in Teilmengen, die in mehreren Verarbeitungs-Threads ausgeführt werden können. Wenn Administratoren den Datenintegrationsdienst für das Maximieren des Parallelismus aktivieren, erhöht sich die Anzahl der Verarbeitungs-Threads, wodurch die Mapping- und Profiling-Leistung optimiert werden kann.
Partitionspunkt
Eine Begrenzung zwischen Phasen in einer Mapping-Pipeline. Wenn die Partitionierung aktiviert ist, kann der Datenintegrationsdienst die Neuverteilung von Datenzeilen an Partitionspunkte durchführen.
physisches Datenobjekt
Eine physische Darstellung von Daten, die verwendet wird, um aus Ressourcen zu lesen, Ressourcen zu suchen oder in Ressourcen zu schreiben.
Pipeline
Eine Quelle und sämtliche Umwandlungen und Ziele, die Daten aus dieser Quelle empfangen. Jedes Mapping enthält eine oder mehrere Pipelines.
Präprozessor
Ein Dokumentprozessor, mit dem ein Quelldokument vor der eigentlichen Datenumwandlung umfassend bearbeitet wird.
Primärschlüsselerkennung
Ein Prozess zur Erkennung einer Spalte oder Kombination von Spalten mit einer einmaligen Kennung für eine Zeile in einer Datenquelle.
Profil
Ein Objekt, das Regeln zum Erkennen von Mustern in einer Datenquelle enthält. Führen Sie ein Profil zum Evaluieren der Datenstruktur aus und stellen Sie sicher, dass Datenspalten die erwarteten Informationstypen enthalten.
Profiling-Regel
Wiederverwendbare Geschäftslogik, die Bedingungen definiert, welche auf Daten angewendet werden, wenn ein Profil ausgeführt wird. Verwenden Sie Regeln zur weiteren Validierung von Daten in einem Profil und zur Messung des Fortschritts in der Datenqualität. Sie können eine Regel in Informatica Analyst oder Informatica Developer erstellen.
Profiling-Warehouse
Eine relationale Datenbank, die Profiling-Informationen speichert, wie beispielsweise Profil- und Scorecard-Ergebnisse.
Projekt
Der oberste Container zum Speichern von in Informatica Analyst und Informatica Developer erstellten Objekten. Erstellen Sie Projekte basierend auf Geschäftszielen oder Geschäftsanforderungen. Projekte werden in Informatica Analyst und Informatica Developer angezeigt.
Pushdown-Optimierung
Eine Optimierungsmethode, die Umwandlungslogik in eine Quell- oder Target-Datenbank überträgt. Der Data Integration Service übersetzt mit Pushdown-Optimierung die Umwandlungslogik in SQL-Abfragen und sendet diese an die Datenbank. Die Datenbank führt die SQL-Abfragen aus, um die Daten zu verarbeiten.
Quelldokument
Ein Dokument, das die Eingabe für eine Datenprozessorumwandlung ist.
Rastersegment
Teil einer Rasterzuordnung in einer Gitteraufgabe.
Rasterzuordnung
Ein Informatica-Mapping, das die Blaze-Engine kompiliert und über einen Cluster von Knoten hinweg verteilt.
Ressourcenmanager-Dienst
Ein Systemdienst, der Rechneressourcen in der Domäne verwaltet und Jobs verteilt, um eine optimale Leistung und Skalierbarkeit erreichen zu können. Der Ressourcenmanager-Dienst sammelt Informationen über Knoten mit der Berechnungsrolle. Der Dienst gleicht die Jobanforderungen mit der Ressourcenverfügbarkeit ab und ermittelt so den besten Berechnungsknoten für die Ausführung des Jobs. Der Ressourcenmanager-Dienst kommuniziert mit Berechnungsknoten in einem Datenintegrationsdienstgitter. Aktivieren Sie den Ressourcenmanager-Dienst, wenn Sie ein Datenintegrationsdienstgitter für die Ausführung von Jobs in separaten Remoteprozessen konfigurieren.
Schlüsselkandidat
Eine Spalte oder eine Reihe von Spalten, die jede Quellzeile in einer Datenbanktabelle eindeutig identifiziert.
Schreibzuordnung eines logischen Datenobjekts
Ein Mapping, das die Daten in Ziele schreibt, indem ein logisches Datenobjekt als Eingabe verwendet wird. Es enthält ein oder mehrere logische Datenobjekte als Eingabe und ein physisches Datenobjekt als Ziel.
Scorecard
Eine grafische Darstellung von gültigen Werten für eine Spalte oder die Ausgabe einer Regel in Profilergebnissen. Mit Scorecards können Sie den Fortschritt der Datenqualität messen.
Scorecard-Herkunft
Hierbei handelt es sich um ein Diagramm, das für eine Metrik oder Metrikgruppe in einer Scorecard den Ursprung der Daten zeigt, den Pfad beschreibt und den Datenfluss verdeutlicht. In der Scorecard-Herkunftsanalyse stellen Kästchen oder Knotenpunkte verschiedene Objekte dar. Pfeile symbolisieren Datenflussbeziehungen.
Semi-Join-Optimierung
Eine Optimierungsmethode, mit der die Anzahl der aus der Quelle extrahierten Zeilen reduziert wird. Der Data Integration Service ändert mit Semi-Join-Optimierung die Join-Vorgänge in einem Mapping. Der Data Integration Service wendet die Semi-Join-Optimierungsmethode auf eine Joiner-Umwandlung an, wenn eine größere Eingabegruppe Zeilen enthält, die nicht mit einer kleineren Eingabegruppe in der Join-Bedingung übereinstimmen. Der Data Integration Service liest die Zeilen aus der kleineren Gruppe, sucht die übereinstimmenden Zeilen in der größeren Gruppe und führt den Join-Vorgang aus.
Sequenzfluss
Ein Konnektor zwischen Arbeitsablaufobjekten, der die Reihenfolge angibt, in der der Data Integration Service Objekt ausführt. Der Editor zeigt Sequenzflüsse als Pfeile an.
Sonderfall
Ein Muster, ein Wert oder eine Häufigkeit für eine Spalte in den Profilergebnissen wird als Sonderfall angesehen, wenn das Muster, der Wert oder die Häufigkeit außerhalb des erwarteten Wertebereichs liegt.
Spaltennamenregel:
Wiederverwendbare Business-Logik, die eine Spalte anhand ihres Namens als zu einer bestimmten Datendomäne gehörend identifiziert.
Spaltenprofil
Ein Profiltyp, der die Eigenschaften von Spalten in einer Datenquelle bestimmt, wie z. B. Werthäufigkeit, Prozentsätze, Muster und Datentypen.
Sparkline
Sparklines sind Liniendiagramme, die die Variation in einem Nullwert, eindeutigen Wert oder nicht eindeutigen Wert in den fünf letzten aufeinanderfolgenden Profilausführungen anzeigen.
SQL-Datendienst
Eine virtuelle Datenbank, die Sie abfragen können. Sie enthält virtuelle Objekte und bietet eine einheitliche Ansicht von Daten aus ungleichartigen, heterogenen Datenquellen.
SQL-Dienstmodul
Der Komponentendienst im Data Integration Service, der die SQL-Abfragen verwaltet, die von Client-Tools anderer Hersteller an einen SQL-Datendienst gesendet wurden.
Standardsequenzfluss
Die ausgehende Sequenzfluss aus einem exklusiven Gateway, der immer als "true" bewertet wird. Wenn alle anderen konditionalen Sequenzflüsse mit "false" bewertet werden, führt der Data Integration Service das mit dem ausgehenden Standardsequenzfluss verbundene Objekt aus.
Startkomponente
Die ausführbare Komponente, die Data Transformation bei einer Datenprozessorumwandlung zuerst startet.
statusbehafteter variabler Port
Ein variabler Port, der auf Werte aus vorherigen Zeilen verweist.
System-Arbeitsablaufvariable
Eine Arbeitsablaufvariable, die Informationen zur Systemlaufzeit zurückgibt, wie zum Beispiel die Arbeitsablaufinstanz-ID, der Benutzer, der den Arbeitsablauf gestartet hat, oder die Startzeit des Arbeitsablaufs.
Systemdienst
Ein Anwendungsdienst, der in der Domäne über eine einzelne Instanz verfügen kann. Die Systemdienste werden beim Erstellen der Domäne angelegt. Systemdienste können aktiviert, deaktiviert und konfiguriert werden.
Tasklet
Eine Partition eines Rastersegments, die auf einem separaten DTM ausgeführt wird.
TaskTracker
Ein Knoten im Hadoop-Cluster, der Aufgaben wie z. B. Mapping- oder Reduzierungsaufgaben durchführt. TaskTrackers senden Fortschrittsberichte an den JobTracker.
teambasierte Entwicklung
Die Zusammenarbeit von Teammitgliedern an einem Entwicklungsprojekt. Die Zusammenarbeit beinhaltet eine breite Funktionspalette: von der Versionsverwaltung bis hin zum Auschecken und Einchecken von Repository-Objekten, um nur einige zu nennen.
Umwandlung
Ein Repository-Objekt in einem Mapping, das Daten generiert, ändert oder übergibt. Jede Umwandlung führt eine andere Funktion aus.
Validierungsumgebung
Die Umgebung, die Sie für die Validierung eines Mappings oder eines Profils konfigurieren. Validieren Sie ein Mapping bzw. ein Profil, um sicherzustellen, dass es in einer Laufzeitumgebung ausgeführt werden kann. Die Validierungsumgebung kann Hive, nativ oder beides sein.
Verteiltes Hadoop-Dateisystem (HDFS)
Ein verteiltes Dateispeichersystem, das von Hadoop-Anwendungen verwendet wird.
virtuelle Daten
Die Informationen, die Sie erhalten, wenn Sie in einem SQL-Datendienst virtuelle Tabellen abfragen oder gespeicherte Prozeduren ausführen.
virtuelle Datenansicht
Eine durch einen SQL-Datendienst definierte virtuelle Datenbank, die Sie wie eine physische Datenbank abfragen können.
virtuelle Datenbank
Ein SQL-Datendienst, den Sie abfragen können. Sie enthält virtuelle Objekte und bietet eine einheitliche Ansicht von Daten aus ungleichartigen, heterogenen Datenquellen.
virtuelle gespeicherte Prozedur
Ein Satz von prozeduralen oder Datenflussinstruktionen in einem SQL-Datendienst.
virtuelle Tabelle
Eine Tabelle in einer virtuellen Datenbank.
virtuelles Schema
Ein Schema in einer virtuellen Datenbank, das die Datenbankstruktur definiert.
virtuelles Tabellen-Mapping
Ein Mapping, das eine virtuelle Tabelle als Target enthält.
Vollständige Anwendung
Eine Anwendung, die nach dem Bearbeiten von Anwendungsobjekten erneut für den Datenintegrationsdienst bereitgestellt werden muss.
Vorgangs-Mapping
Ein Mapping, das die Web-Dienst-Operation für den Web-Dienst Client ausführt. Ein Operation-Mapping kann eine Eingabeumwandlung, eine Ausgabeumwandlung und mehrere Fehlerumwandlungen enthalten.
Vorhersage-Expression
Eine Expression, die die Daten in einem Mapping filtert. Eine Vorhersage-Expression gibt true oder false zurück.
Vorhersageoptimierung
Eine Optimierungsmethode, die die Vorhersage-Expressionen in einem Mapping vereinfacht oder neu schreibt. Der Data Integration Service versucht mit Vorhersageoptimierung zu einem möglichst frühen Zeitpunkt Vorhersage-Expressionen anzuwenden, um die Mapping-Leistung zu erhöhen.
Web-Dienst-Modul
Eine Komponente des Data Integration Service, die Web-Dienst-Operationsanfragen verwaltet, die von einem Web-Dienst-Client an den Web-Dienst gesendet werden.
Web-Dienst-Umwandlung
Eine Umwandlung, die Web-Dienst-Anfragen oder Web-Dienst-Antworten verarbeitet. Beispiele für Web-Dienst-Umwandlungen sind Eingabeumwandlung, Ausgabeumwandlung, Fehlerumwandlung und die Web-Dienst-Verbraucher-Umwandlung.
Wiederherstellung
Der Prozess des Validierens und Verwaltens erkannter Metadaten einer Datenquelle, um die Metadaten für ihre Verwendung und die Berichterstellung anzupassen.
XMap
Ein ein Datenprozessor-Umwandlungsobjekt, das XML-Eingabedokument einem anderen XML-Dokument zuordnet.
XML-Schema
Eine Definition der in XML-Dokumenten verwendeten Elemente, Attribute und Struktur. Das Schema entspricht dem Standard-XML-Schema des World Wide Web Consortium und wird als XSD-Datei gespeichert.
XPath
Eine Abfragesprache, die verwendet wird, um Knoten in einem XML-Dokument auszuwählen und Berechnungen durchzuführen.
XSD-Schemadatei
Eine XSD-Datei mit einem XML-Schema, die die Elemente, die Attribute und die Struktur von XML-Dokumenten definiert.
Zuordnung
Ein Satz von Eingaben und Ausgaben, die durch Umwandlungsobjekte verknüpft sind, die die Regeln für die Datenumwandlung definieren.
Zuordnung logischer Datenobjekte
Ein Mapping, das ein logisches Datenobjekt mit einem oder mehreren physischen Datenobjekten verknüpft. Es kann Umwandlungslogik enthalten.