Codepage-Kompatibilität
Die Kompatibilität der Codepage ist unabdingbar für das präzise Verschieben, wenn der PowerCenter-Integrationsdienst im Unicode-Datenverschiebungsmodus ausgeführt wird.
Eine Codepage kann mit einer anderen Codepage kompatibel oder eine Teilmenge bzw. eine einer anderen Codepage übergeordnete Menge sein:
- •Kompatibel. Zwei Codepages sind kompatibel, wenn die Zeichen der beiden Codepages virtuell identisch sind. Beispiel: Die Codepages JapanEUC und JIPSE enthalten identische Zeichen und sind miteinander kompatibel. Das PowerCenter Repository und der PowerCenter-Integrationsdienst-Prozess können jeweils eine dieser Codepages nutzen und ohne Datenverlust Daten hin- und her schieben.
- •Übergeordnete Menge. Eine Codepage ist eine übergeordnete Menge einer anderen Codepage, wenn Sie alle in der anderen Codepage verschlüsselten Zeichen und weitere Zeichen enthält, die nicht auf der anderen Codepage verschlüsselt sind. Beispiel: MS Latin1 ist eine übergeordnete Menge von US-ASCII, weil es alle Zeichen der US-ASCII-Codepage enthält.
HINWEIS: Bei Informatica ist eine Codepage eine sich selbst und allen anderen kompatiblen Codepages übergeordnete Menge.
- •Teilmenge. Eine Codepage ist eine Teilmenge einer anderen Codepage, wenn alle Zeichen auf der Codepage ebenfalls auf der anderen Codepage verschlüsselt sind. Beispiel: US-ASCII ist eine Teilmenge von MS Latin1, weil alle Zeichen auf der US-ASCII-Codepage auch auf der MS Latin1 Codepage verschlüsselt sind.
Um die präzise Datenverschiebung zu gewährleisten, muss die Target-Codepage eine übergeordnete Menge der Quell-Codepage sein. Ist die Target-Codepage keine der Quell-Codepage übergeordnete Menge, kann der PowerCenter-Integrationsdienst möglicherweise nicht alle Zeichen verarbeiten. Dies führt zu fehlerhaften oder fehlenden Daten. Beispiel: Latin1 ist eine übergeordnete Menge von US-ASCII. Wenn Sie Latin1 als Quell-Codepage und US-ASCII als Target-Codepage auswählen, könnten Sie Zeichendaten verlieren, sofern die Quelle Zeichen enthält, die nicht in US-ASCII enthalten sind.
Beim Installieren oder Upgraden eines PowerCenter-Integrationsdienstes zum Ausführen im Unicode-Modus müssen Sie die Kompatibilität der Codepages zwischen Domänenkonfigurations-Datenbank, Administrator Tool, PowerCenter Clients, PowerCenter-Integrationsdienst-Prozessknoten, PowerCenter-Repository, Metadata Manager Repository und den Host-Computern von pmrep und pmcmd gewährleisten. Im Unicode-Modus erzwingt der PowerCenter-Integrationsdienst die Codepage-Kompatibilität zwischen PowerCenter Client und PowerCenter Repository sowie zwischen PowerCenter-Integrationsdienst-Prozess und PowerCenter-Repository. Beim Ausführen des PowerCenter-Integrationsdienstes im Unicode-Modus müssen die den Sitzungen zugeordneten Codepages außerdem die richtigen Beziehungen aufweisen:
- •Für jede Quelle in der Sitzung muss die Quell-Codepage eine Teilmenge der Target-Codepage sein. Der PowerCenter-Integrationsdienst erfordert keine Codepage-Kompatibilität zwischen Quelle und PowerCenterIntegrationsdienst-Prozess oder zwischen PowerCenter-Integrationsdienst-Prozess und Target.
- •EnthäIt die Sitzung eine Lookup- oder gespeicherte Prozedurumwandlung, muss die Datenbank oder Datei-Codepage eine Teilmenge des Target, das Daten aus der Lookup- oder gespeicherten Prozedurumwandlung aufnimmt und eine übergeordnete Menge der Quelle sein, die Daten an die Lookup- oder gespeicherte Prozedurumwandlung übergibt.
- •Enthält die Sitzung eine externe Prozedur oder benutzerdefinierte Umwandlung, muss die Prozedur Daten in einer Codepage übergeben, die eine Teilmenge der Target-Codepage für Targets ist, die Daten von der externen Prozedur oder benutzerdefinierten Umwandlungen entgegennehmen.
Informatica nutzt Codepages für folgende Komponenten:
- •Domänenkonfigurationsdatenbank. Die Domänenkonfigurations-Datenbank muss mit den Codepages von PowerCenter Repository und Metadata Manager Repository kompatibel sein.
- •Administrator Tool. Die Dateneingabe in das Administrator Tool ist in einer beliebigen Sprache möglich.
- •PowerCenter Client. Die Eingabe von Metadaten in den PowerCenter-Client ist in einer beliebigen Sprache möglich.
- •PowerCenter-Integrationsdienst-Prozess. Der PowerCenter-Integrationsdienst kann Daten in ASCII-Modus oder Unicode-Modus verschieben. Als Datenverschiebungsmodus voreingestellt ist ASCII, wobei 7-Bit-ASCII- bzw. 8-Bit-ASCII-Zeichendaten übergeben werden. Zum Übergeben von Mehrbyte-Zeichendaten aus Quellen in Targets muss der Unicode-Datenverschiebungsmodus eingesetzt werden. Beim Ausführen des PowerCenter-Integrationsdienst im Unicode-Modus nutzt dieser bis zu drei Byte für jedes zu verschiebende Zeichen und führt zur Gewährleistung der Datenintegrität zusätzliche Prüfungen auf Sitzungsebene durch.
- •PowerCenter Repository. Das PowerCenter Repository kann Daten in beliebigen Sprachen speichern. Zum Speichern von Mehrbyte-Daten im PowerCenter-Repository können Sie die UTF-8-Codepage nutzen. Die Codepage für das PowerCenter-Repository ist dieselbe wie die Datenbank-Codepage.
- •Metadata Manager Repository. Im Metadata Manager Repository können Daten in beliebiger Sprache gespeichert werden. Zum Speichern von Mehrbyte-Daten im Repository können Sie die UTF-8-Codepage für das Metadata Manager Repository verwenden. Die Codepage für das Repository ist dieselbe wie für die Datenbank-Codepage.
- •Quellen und Targets. Die Quellen und Targets speichern Daten in einer oder mehreren Sprachen. Sie benutzen die Codepages für die Angabe der Zeichenarten in den Quellen und Targets.
- •PowerCenter-Befehlszeilenprogramme. Sie müssen gewährleisten, dass die Codepage für pmrep eine Teilmenge der PowerCenter Repository Codepage und die Codepage für pmcmd eine Teilmenge der PowerCenter-Integrationsdienst-Prozess Codepage ist.
Die meisten Datenbankserver nutzen zwei Codepages: eine Client-Codepage für die Aufnahme von Daten von Client-Anwendungen und eine Server-Codepage zum Speichern der Daten. Wenn der Datenbankserver läuft, konvertiert er Daten zwischen den beiden Codepages, wenn diese unterschiedlich sind. Bei dieser Datenbankkonfiguration interagiert der PowerCenter-Integrationsdienst-Prozess mit der Datenbank-Client-Codepage. Daher müssen Codepages, die der PowerCenter-Integrationsdienst-Prozess verwendet, wie die Codepages für PowerCenter-Repository, Quelle oder Target, identisch mit der Codepage des Datenbank-Client sein. Die Datenbank-Client-Codepage ist normalerweise identisch mit der Codepage des Betriebssystems, auf dem der PowerCenter-Integrationsdienst-Prozess ausgeführt wird. Die Datenbank-Client-Codepage ist eine Teilmenge der Datenbankserver-Codepage.
Ausführliche Informationen über bestimmte Datenbank-Client- und Server-Codepages finden Sie in Ihrer Datenbank-Dokumentation.
Codepage der Domänenkonfigurationsdatenbank
Die Domänen-Konfigurationsdatenbank muss mit den Codepages des PowerCenter Repository, des Metadata Manager Repository und des Model Repository, kompatibel sein.
Der Service Manager synchronisiert die Liste der Benutzer in der Domäne mit der Liste der Benutzer und Gruppen in allen Anwendungsdiensten., Wenn ein Benutzername in der Domäne Zeichen enthält, die die Codeseite des Anwendungsdienstes nicht erkennt, werden diese Zeichen nicht ordnungsgemäß umgewandelt, was zu Inkonsistenzen führt.
Codepage des Administrator Tools
Das Administrator Tool kann auf jedem Knoten in einer Informatica-Domäne ausgeführt werden. Als Codepage für das Administrator Tool wird die Codepage des Betriebssystems des Knotens verwendet. Jeder Knoten in der Domäne muss dieselbe Codepage verwenden.
Die Codepage des Administrator Tools muss folgende Kriterien erfüllen:
- •Sie muss eine Untermenge der Codepage des PowerCenter Repository sein.
- •Sie muss eine Untermenge der Codepage des Metadata Manager Repository sein.
- •Sie muss eine Untermenge der Codepage des Model Repository sein.
Codepage des PowerCenter Client
Die Codepage des PowerCenter Client entspricht der Codepage des Betriebssystems des PowerCenter Client. Zur Kommunikation mit dem PowerCenter Repository muss die Codepage des PowerCenter Client eine Untermenge der Codepage des PowerCenter Repository sein.
Codepage des PowerCenter Integration Service-Prozesses
Die Codepage eines PowerCenter Integration Service-Prozesses ist die Codepage des Knotens, auf dem der PowerCenter Integration Service-Prozess ausgeführt wird. Definieren Sie die Codepage für jeden PowerCenter Integration Service-Prozess im Administrator Tool auf der Registerkarte "Prozesse".
Unter UNIX können Sie jedoch die Codepage des PowerCenter Integration Service-Prozesses ändern, indem Sie die Umgebungsvariable LANG, LC_CTYPE oder LC_ALL für den Benutzer ändern, erden Prozess startet.
Die Codepage des PowerCenter Integration Service Prozesses muss:
- •Eine Untermenge der Codepage des PowerCenter Repository sein.
- •Eine Obermenge des Computers sein, der pmcmd hostet, oder eine Obermenge der Codepage sein, die in der Umgebungsvariablen INFA_CODEPAGENAME angegeben ist
Die Codepages aller PowerCenter Integration Service-Prozesse müssen miteinander kompatibel sein. Sie können z. B. MS Windows Latin1 für einen Knoten unter Windows und ISO-8859-1 für einen Knoten unter UNIX verwenden.
PowerCenter Integration Services, die für den Unicode-Modus konfiguriert sind, validieren Codepages beim Start einer Sitzung, um genaue Datenbewegungen zu gewährleisten. Dabei wird die Sitzungscodepage zur Konvertierung der Zeichendaten herangezogen. Wenn Sie den PowerCenter Integration Service im ASCII-Modus ausführen, validiert er die Sitzungscodepages nicht. Er liest alle Zeichendaten als ASCII-Zeichen und führt keine Codepage-Konvertierung durch.
Mit jeder Codepage ist eine Sortierreihenfolge verknüpft. Wenn Sie eine Sitzung konfigurieren, können Sie eine der Sortierreihenfolgen wählen, die mit der Codepage der PowerCenter Integration Service-Prozesses verbunden sind. Wenn Sie den PowerCenter Integration Service im Unicode-Modus ausführen, nutzt er die ausgewählte Sitzungssortierreihenfolge zur Sortierung der Zeichendaten. Wenn Sie den PowerCenter Integration Service im ASCII-Modus ausführen, sortiert er alle Zeichendaten in binärer Sortierreihenfolge.
Wenn Sie dem PowerCenter Integration Service in den Vereinigten Staaten unter Windows ausführen, sollten Sie MS Windows Latin1 (ANSI) als Codepage des PowerCenter Integration Service-Prozesses verwenden.
Wenn Sie dem PowerCenter Integration Service in den Vereinigten Staaten unter UNIX ausführen, sollten Sie ISO 8859-1 als Codepage des PowerCenter Integration Service-Prozesses verwenden.
Wenn Sie pmcmd für die Kommunikation mit dem PowerCenter Integration Service nutzen, muss die Codepage des Betriebssystems, das pmcmd hostet, mit der Codepage des PowerCenter Integration Service-Prozesses identisch sein.
Der PowerCenter Integration Service generiert die Namen der Sitzungsprotokolldateien, Ablehnungsdateien, Caches bzw. Cache-Dateien und Leistungsdetaildateien auf der Basis der Codepage des PowerCenter Integration Service-Prozesses.
PowerCenter Repository-Codepage
Die Codepage des PowerCenter-Repository ist die Codepage der Daten im Repository. Der PowerCenter Repository Service verwendet die PowerCenter Repository-Codepage, um Metadaten in der PowerCenter Repository-Datenbank zu speichern und daraus abzurufen. Wählen Sie die PowerCenter Repository-Codepage beim Erstellen oder Aktualisieren eines PowerCenter-Repository aus. Wenn die Codepage der PowerCenter Repository-Datenbank UTF-16LE ist, können Sie ein PowerCenter-Repository mit UTF-16LE als Codepage erstellen.
Die Codepage des PowerCenter-Repository muss folgende Bedingungen erfüllen:
- •Mit der Codepage der Domänenkonfigurationsdatenbank kompatibel sein
- •Eine Obermenge der Codepage des Administrator Tools sein
- •Eine Obermenge der Codepage des PowerCenter Clients sein
- •Eine Obermenge der Codepage für den PowerCenter Integration Service-Prozess sein
- •Eine Obermenge des Computers sein, der pmrep hostet, oder eine Obermenge der Codepage sein, die in der Umgebungsvariablen INFA_CODEPAGENAME angegeben ist
Eine globale PowerCenter Repository-Codepage muss eine Teilmenge der lokalen PowerCenter Repository-Codepage sein, wenn Sie Verknüpfungen im lokalen PowerCenter-Repository erstellen möchten, die auf ein Objekt in einem globalen PowerCenter-Repository verweisen.
Wenn Sie Objekte von einem PowerCenter-Repository zu einem anderen PowerCenter-Repository kopieren, muss die Codepage für das Target-Repository eine Obermenge der Codepage des Quell-Repositorys sein.
Codepage für Metadaten Manager-Repository.
Die Codepage des Metadata Manager-Repository ist die Codepage der Daten im Repository. Der Metadata Manager Service verwendet die Metadata Manager-Repository-Codepage, um Metadaten in der Repository-Datenbank zu speichern und daraus abzurufen. Das Administrator Tool schreibt Benutzer- und Gruppen-Informationen in den Metadata Manager Service. Außerdem schreibt das Administrator Tool Domäneninformationen in die Repository-Datenbank. Der PowerCenter Repository Service-Prozess schreibt Metadaten in die Repository-Datenbank. Wählen Sie die Repository-Codepage beim Erstellen oder Aktualisieren eines Metadata Manager-Repository aus. Wenn die Codepage der Repository-Datenbank UTF-16LE ist, können Sie ein Repository mit UTF-16LE als Codepage erstellen.
Die Codepage des Metadata Manager-Repository muss folgende Bedingungen erfüllen:
- •Mit der Codepage der Domänenkonfigurationsdatenbank kompatibel sein
- •Eine Obermenge der Codepage des Administrator Tools sein
- •Eine Untermenge der Codepage des PowerCenter Repository sein.
- •Eine Obermenge der Codepage für den PowerCenter Integration Service-Prozess sein
PowerCenter-Quell-Codepage
Die Quell-Codepage ist vom Typ der Quelle abhängig:
Unabhängig vom Typ der Quelle muss die Quell-Codepage eine Teilmenge der Codepage der Umwandlungen und Targets sein, die Daten von der Quelle empfangen. Die Quell-Codepage braucht keine Teilmenge der Umwandlungen oder Targets zu sein, die keine Daten aus der Quelle empfangen.
HINWEIS: Wählen Sie IBM EBCDIC nur dann als Codepage für Ihre Quelldatenbankverbindung, wenn Sie auf EBCDIC-Daten zugreifen, wie beispielsweise Daten aus einer extrahierten Großrechnerdatei zugreifen.
PowerCenter-Target-Codepage
Die Target-Codepage ist vom Typ des Targets abhängig:
Die Target-Codepage muss eine Obermenge der Codepage der Umwandlungen und Quellen sein, die Daten an das Target liefern. Die Target-Codepage braucht keine Obermenge der Umwandlungen oder Quellen zu sein, die keine Daten an das Target liefern.
Der Integration Service erstellt Sitzungsindikatordateien, Sitzungsausgabedateien sowie Steuerungsdateien für externen Ladevorgang und Datendateien unter Verwendung der Codepage der Target-Einfachdatei.
HINWEIS: Wählen Sie IBM EBCDIC nur dann als Codepage für Ihre Target-Datenbankverbindung, wenn Sie auf EBCDIC-Daten zugreifen, wie beispielsweise Daten aus einer extrahierten Großrechnerdatei zugreifen.
Befehlszeilenprogramm-Codepages
Die Befehlszeilenprogramme pmcmd und pmrep erfordern Codepage-Kompatibilität. pmcmd und pmrep nutzen Codepages zum Senden von Befehlen in Unicode. Andere Befehlszeilenprogramme erfordern keine Codepages.
Die Codepage-Kompatibilität für pmcmd und pmrep ist davon abhängig, ob Sie die Codepage-Umgebungsvariable INFA_CODEPAGENAME für pmcmd oder pmrep konfiguriert haben. Sie können diese Variable entweder für ein Befehlszeilenprogramm oder für beide angeben.
Falls Sie diese Variable für ein Befehlszeilenprogramm nicht konfiguriert haben, vergewissern Sie sich bitte, dass folgende Anforderungen erfüllt sind:
- •Haben Sie die Variable nicht für pmcmd konfiguriert, muss die Codepage des pmcmd für das Computer-Hosting eine Teilmenge der Codepage für den PowerCenter Integration Service Prozess sein.
- •Sollten Sie die Variable nicht für pmrep konfiguriert haben, muss die Codepage des pmrep für das Computer-Hosting eine Teilmenge der PowerCenter Repository Codepage sein.
Wenn Sie die Codepage-Umgebungsvariable INFA_CODEPAGENAME für pmcmd oder pmrep konfigurieren, vergewissern Sie sich bitte, dass folgende Anforderungen erfüllt sind:
- •Konfigurieren Sie INFA_CODEPAGENAME für pmcmd, muss die für die Variable definierte Codepage eine Teilmenge der Codepage für den PowerCenter Integration Service Prozess sein.
- •Falls Sie INFA_CODEPAGENAME für pmrep konfigurieren,muss die für die Variable definierte Codepage eine Teilmenge der PowerCenter Repository Codepage sein.
- •Führen Sie pmcmd und pmrep auf ein- und demselben Computer aus und konfigurieren Sie die Variable INFA_CODEPAGENAME, muss die für die Variable definierte Codepage Teilmengen der Codepages für den PowerCenter Integration Service Prozess und das PowerCenter Repository darstellen.
Sofern die Codepages nicht kompatibel sind, wird der PowerCenter Integration Service Prozess den Arbeitsablauf, die Sitzung oder die Task möglicherweise nicht vom PowerCenter Repository abfragen.
Codepage-Kompatibilität - Zusammenfassung
Die folgende Abbildung zeigt die Codepage-Kompatibilität in der Informatica-Umgebung:
Die folgende Tabelle enthält eine Zusammenfassung der Codepage-Kompatibilität zwischen Quellen, Zielen, Repositorys, dem Informatica Administrator, dem PowerCenter Client und dem PowerCenter-Integrationsdienst-Prozess:
Komponenten-Codepage | Codepage-Kompatibilität |
|---|
Quelle (inklusive relationale, Einfachdatei und XML-Datei) | Ziel-Teilmenge. Teilmenge der Lookup-Daten. Teilmenge gespeicherter Prozeduren. Teilmenge der Codepage einer externen Prozedur oder einer benutzerdefinierten Umwandlungsprozedur. |
Ziel (inklusive relationale, XML-Dateien und Einfachdateien) | Übergeordnete Menge der Quelle. Übergeordnete Menge für Lookup-Daten. Übergeordnete Menge gespeicherter Prozeduren. Übergeordnete Menge der Codepage für eine externe Prozedur oder eine benutzerdefinierte Umwandlungsprozedur. Der Integrationsdienst-Prozess erstellt mit der Codepage der Ziel-Einfachdatei externe Ladedaten und Steuerungsdateien. |
Datenbank für Lookup- und gespeicherte Prozeduren | Ziel-Teilmenge. Übergeordnete Menge der Quelle. |
Externe Prozedur und benutzerdefinierte Umwandlungsprozeduren | Ziel-Teilmenge. Übergeordnete Menge der Quelle. |
Domänen-Konfigurationsdatenbank | Kompatibel mit dem PowerCenter-Repository-Dienst. Kompatibel mit dem Metadata Manager Repository. |
PowerCenter-Integrationsdienst-Prozess | Kompatibel mit dessen Betriebssystem Teilmenge des PowerCenter-Repository. Teilmenge des Metadata Manager Repository. Übergeordnete Menge für Computer-Hosting pmcmd. Identisch mit anderen Knoten, auf denen die PowerCenter-Integrationsdienst-Prozesse ausgeführt werden. |
PowerCenter-Repository | Kompatibel mit der Domänen-Konfigurationsdatenbank. Übergeordnete Menge des PowerCenter Client. Übergeordnete Menge der Knoten, auf denen der PowerCenter-Integrationsdienst-Prozess ausgeführt wird. Übergeordnete Menge des Metadata Manager Repository. Eine globale PowerCenter-Repository Codepage muss eine Teilmenge eines lokalen PowerCenter-Repository sein. |
PowerCenter Client | Teilmenge des PowerCenter-Repository. |
Computer, auf dem pmcmd ausgeführt wird | Teilmenge des PowerCenter-Integrationsdienst-Prozesses. |
Computer, auf dem pmrep ausgeführt wird | Teilmenge des PowerCenter-Repository. |
Administrator-Tool | Teilmenge des PowerCenter-Repository. Teilmenge des Metadata Manager Repository. |
Metadata Manager Repository | Kompatibel mit der Domänen-Konfigurationsdatenbank. Teilmenge des PowerCenter-Repository. Übergeordnete Menge des Administrator-Tool. Übergeordnete Menge des PowerCenter-Integrationsdienst-Prozesses. |