Fallstudie: ISO 8859-1 Datenverarbeitung
Diese Fallstudie beschreibt, wie Sie eine Umgebung zur Verarbeitung von ISO 8859-1 Multibyte-Daten einrichten können. So können Sie Ihre Umgebung konfigurieren, wenn Sie Daten verschiedener westeuropäischer Sprachen mit Zeichensätzen der ISO 8859-1 Codepage verarbeiten müssen. Dieses Beispiel beschreibt eine Umgebung zur Verarbeitung von Daten in englischer und deutscher Sprache.
In dieser Fallstudie umfasst die ISO 8859-1 Umgebung folgende Elemente:
ISO 8859-1 Umgebung konfigurieren
Verwenden Sie die folgenden Richtlinien, wenn Sie eine Umgebung ähnlich wie in diesem Beispiel für die ISO 8859-1 Datenverarbeitung konfigurieren möchten:
- 1Stellen Sie die Codepage-Kompatibilität zwischen dem PowerCenter Repository Datenbank-Client und dem Datenbankserver sicher.
- 2Stellen Sie die Codepage-Kompatibilität zwischen dem PowerCenter Client und dem PowerCenter Repository sicher sowie zwischen dem PowerCenter Integration Dienstprozess und dem PowerCenter Repository.
- 3Setzen Sie den Datenverschiebungsmodus des PowerCenter Integration Service auf ASCII.
- 4Überprüfen Sie die Kompatibilität der Sitzungs-Codepage.
- 5Prüfen Sie die Codepage-Kompatibilität für die Lookup- und Gespeicherte-Prozeduren-Datenbank.
- 6Stellen Sie die Codepage-Kompatibilität externer Prozeduren oder benutzerdefinierter Transformationsprozeduren sicher.
- 7Konfigurieren Sie die Sortierreihenfolge einer Sitzung.
Schritt 1. Verifizieren der Kompatibilität von PowerCenter Repository Database Client und Server
Der Datenbank-Client und Server, die das PowerCenter Repository hosten, müssen in der Lage sein, ohne Datenverlust zu kommunizieren.
Das PowerCenter Repository befindet sich in einer Oracle-Datenbank. Benutzen Sie die Umgebungsvariable NLS_LANG, um das Gebietsschema (Sprache, Region und Zeichensatz) festzulegen, das der Datenbank-Client und -Server bei der Anmeldung verwenden sollen:
NLS_LANG = LANGUAGE_TERRITORY.CHARACTERSET
Standardmäßig konfiguriert Oracle NLS_LANG für US-Englisch, das US-Territorium, und den 7-Bit ASCII-Zeichensatz:
NLS_LANG = AMERICAN_AMERICA.US7ASCII
Ändern Sie die Standard-Konfiguration, um ISO 8859-1-Daten mit der Oracle WE8ISO8859P1 Codepage in das PowerCenter Repository zu schreiben. Beispiel:
NLS_LANG = AMERICAN_AMERICA.WE8ISO8859P1
Weitere Informationen zum Überprüfen und Ändern der PowerCenter Repository Database-Codepage finden Sie in Ihrer Datenbank-Dokumentation.
Schritt 2. Stellen Sie die PowerCenter Codepage-Kompatibilität sicher
PowerCenter Integration Service und PowerCenter-Client-Codepages müssen Teilmengen der PowerCenter Repository Codepage sein. Da der PowerCenter-Client und PowerCenter Integration Service jeweils die System-Codepages des Computers verwenden, auf denen sie installiert sind, müssen Sie überprüfen, ob die System-Codepages Teilmengen der PowerCenter Repository Codepage sind.
In diesem Fall wurde der PowerCenter-Client auf Windows-Systemen in den Vereinigten Staaten gekauft. Daher sind die System-Codepages für die PowerCenter-Client-Computer auf MS Windows Latin1 eingestellt. Um System- und Bildschirmsprachen zu überprüfen, öffnen Sie das Dialogfeld "Regionale Einstellungen" in der Windows-Systemsteuerung. Für Systeme, die in den Vereinigten Staaten erworben wurden, müssen die Ländereinstellungen und Eingabegebietsschemata für Englisch (USA) konfiguriert werden.
Der PowerCenter Integration Service ist auf einem UNIX-Rechner installiert. Die Standard-Codepage für das UNIX-Betriebssysteme ist ASCII. In dieser Umgebung ändern Sie die UNIX-System-Codepage auf ISO 8859-1 Western European, sodass sie eine Teilmenge der PowerCenter Repository-Codepage ist.
Schritt 3. Konfigurieren des PowerCenter Integration Service für den ASCII-Datenverschiebungsmodus
Konfigurieren Sie den PowerCenter Integration Service für die Verarbeitung von ISO 8859-1 Daten. Im Administrator Tool setzen Sie den Datenverschiebungsmodus für den PowerCenter Integration Service auf ASCII.
Schritt 4. Stellen Sie die Sitzungs-Codepage-Kompatibilität sicher
Wenn Sie einen Arbeitsablauf im ASCII-Datenverschiebungsmodus ausführen, erzwingt der PowerCenter Integration Service Quell- und Target-Codepage-Beziehungen. Um genaue Datenumwandlungen zu gewährleisten, muss die Quell-Codepage eine Teilmenge der Target-Codepage sein.
In diesem Fall enthält die Umgebung eine Quelldatenbank mit deutschen und englischen Daten. Wenn Sie eine Quelldatenbank-Verbindung im PowerCenter Workflow Manager konfigurieren, muss die Codepage für die Verbindung mit der Quelldatenbank-Codepage identisch und eine Teilmenge der Target-Codepage sein. Da sowohl die Codepage MS Windows Latin1 und die Codepage ISO 8859-1 Western European deutsche Umlaute enthalten, würden Sie wahrscheinliche eine dieser Codepages für die Quelldatenbank-Verbindungen verwenden.
Da die Target-Codepage eine Obermenge der Quell-Codepages sein muss, müssen Sie für die Targetdatenbank-Verbindungen entweder MS Windows Latin1, ISO-8859-1 Western European oder UTF-16LE oder flache Dateien verwenden. Um Datenkonsistenz zu gewährleisten, muss die konfigurierte Target-Codepage der Targetdatenbank oder Einfachdatei-System-Codepage entsprechen.
Wenn Sie den PowerCenter Integration Service für entspannte Codepage-Validierung konfigurieren, entfernt der PowerCenter Integration Service Einschränkungen bei der Kompatibilität von Quell- und Target-Codepages. Sie können für Quell- und Targetdaten eine beliebige unterstützte Codepage auswählen. Sie müssen jedoch sicherstellen, dass die Targets nur Zeichendaten erhalten, die in der Target-Codepage codiert wurden.
Schritt 5. Verifizieren der Codepage-Kompatibilität für Lookup-Datenbank und Datenbank der gespeicherten Prozedur
Die Codepages der Lookup-Datenbank und der Datenbank für die gespeicherten Prozeduren müssen eine Obermenge der Quell-Codepages und eine Untermenge der Target-Codepages sein. In diesem Fall müssen alle Verbindungen zu Lookup- und Gespeicherte-Prozeduren-Datenbanken eine Codepage verwenden, die mit den Codepages ISO 8859-1 Western European oder MS Windows Latin1 kompatibel ist.
Schritt 6. Kompatibilität externer Prozedur oder benutzerdefinierter Umwandlungsprozedur prüfen
Die externen Prozedur und die benutzerdefinierten Umwandlungsprozeduren müssen die Zeichendaten aus den Quell-Codepages verarbeiten können, und sie müssen die Zeichen übergeben, die in den Target-Codepages kompatibel sind. In diesem Fall müssen alle Daten, die von externen Prozeduren oder benutzerdefinierten Umwandlungsprozeduren verarbeitet werden, den Codepages ISO 8859-1 Western European oder MS Windows Latin1 entsprechen.
Schritt 7. Konfigurieren der Sitzungs-Sortierreihenfolge
Wenn Sie den PowerCenter Integration Service im ASCII-Modus ausführen, verwendet er für alle Sitzungen eine binäre Sortierreihenfolge. In den Sitzungseigenschaften listet der PowerCenter Workflow Manager alle Sortierreihenfolgen auf, die zur Codepage des PowerCenter Integration Service gehören. Sie können eine Sortierreihenfolge für die Sitzung auswählen.