Caso práctico: Procesamiento de datos ISO 8859-1
En este caso práctico, se describe cómo se podría configurar un entorno para procesar datos multibyte ISO 8859-1. Es posible que desee configurar el entorno de este modo si necesita procesar datos de distintos idiomas de Europa Occidental con juegos de caracteres incluidos en la página de códigos ISO 8859-1. En este ejemplo, se describe un entorno que procesa datos en inglés y alemán.
Para este caso práctico, el entorno ISO 8859-1 está compuesto por los siguientes elementos:
Cómo configurar el entorno ISO 8859-1
Utilice las siguientes directrices para configurar un entorno similar a este caso de estudio para el procesamiento de datos ISO 8859-1:
- 1. Compruebe la compatibilidad de páginas de códigos entre el cliente de base de datos del repositorio de PowerCenter y el servidor de base de datos.
- 2. Compruebe la compatibilidad de páginas de códigos entre el cliente de PowerCenter y el repositorio de PowerCenter, y entre el proceso del servicio de integración de PowerCenter y el repositorio de PowerCenter.
- 3. Defina el modo de movimiento de datos del servicio de integración de PowerCenter a ASCII.
- 4. Compruebe la compatibilidad de las páginas de códigos de la sesión.
- 5. Compruebe la compatibilidad de las páginas de códigos de la base de datos del procedimiento almacenado y de búsqueda.
- 6. Compruebe la compatibilidad de las páginas de códigos del procedimiento de transformación personalizado o del procedimiento externo.
- 7. Configure el orden de clasificación de la sesión.
Paso 1. Compruebe la compatibilidad entre el cliente de base de datos del repositorio de PowerCenter y el servidor
El cliente de base de datos y el servidor que alberga el repositorio de PowerCenter deben poder comunicarse sin pérdida de datos.
El repositorio de PowerCenter reside en una base de datos Oracle. Utilice NLS_LANG para la configuración regional (idioma, región y conjunto de caracteres) que desea que el servidor y el cliente de la base de datos utilicen para iniciar sesión:
NLS_LANG = LANGUAGE_TERRITORY.CHARACTERSET
De manera predeterminada, Oracle configura NLS_LANG para idioma Inglés de EE. UU., la región EE. UU. y el conjunto de caracteres ASCII de 7-bits:
NLS_LANG = AMERICAN_AMERICA.US7ASCII
Cambie la configuración predeterminada para que escriba datos ISO 8859-1 en el repositorio de PowerCenter utilizando la página de códigos WE8ISO8859P1 de Oracle. Por ejemplo:
NLS_LANG = AMERICAN_AMERICA.WE8ISO8859P1
Para más información sobre cómo verificar y modificar la página de códigos de la base de datos del repositorio de PowerCenter, consulte la documentación de su base de datos.
Paso 2. Compruebe la compatibilidad de las páginas de códigos de PowerCenter
Las páginas de códigos del servicio de integración de PowerCenter y del cliente de PowerCenter deben ser subconjuntos de la página de códigos del repositorio de PowerCenter. Como tanto el cliente de PowerCenter como el servicio de integración de PowerCenter utilizan páginas de códigos del sistema de los equipos donde están instalados, debe comprobar que las páginas de códigos del sistema sean subconjuntos de la página de códigos del repositorio de PowerCenter.
En este caso, el cliente de PowerCenter de los sistemas Windows fue adquirido en Estados Unidos. Por lo tanto, las páginas de códigos del sistema para los equipos del cliente de PowerCenter se configuran de manera predeterminada como Latín 1 para MS Windows. Para verificar la salida del sistema y los idiomas para mostrar, abra el cuadro de diálogo Opciones regionales en el Panel de control de Windows. En el caso de los sistemas adquiridos en Estados Unidos, las secciones Configuración regional e Idioma de entrada deben configurarse para Inglés (Estados Unidos).
El servicio de integración de PowerCenter está instalado en un equipo UNIX. La página de códigos predeterminada para los sistemas operativos UNIX es ASCII. En este entorno, cambie la página de códigos del sistema de UNIX a ISO 8859 Europeo Occidental, de modo que sea un subconjunto de la página de códigos del repositorio de PowerCenter.
Paso 3. Configure el servicio de integración de PowerCenter para el modo de movimiento de datos ASCII
Configure el servicio de integración de PowerCenter para que procese datos ISO 8859-1. En Administrator Tool, defina el modo de movimiento de datos como ASCII para el servicio de integración de PowerCenter.
Paso 4. Compruebe la compatibilidad de la página de códigos de la sesión
Cuando ejecute un flujo de trabajo en el modo de movimiento de datos ASCII, el servicio de integración de datos de PowerCenter forzará la relación de páginas de códigos de origen y destino. Para garantizar una conversión de datos correcta, la página de códigos de origen debe ser un subconjunto de la página de códigos de destino.
En este caso, el entorno contiene una base de datos de origen con datos en alemán e inglés. Cuando configure una conexión con la base de datos de origen en el administrador de flujos de trabajo de PowerCenter, la página de códigos de la conexión debe ser idéntica que la página de códigos de la base de datos de origen y debe ser un subconjunto de la página de códigos de destino. Dado que tanto las páginas de códigos MS Windows Latin1 e ISO 8859-1 Europa Occidental contienen caracteres alemanes, probablemente utilice una de estas páginas de códigos para la conexión con la base de datos.
Dado que la página de códigos de destino debe ser un superconjunto de la página de códigos de origen, utilice MS Windows Latin1, ISO 8859-1 Europa Occidental o UTF-16LE indistintamente como página de códigos para la conexión con la base de datos o el archivo sin formato. Para garantizar la consistencia de los datos, la página de códigos de destino configurada debe coincidir con la página de códigos de la base de datos de destino o la del sistema de archivos sin formato.
Si configura el servicio de integración de datos de PowerCenter para una validación de página de códigos relajada, el servicio de integración de PowerCenter quita las restricciones sobre la compatibilidad de las página de códigos de origen y destino. Puede seleccionar cualquier página de códigos admitida para los datos de origen y destino. Sin embargo, se debe asegurarse de que los destinos sólo reciban datos en caracteres codificados con la página de códigos de destino.
Paso 5. Verifique la compatibilidad de las páginas de códigos de la base de datos de búsqueda y procedimiento almacenado
Las páginas de códigos de la base de datos de búsqueda y procedimiento almacenado deben ser supraconjuntos de las páginas de códigos de origen y subconjuntos de las páginas de códigos de destino. En este caso, todas las conexiones de la base de datos de búsqueda y procedimiento almacenado deben utilizar una página de códigos compatible con las páginas de códigos ISO 8859-1 Europa Occidental o MS Windows Latín 1.
Paso 6. Verifique la compatibilidad del procedimiento externo o del procedimiento de transformación personalizado
El procedimiento externo y los procedimientos de transformación personalizados deben poder procesar los datos de caracteres de las páginas de códigos de origen y deben transferir caracteres que sean compatibles con las páginas de códigos de destino. En este caso, todos los datos procesados por el procedimiento externo o las transformaciones personalizadas deben estar en las páginas de códigos ISO 8859-1 Europa Occidental o MS Windows Latín 1.
Paso 7. Configure el orden de clasificación de la sesión
Cuando ejecute el servicio de integración de PowerCenter en modo ASCII, éste utiliza un orden de clasificación binario para todas las sesiones. En las propiedades de la sesión, el administrador de flujo de trabajo de PowerCenter enumera todos los órdenes de clasificación asociados a la página de códigos del servicio de integración de PowerCenter. Puede seleccionar un orden de clasificación para la sesión.