Resumen sobre la globalización
Informatica puede procesar datos en diferentes idiomas. Algunos idiomas requieren datos de un solo byte, mientras que otros requieren datos de varios bytes. Para procesar los datos correctamente en Informatica, debe configurar los siguiente elementos:
- •Configuración regional. Informatica requiere que la configuración regional de los equipos que acceden a las aplicaciones de Informatica sea compatible con las páginas de códigos del dominio. Es posible que tenga que modificar la configuración regional. La configuración regional especifica el idioma, la zona geográfica, la codificación del juego de caracteres y el orden de agrupación.
- •Modo de movimiento de datos. El servicio de integración de PowerCenter puede procesar datos de un solo byte o de varios bytes y escribirlos en los destinos. Utilice el modo de movimiento de datos ASCII para procesar datos de un solo byte. Utilice el modo de movimiento de datos Unicode para datos de varios bytes.
- •Páginas de códigos. Las páginas de códigos contienen la codificación para especificar caracteres en un conjunto de uno o varios idiomas. Seleccione la página de códigos en función del tipo de datos de caracteres que desee procesar. Para garantizar un movimiento de datos preciso, debe garantizar la compatibilidad entre las páginas de códigos para los componentes de Informatica y del entorno. Utilice las páginas de códigos para distinguir entre caracteres US-ASCII (ASCII de 7 bits), ISO 8859-1 (ASCII de 8 bits) y caracteres de varios bytes.
Para garantizar que los datos se transfieran de forma precisa a través de su entorno, los siguientes componentes deben funcionar de forma conjunta:
- •Página de códigos de la base de datos de configuración del dominio
- •Página de códigos y configuración regional de Administrator Tool
- •Modo de movimiento de datos del servicio de integración de PowerCenter
- •Página de códigos para cada proceso del servicio de integración de PowerCenter
- •Página de códigos del cliente de PowerCenter
- •Página de códigos del repositorio de PowerCenter
- •Páginas de códigos de la base de datos de origen y destino
- •Página de códigos del repositorio de Metadata Manager
Puede configurar el servicio de integración de PowerCenter para la validación relajada de la página de códigos. La validación relajada elimina las restricciones en las páginas de códigos de origen y destino.
Unicode
El estándar Unicode es un estándar creado por Unicode Consortium, un organismo internacional que se dedica a fomentar el intercambio de datos en todos los idiomas. Se ha diseñado para ser compatible con cualquier idioma, al margen de los bytes por carácter que necesite un determinado idioma. Actualmente, es compatible con todos los idiomas más comunes y ofrece compatibilidad limitada para otros idiomas menos comunes. El Unicode Consortium trabaja para mejorar el estándar Unicode con nuevas codificaciones de caracteres. Si desea más información sobre el estándar Unicode, consulte
http://www.unicode.org.
El estándar Unicode contiene varios juegos de caracteres. Informatica usa los siguientes estándares Unicode:
- •UCS-2 (juego de caracteres universales, doble octeto). Un juego de caracteres en el que cada carácter usa dos bytes.
- •UTF-16LE (Unicode Transformation Format). Un formato de codificación en el que cada carácter puede usar de uno a cuatro bytes.
- •UTF-16 (Unicode Transformation Format). Un formato de codificación en el que cada carácter usa dos o cuatro bytes.
- •UTF-32 (Unicode Transformation Format). Un formato de codificación en el que cada carácter usa cuatro bytes.
- •GB18030. Un formato de codificación Unicode definido por el gobierno chino en el que cada carácter puede usar de uno a cuatro bytes.
Informatica es una aplicación Unicode. El cliente de PowerCenter, el servicio de integración de PowerCenter y el servicio de integración de datos usan UCS-2 internamente. El cliente de PowerCenter convierte la entrada de usuario desde cualquier idioma a UCS-2 y la convierte desde UCS-2 antes de grabarla en el repositorio de PowerCenter. El servicio de integración de PowerCeter y el servicio de integración de datos convierten los datos de origen a UCS-2 antes de procesarlos y los convierten desde UCS-2 tras el proceso. El repositorio de PowerCenter, el repositorio de modelos, el servicio de integración de PowerCenter y el servicio de integración de datos son compatibles con UTF-16LE. Puede usar Informatica para procesar datos en cualquier idioma.
Cómo trabajar con un repositorio de PowerCenter en Unicode
La página de códigos del repositorio de PowerCenter es la página de códigos de los datos del repositorio de PowerCenter. La página de códigos del repositorio de PowerCenter se selecciona al crear o actualizar un repositorio de PowerCenter. Cuando la página de códigos de la base de datos del repositorio de PowerCenter es UTF-16LE, puede crear un repositorio de PowerCenter con la página de códigos UTF-16LE.
La base de datos de configuración del dominio usa la página de códigos UTF-16LE. Si tiene que almacenar metadatos en varios idiomas, como en chino, japonés y árabe, debe usar la página de códigos UTF-16LE para todos los servicios de dicho dominio.
El administrador de servicios sincroniza la lista de usuarios en el dominio con la lista de usuarios y grupos de cada servicio de aplicación. Si un usuario del dominio tiene caracteres que la página de códigos de los servicios de aplicación no reconoce, los caracteres no se convierten correctamente y se generan incoherencias.
Use las siguientes directrices cuando utilice UTF-16LE como la página de códigos del repositorio de PowerCenter.
- •La página de códigos de la base de datos del repositorio de PowerCenter debe ser UTF-16LE.
- •La página de códigos del repositorio de PowerCenter debe ser un supraconjunto de las páginas de códigos del cliente de PowerCenter y del servicio de integración de PowerCenter.
- •Puede especificar cualquier carácter en el juego de caracteres UCS-2. Puede almacenar, por ejemplo, los metadatos en alemán, chino e inglés en un repositorio PowerCenter habilitado para UTF-16LE.
- •Instale los idiomas y las fuentes en el equipo cliente de PowerCenter. Si usa un repositorio de PowerCenter UTF-16LE, es posible que quiera habilitar los equipos cliente de PowerCenter para que muestren idiomas diferentes. Como valor predeterminado, los clientes de PowerCenter muestran el texto en el idioma establecido en la configuración regional del sistema. Use la herramienta Opciones regionales en el panel de control para añadir los grupos de idiomas a los equipos cliente de PowerCenter.
- •Puede usar el Editor de métodos de entrada de Windows (IME) para especificar caracteres multibyte de cualquier idioma sin necesidad de ejecutar la versión específica de Windows para dicho idioma.
- •Seleccione una página de códigos para un proceso del servicio de integración de PowerCenter que pueda procesar correctamente todos los metadatos del repositorio de PowerCenter. La página de códigos del proceso del servicio de integración de PowerCenter debe ser un subconjunto de la página de códigos del repositorio de PowerCenter. Si el servicio de integración de PowerCenter tiene varios procesos de servicio, asegúrese de que las páginas de códigos de todos los procesos del servicio de integración de PowerCenter sean subconjuntos de la página de códigos del repositorio de PowerCenter. Si ejecuta el proceso del servicio de integración de PowerCenter en Windows, la página de códigos del proceso del servicio de integración de PowerCenter debe ser la misma que la página de códigos para la configuración regional del sistema o del usuario. Si ejecuta el proceso del servicio de integración de PowerCenter en UNIX, use la página de códigos UTF-16LE para el proceso del servicio de integración de PowerCenter.