Directorios para los archivos del Servicio de integración de datos
El Servicio de integración de datos accede a directorios de archivos cuando lee archivos de origen, cuando lee archivos de control, cuando escribe archivos de salida y cuando escribe archivos de registro. Cuando el Servicio de integración de datos se ejecuta en varios nodos, puede que sea necesario configurar algunas de las propiedades de directorio para utilizar un único directorio compartido a fin de garantizar que los procesos que se ejecutan en cada nodo puedan acceder a todos los archivos.
Directorios de archivos de origen y de salida
Configure los directorios de los archivos de origen y de salida en las opciones de ejecución de la vista Propiedades para el Servicio de integración de datos.
El Servicio de integración de datos accede a los archivos de origen cuando ejecuta una asignación o una operación de servicio web que lee desde un origen de archivo sin formato. El servicio genera archivos de salida cuando ejecuta asignaciones, asignaciones incluidas en un flujo de trabajo, perfiles, consultas SQL a un servicio de datos SQL, o solicitudes de operaciones de servicio web. En función de la configuración de la memoria caché de la transformación y de los tipos de destino, el Servicio de integración de datos puede generar archivos de memoria caché, de rechazo, de destino o temporales.
Al configurar los directorios para los archivos de origen y de salida, configura las rutas de acceso para el directorio de inicio y sus subdirectorios. El valor predeterminado de la propiedad Directorio de inicio es <directorio de instalación de Informatica>/tomcat/bin. Si cambia el valor predeterminado, compruebe que el directorio exista.
De forma predeterminada, los siguientes directorios tienen valores relativos al directorio de inicio:
- •Directorios temporales
- •Directorio de la memoria caché
- •Directorio de origen
- •Directorio de destino
- •Directorio de archivos rechazados
Puede definir un directorio diferente relativo al directorio de inicio. O bien, puede definir un directorio absoluto fuera del directorio de inicio.
Si define un directorio absoluto diferente, utilice la sintaxis correcta para el sistema operativo:
- •En Windows, escriba una ruta de acceso absoluta que empiece por una letra de unidad, dos puntos y una barra invertida. Por ejemplo:
C:\<Informatica installation directory>\tomcat\bin\MyHomeDir
- •En UNIX, escriba una ruta de acceso absoluta que empiece por una barra inclinada. Por ejemplo:
/<Informatica installation directory>/tomcat/bin/MyHomeDir
Los objetos y las transformaciones de datos en Developer tool utilizan parámetros del sistema para acceder a los valores de estos directorios del Servicio de integración de datos. De forma predeterminada, los parámetros del sistema están asignados a campos del directorio de archivos sin formato, del directorio de archivos de memoria caché y del directorio de archivos temporales.
Por ejemplo, cuando un desarrollador crea una transformación de agregación en Developer tool, el parámetro del sistema CacheDir es el valor predeterminado asignado al campo del directorio de memoria caché. El valor del parámetro del sistema CacheDir se define en la propiedad Directorio de la memoria caché del Servicio de integración de datos. Los desarrolladores pueden quitar el parámetro predeterminado del sistema e introducir un valor diferente para el directorio de la caché. Sin embargo, las tareas no se ejecutarán si el Servicio de integración de datos no puede acceder al directorio.
Configurar directorios de archivos de origen y de salida para varios nodos
Cuando el Servicio de integración de datos se ejecuta en nodos principales y de copia de seguridad o en una malla, las instancias del DTM pueden ejecutar tareas en cada nodo con la función de cálculo. Cada instancia del DTM debe poder acceder a los directorios de archivos de origen y de salida. Para ejecutar asignaciones que gestionan los cambios en los metadatos en orígenes de archivos sin formato, cada proceso del Servicio de integración de datos debe poder acceder a los directorios de archivos de origen.
Al configurar los directorios de archivos de origen y de salida para un Servicio de integración de datos que se ejecuta en varios nodos, tenga en cuenta las siguientes directrices:
- •Puede configurar la propiedad Directorio de origen para utilizar un directorio compartido para crear un directorio para los archivos de origen.
Si ejecuta asignaciones que gestionan los cambios en los metadatos en orígenes de archivos sin formato y la malla del Servicio de integración de datos está configurada para ejecutar tareas en procesos remotos independientes, debe configurar la propiedad Directorio de origen para utilizar un directorio compartido.
Si ejecuta otros tipos de asignaciones o si ejecuta asignaciones que gestionan los cambios en los metadatos en orígenes de archivos sin formato en cualquier otra configuración de malla del Servicio de integración de datos, puede configurar diferentes directorios de origen para cada nodo con la función de cálculo. Replique todos los archivos de origen en todos los directorios de origen.
- •Si ejecuta asignaciones que utilizan una memoria caché de búsqueda persistente, debe configurar la propiedad Directorio de la memoria caché para utilizar un directorio compartido. Si ninguna asignación utiliza una memoria caché de búsqueda persistente, puede configurar el directorio de la memoria caché para que tenga un directorio diferente para cada nodo con la función de cálculo.
- •Puede configurar las propiedades Directorio de destino, Directorios temporales y Directorio de archivos de rechazo para que tengan diferentes directorios para cada nodo con la función de cálculo.
Para configurar un directorio compartido, configure el directorio en Opciones de ejecución en la vista Propiedades. Puede configurar un directorio compartido para el directorio principal de modo que todos los directorios de archivos de origen y de salida utilicen el mismo directorio inicial compartido. O bien, puede configurar un directorio compartido para un directorio de archivos de origen o de salida específico. Quite cualquier valor reemplazado para la misma opción de ejecución en la vista Cálculo.
Para configurar diferentes directorios para cada nodo con la función de cálculo, configure el directorio en Opciones de ejecución en la vista Cálculo.
Directorios de archivos de control
El Servicio de integración de datos accede a los archivos de control cuando ejecuta asignaciones que generan columnas para orígenes de archivos sin formato basados en archivos de control. Cuando el Servicio de integración de datos ejecuta la asignación, obtiene los metadatos del archivo de control del origen del archivo sin formato.
Utilice Developer tool para configurar el directorio de archivos de control para cada objeto de datos de archivo sin formato que esté configurado para generar nombres de columna en tiempo de ejecución desde un archivo de control. No se puede utilizar la herramienta del administrador para configurar un único directorio de archivos de control utilizado por el Servicio de integración de datos.
Configurar directorios de archivos de control para varios nodos
Cuando el Servicio de integración de datos se ejecuta en nodos principales y de copia de seguridad o en una malla, los procesos del Servicio de integración de datos pueden ejecutarse en cada nodo con la función de servicio. Cada proceso del Servicio de integración de datos debe ser capaz de acceder a los directorios de archivos de control.
Utilice Developer tool para configurar la propiedad Directorio del archivo de control para cada objeto de datos de archivo sin formato que esté configurado para generar nombres de columna en tiempo de ejecución desde un archivo de control. Configure la propiedad Directorio del archivo de control en las propiedades Avanzadas para el objeto de datos de archivo sin formato. Busque la propiedad en la sección Tiempo de ejecución: Lectura.
Cuando el Servicio de integración de datos se ejecuta en varios nodos, utilice uno de los siguientes métodos para asegurarse de que cada proceso del Servicio de integración de datos tenga acceso a los directorios:
- •Configure la propiedad Directorio del archivo de control para cada objeto de datos de archivo sin formato para utilizar un directorio compartido para crear un directorio para los archivos de control.
- •Configure la propiedad Directorio del archivo de control para cada objeto de datos de archivo sin formato para utilizar una ruta de directorio idéntica que sea local para todos los nodos con la función de servicio. Haga una réplica de todos los archivos de control en el directorio idéntico para cada nodo con la función de servicio.
Directorio de registros
Configure el directorio para los archivos de registro en la vista Procesos del Servicio de integración de datos. Los archivos de registro del Servicio de integración de datos incluyen archivos que contienen eventos de registro del servicio y archivos que contienen eventos de registro de tareas.
De forma predeterminada, el directorio de registros de cada proceso del Servicio de integración de datos se encuentra dentro del directorio de instalación de Informatica en el nodo.
Configurar el directorio de registros para varios nodos
Cuando el Servicio de integración de datos se ejecuta en nodos principales y de copia de seguridad o en una malla, un proceso del Servicio de integración de datos puede ejecutarse en cada nodo con la función de servicio. Configure todos los procesos de servicio para que utilicen el mismo directorio compartido para los archivos de registro.
Al configurar un directorio de registro compartido, se asegura de que, si el proceso de servicio maestro conmuta por error a otro nodo, el nuevo proceso de servicio maestro podrá acceder a los archivos de registro anteriores.
Configure cada proceso de servicio con rutas de acceso absolutas idénticas a los directorios compartidos. Si usa una unidad asignada o una unidad montada, la ruta de acceso absoluta para la ubicación compartida también debe ser idéntica.
Por ejemplo, un proceso de servicio maestro recién seleccionado no puede acceder a los archivos de registro anteriores cuando los nodos utilizan las siguientes unidades para el directorio de registros:
- •Unidad asignada en node1: F:\shared\<directorio de instalación de Informatica>\logs\<node_name>\services\DataIntegrationService\disLogs
- •Unidad asignada en node2: G:\shared\<directorio de instalación de Informatica>\logs\<node_name>\services\DataIntegrationService\disLogs
Un proceso de servicio maestro recién seleccionado tampoco puede acceder a los archivos de registro anteriores cuando los nodos utilizan las siguientes unidades para el directorio de registros:
- •Unidad montada en node1: /mnt/shared/<directorio de instalación de Informatica>/logs/<node_name>/services/DataIntegrationService/disLogs
- •Unidad montada en node2: /mnt/shared_filesystem/<directorio de instalación de Informatica>/logs/<node_name>/services/DataIntegrationService/disLogs
Permisos de archivos de registro y de salida
Cuando un proceso del Servicio de integración de datos genera archivos de registro o de salida, establece los permisos de archivo basándose en el sistema operativo.
Cuando un proceso del Servicio de integración de datos en UNIX genera un archivo de registro o de salida, establece los permisos de archivo basándose en el comando umask del shell que inicia el proceso del Servicio de integración de datos. Por ejemplo, cuando el comando umask del shell que inicia el proceso del Servicio de integración de datos es 022, el proceso del Servicio de integración de datos crea archivos con permisos rw-r--r--. Para cambiar los permisos del archivo, debe cambiar el comando umask del shell que inicia el proceso del Servicio de integración de datos y reiniciarlo después.
Un proceso del Servicio de integración de datos en Windows genera archivos de registro y de salida con permisos de lectura y escritura.