Big Data Management

Hive-Verbindung

Ab Version 10.2.2 werden die folgenden Hive-Verbindungseigenschaften umbenannt:

•Die Eigenschaft „Differenzierte SQL-Autorisierung berücksichtigen“ wird umbenannt in „Differenzierte Autorisierung“.

•Die Eigenschaft „Benutzername“ wird umbenannt in „LDAP-Benutzername“.

In der folgenden Tabelle werden die Eigenschaften beschrieben:

Eigenschaft	Beschreibung
Differenzierte Autorisierung	Wenn Sie die Option zum Berücksichtigen der differenzierten Autorisierung in einer Hive-Quelle auswählen, wird beim Mapping Folgendes berücksichtigt: - Einschränkungen auf Zeilen- und Spaltenebene. Anwendung auf Hadoop-Cluster, in denen die Sicherheitsmodi „Sentry“ oder „Ranger“ aktiviert sind. - Datenmaskierungsregeln. Anwendung auf festgelegte Maskierungsregeln bei Spalten, die sensible Daten per Dynamic Data Masking enthalten. Wenn Sie die Option nicht auswählen, ignorieren die Blaze- und die Spark-Engine die Einschränkungen und Maskierungsregeln, sodass die Ergebnisse eingeschränkte oder sensible Daten enthalten.
LDAP-Benutzername	LDAP-Benutzername, den der Datenintegrationsdienst zum Ausführen von Mappings in einem Hadoop-Cluster verwendet. Der Benutzername richtet sich nach der JDBC-Verbindungszeichenfolge, die Sie in der Metadaten- oder Datenzugriffs-Verbindungszeichenfolge für die native Umgebung angegeben haben. Wenn der Hadoop-Cluster Kerberos-Authentifizierung verwendet, müssen der Prinzipalname der JDBC-Verbindungszeichenfolge und der Benutzername identisch sein. Andernfalls hängt der Benutzername vom Verhalten des JDBC-Treibers ab. Mit dem Hive-JDBC-Treiber können Sie einen Benutzernamen auf viele Arten angeben. Der Benutzername kann zudem Teil der JDBC-URL werden. Wenn der Hadoop-Cluster keine Kerberos-Authentifizierung verwendet, hängt der Benutzername vom Verhalten des JDBC-Treibers ab. Wenn Sie keinen Benutzernamen eingeben, authentifiziert der Hadoop-Cluster Jobs basierend auf den folgenden Kriterien: - Der Hadoop-Cluster verwendet keine Kerberos-Authentifizierung. Er authentifiziert Jobs basierend auf dem Benutzernamen des Betriebssystemprofils des Computers, auf dem der Datenintegrationsdienst ausgeführt wird. - Der Hadoop-Cluster verwendet Kerberos-Authentifizierung. Er authentifiziert Jobs basierend auf dem SPN des Datenintegrationsdiensts. Der LDAP-Benutzername wird ignoriert.

Eigenschaft

Beschreibung

Differenzierte Autorisierung

Wenn Sie die Option zum Berücksichtigen der differenzierten Autorisierung in einer Hive-Quelle auswählen, wird beim Mapping Folgendes berücksichtigt:

- Einschränkungen auf Zeilen- und Spaltenebene. Anwendung auf Hadoop-Cluster, in denen die Sicherheitsmodi „Sentry“ oder „Ranger“ aktiviert sind.
- Datenmaskierungsregeln. Anwendung auf festgelegte Maskierungsregeln bei Spalten, die sensible Daten per Dynamic Data Masking enthalten.

Wenn Sie die Option nicht auswählen, ignorieren die Blaze- und die Spark-Engine die Einschränkungen und Maskierungsregeln, sodass die Ergebnisse eingeschränkte oder sensible Daten enthalten.

LDAP-Benutzername

LDAP-Benutzername, den der Datenintegrationsdienst zum Ausführen von Mappings in einem Hadoop-Cluster verwendet. Der Benutzername richtet sich nach der JDBC-Verbindungszeichenfolge, die Sie in der Metadaten- oder Datenzugriffs-Verbindungszeichenfolge für die native Umgebung angegeben haben.

Wenn der Hadoop-Cluster Kerberos-Authentifizierung verwendet, müssen der Prinzipalname der JDBC-Verbindungszeichenfolge und der Benutzername identisch sein. Andernfalls hängt der Benutzername vom Verhalten des JDBC-Treibers ab. Mit dem Hive-JDBC-Treiber können Sie einen Benutzernamen auf viele Arten angeben. Der Benutzername kann zudem Teil der JDBC-URL werden.

Wenn der Hadoop-Cluster keine Kerberos-Authentifizierung verwendet, hängt der Benutzername vom Verhalten des JDBC-Treibers ab.

Wenn Sie keinen Benutzernamen eingeben, authentifiziert der Hadoop-Cluster Jobs basierend auf den folgenden Kriterien:

- Der Hadoop-Cluster verwendet keine Kerberos-Authentifizierung. Er authentifiziert Jobs basierend auf dem Benutzernamen des Betriebssystemprofils des Computers, auf dem der Datenintegrationsdienst ausgeführt wird.
- Der Hadoop-Cluster verwendet Kerberos-Authentifizierung. Er authentifiziert Jobs basierend auf dem SPN des Datenintegrationsdiensts. Der LDAP-Benutzername wird ignoriert.

Weitere Informationen finden Sie im Informatica Big Data Management 10.2.2-Benutzerhandbuch.

Massenerfassung

Spark-Überwachung

Sqoop

Umwandlungen in der Hadoop-Umgebung

Python-Umwandlung

Schreibumwandlung

Bisher haben Sie die erweiterte Eigenschaft zum Erstellen oder Ersetzen von Zieltabellen aktiviert. Daraufhin entfernte der Datenintegrationsdienst die Zieltabelle zur Laufzeit und ersetzte sie durch eine Tabelle basierend auf einer von Ihnen angegebenen Zieltabelle. Wenn Sie die erweiterte Eigenschaft zum Erstellen oder Ersetzen von Zieltabellen nicht aktivierten, behielt der Datenintegrationsdienst das vorhandene Schema für die Zieltabelle bei.

Bei vorhandenen Mappings mit aktivierter Eigenschaft zum Erstellen oder Ersetzen von Zieltabellen ist bei der Eigenschaft Zielschemastrategie nach dem Upgrade auf Version 10.2.2 standardmäßig die Option CREATE – Tabelle zur Laufzeit erstellen oder ersetzen aktiviert. Bei Mappings mit deaktivierter Option zum Erstellen oder Ersetzen von Zieltabellen ist nach dem Upgrade die v-Eigenschaft für die Option RETAIN – vorhandenes Zielschema beibehalten aktiviert. Wenn nach dem Upgrade nicht die korrekte Zielschemastrategie-Option ausgewählt ist, müssen Sie die erforderliche Option manuell in der Liste Zielschemastrategie auswählen und anschließend das Mapping ausführen.