What's New and Changed (10.5.7) > Teil X: Versionen 10.4-10.4.0.2 > Neue Funktionen in 10.4 > Enterprise Data Preparation
  

Enterprise Data Preparation

In diesem Abschnitt werden neue Funktionen für Enterprise Data Preparation in Version 10.4.0 erläutert.

Data Lake-Zugriffsverwaltung

Ab Version 10.4.0 können Sie den Zugriff auf den Data Lake verwalten, indem Sie Berechtigungen für die Enterprise Data Catalog-Ressourcen, die Hive-Schemas und HDFS-Speicherorte im Data Lake repräsentieren, den Enterprise Data Preparation-Benutzern und ‑Benutzergruppen zuweisen.
Wenn Sie einem Benutzer oder einer Benutzergruppe Berechtigungen für bestimmte Schemas oder Speicherorte gewähren, zeigt die Anwendung nur die Schemas und Speicherorte an, für die der Benutzer über Berechtigungen verfügt, wenn er einen Import- Veröffentlichtungs- oder Upload-Vorgang durchführt.
Weitere Informationen finden Sie im Enterprise Data Preparation 10.4.0-Administratorhandbuch.

Microsoft Azure Data Lake Storage als Datenquelle

Ab Version 10.4.0 können Sie einen Microsoft Azure Data Lake Storage Gen2-Speicherort als Datenquelle verwenden.

Dateien im Data Lake veröffentlichen

Ab Version 10.4.0 können Sie vorbereitete Daten in einer Datei an einem HDFS-Speicherort im Data Lake veröffentlichen.
Wenn Sie Daten veröffentlichen, können Sie den Datentyp auswählen, in den Sie die Daten im Data Lake schreiben möchten. Wenn Sie z. B. die Daten als Datei mit kommagetrennten Werten veröffentlichen möchten, schreibt die Anwendung die Daten als CSV-Datei in den Data Lake.
Weitere Informationen finden Sie im Enterprise Data Preparation 10.4.0-Benutzerhandbuch.

Dateien in den Data Lake hochladen

Ab Version 10.4.0 können Sie mehrere Dateiformate von Ihrem lokalen Laufwerk in den Data Lake hochladen.
Sie können aus den folgenden Upload-Optionen wählen:
Laden Sie eine Datei direkt in den Data Lake hoch.
Sie können eine kommagetrennte Datei, eine Avro-Datei, eine JSON-Datei oder eine Parquet-Datei im UTF-8-Format direkt von Ihrem lokalen Laufwerk in den Data Lake hochladen, ohne eine Vorschau der Daten anzuzeigen. Diese Option können Sie wählen, wenn Sie eine Datei ohne Datenvorschau hochladen möchten.
Lassen Sie die Dateistruktur von CLAIRE analysieren und laden Sie dann die Datei in den Data Lake hoch.
Sie können die Daten in einer kommagetrennten Datei oder in einem Microsoft Excel-Arbeitsblatt in den Data Lake hochladen. Beim Hochladen der Datei verwendet Enterprise Data Preparation die eingebettete CLAIRE-Erkennungs-Engine zum Bestimmen der Dateistruktur und zum Anzeigen einer Datenvorschau.
Wenn Sie diese Option zum Hochladen einer Excel-Arbeitsmappe verwenden, erkennt die CLAIRE-Engine die Arbeitsblätter und Tabellen im Arbeitsblatt. Sie können das Arbeitsblatt bzw. die Tabelle auswählen, für das/die Sie eine Vorschau anzeigen möchten.
HINWEIS: Das Hochladen eines Excel-Arbeitsblatts ist eine Vorschaufunktion.
Definieren Sie die Dateistruktur und laden Sie dann die Datei in den Data Lake hoch.
Sie können die Daten in einer kommagetrennten Datei von Ihrem lokalen Laufwerk in den Data Lake hochladen. Beim Hochladen der Datei können Sie eine Vorschau der Daten anzeigen, die Dateistruktur angeben und die Spaltenattribute entsprechend Ihren Anforderungen konfigurieren. Wählen Sie diese Option, wenn Sie die Spaltenattribute vor dem Hochladen der Datei ändern müssen.
Weitere Informationen finden Sie im Enterprise Data Preparation 10.4.0-Benutzerhandbuch.