Intelligent Data Lake
ここでは、バージョン10.1.1の新しいIntelligent Data Lake機能について説明します。
外部ソース内のテーブルのデータプレビュー
バージョン10.1.1では、外部(Hadoopデータレイク外)テーブルのサンプルデータをプレビューできます(これらのソースがカタログ化されている場合)。管理者は、SqoopとのJDBC接続を構成してアナリストに必要な権限を提供する必要があります。アナリストは、これらの接続を使用してデータソースに接続し、データレイクにないアセットからデータを表示できます。
詳細については、『10.1.1 Intelligent Data Lakeユーザーガイド』の「データの検出」の章を参照してください。
外部ソースのテーブルからのデータのインポート
バージョン10.1.1では、OracleやTeradataなどの外部ソース(Hadoopデータレイク外)のテーブルからデータをデータレイクにインポートできます(これらのソースがすでにカタログ化されている場合)。管理者は、外部ソースへのSqoopとJDBC接続を構成して、アナリストへのアクセスを提供する必要があります。アナリストは、これらの接続を使用してデータアセットをプレビューし、ニーズに基づいてレイクにインポートできます。
詳細については、『10.1.1 Intelligent Data Lakeユーザーガイド』の「データの検出」の章を参照してください。
外部ターゲットへのデータのエクスポート
バージョン10.1.1では、OracleやTeradataなどの外部ターゲット(Hadoopデータレイク外)にデータアセットまたはパブリケーションをエクスポートできます。管理者は、外部ソースへのSqoopとJDBC接続を構成して、アナリストへのアクセスを提供する必要があります。アナリストはこれらの接続を使用して、データアセットを外部データベースにエクスポートできます。
詳細については、『10.1.1 Intelligent Data Lakeユーザーガイド』の「データの検出」の章を参照してください。
データ準備のためのサンプリング条件の設定
バージョン10.1.1では、特定のデータアセットに対するデータ準備のニーズに最適なサンプリング条件を指定できます。準備中にいくつかのカラムのみを含めるように選択し、データをフィルタ処理して、サンプルする行数を選択し、サンプルとしてランダムまたは最初のN行を選択できます。
詳細については、『10.1.1 Intelligent Data Lakeユーザーガイド』の「データの準備」の章を参照してください。
ワークシートでのルックアップの実行
バージョン10.1.1では、ルックアップを実行できます。ルックアップ関数を使用して、別のシート内のキーカラムを検索し、そのルックアップ先のシート内の対応する他のカラムの値をフェッチします。
詳細については、『10.1.1 Intelligent Data Lakeユーザーガイド』の「データの準備」の章を参照してください。
TDEファイルとしてダウンロードする
バージョン10.1.1では、データレイクアセットのデータをTDEファイルとしてダウンロードできます。Tableauでダウンロードしたファイルを直接開くことができます。任意のデータアセットを検索し、CSVファイルまたはTDEファイルとしてダウンロードできます。
詳細については、『10.1.1 Intelligent Data Lakeユーザーガイド』の「データの検出」の章を参照してください。
SentryとRangerのサポート
バージョン10.1.1では、Intelligent Data LakeはClouderaおよびHortonworksでSentryとRangerをサポートします。RangerとSentryは、ClouderaおよびHortonworksできめ細かいレベルのアクセス制御を管理するための一元的なセキュリティフレームワークを提供します。データのアクセスを制御するための認証規則またはポリシーを作成できます。SentryとRangerは、SQLベースのデータレイクアセットの承認をサポートします。