リリースガイド > 部 VI: バージョン10.1 > 新製品(10.1) > Intelligent Data Lake
  

Intelligent Data Lake

ビッグデータ技術の広がりを受け、多くの組織が、データ管理の問題を解決するために、データレイクと呼ばれる新しい情報ストレージモデルを採用するようになりました。データレイクモデルは、ビジネスインテリジェンス、分析、法規制への適合、不正検出など、さまざまなケースで採用されつつあります。
データレイクとは、各種のソースから送信されたRawデータやエンタープライズデータを保存する共有リポジトリのことです。多くの場合、データレイクは、分散Hadoopクラスタ上に構築され、経済性と拡張性を備えたパーシスタンスおよびコンピュートレイヤとして機能します。Hadoopを使用すると、組織の内外にある各種エンタープライズシステムからの膨大な構造化データおよび非構造化データを保存できるようになります。レイクには、Rawデータ、絞り込み済みデータ、マスタデータ、トランザクションデータ、ログファイル、マシンデータなどを含めることができます。
組織は、さまざまなタイプのユーザーが、すべてのエンタープライズデータや、Hadoopデータレイク内部のデータ、外部のデータにアクセスし、操作できるようにする手段を提供することにも関心があります。例えば、基盤技術の複雑さを意識したり、コーディングスキルを習得したりせずに、データアナリストやデータサイエンティストが、データレイクを使用して特定目的のセルフサービス分析を行い、事業の技術革新を推し進められるようにしたいと考えています。ITおよびデータガバナンススタッフは、企業内でのデータ関連のユーザーアクティビティを監視する必要があります。インテリジェンスを備えた強力なデータ管理およびガバナンス基盤がなければ、データレイクは単なるデータのたまり場になってしまいます。
バージョン10.1では、Intelligent Data Lakeが導入されました。これは、Hadoopベースのデータレイクからより高い価値を引き出し、組織のすべてのユーザーがデータを利用できるようにするための新製品です。
Intelligent Data Lakeは、データアナリストやデータサイエンティスト向けに開発された、ビッグデータの検出および準備を行うための共同セルフサービスソリューションです。この製品により、アナリストは、Rawデータを迅速に検出して洞察を得ることができ、ITは、品質、可視性、およびガバナンスを確保することができます。Intelligent Data Lakeを使用すると、アナリストは、データの検出や準備に費やす時間を削減して、分析にかける時間を増やすことができます。
Intelligent Data Lakeには、次の利点があります。
Intelligent Data Lakeは、次の機能を備えています。
検索
エクスプローラ
取得
連携
推奨事項
準備
パブリッシュ
データアセットの操作
マイアクティビティ
IT監視
IT運用化