インテリジェント構造検出のプロセス
インテリジェント構造モデルは、インテリジェント構造検出を使用して作成できます。
入力ファイルの指定後インテリジェント構造検出は、繰り返し発生するデータパターンの基礎的な部分を判別し、データフィールドとその関係を表す構造を作成します。ログファイル、クリックストリーム、顧客のWebアクセス、エラーテキストファイル、その他業界標準に準拠しないインターネットデータ、センターデータ、デバイスデータなど、ファイルの構造がきわめて複雑で、検出に時間とコストがかかる場合でも、データをすばやくモデル化できます。
次の図は、インテリジェント構造検出が、根底にあるデータパターンを解読し、そのデータパターンのモデルを作成するプロセスを示しています。
モデルがHadoopファイルソースからの入力に基づいている場合、インテリジェント構造検出は、Hadoopスキーマのタイプと構造に基づいてモデルで使用するデータ型を決定します。インテリジェント構造検出は、モデル内にマップ型のデータのキーと値のペアの構造の配列を作成します。Enum型のノードは文字列として表されます。