重複レコード > 重複レコードの概要
  

重複レコードの概要

重複レコードを修正するには、重複レコードのクラスタを調べて、データベースに保存するレコードと破棄するレコードを決定します。 クラスタ内の他のレコードの値で優先レコードを更新できます。
クラスタは一連のレコードであり、各レコードが、一致スコアに基づいて1つ以上の他のレコードと一致します。 各クラスタには優先レコードがあります。 優先レコードには、クラスタ内の情報を最も正確に表しているものが入ります。優先レコードは、データベースに保存するレコードです。 クラスタ内の他のレコードは重複したレコードです。 デフォルトでは、Analystツールにより、クラスタ内の最初のレコードが優先レコードとして選択されています。 クラスタを編集するときには、クラスタ内の他の重複レコードの最も正確なフィールド値で優先レコードを更新します。
レコードがクラスタ内の他のレコードと重複しない場合、そのレコードをクラスタから削除できます。 レコードはクラスタ間で移動させることができます。 レコードが一意の場合、クラスタを1つのレコードで作成することができます。
すべての重複レコードクラスタを確認し、重複レコードの各クラスタの優先レコードを1つ承認したら、タスクを完了します。
注: 2つ以上のレコードが同じ業務情報を含む場合、それらは重複レコードです。レコードには類似データが含まれていることがありますが、その業務にとって同じ情報を表していない可能性があります。 重複データを定義する業務ルールを組織で決定する必要があります。 例えば、同じ顧客のアカウントレコードを複数保持している場合があります。