Inhaltsverwaltung für das Profiling Warehouse
Um Profile und Scorecards zu erstellen und auszuführen, müssen Sie dem Data Integration Service ein Profiling Warehouse zuweisen. Das Profiling Warehouse können Sie beim Erstellen des Data Integration Service oder beim Bearbeiten der Eigenschaften des Data Integration Service angeben.
Das Profiling Warehouse speichert Profiling-Daten und Metadaten. Wenn Sie eine neue Datenbank für ein Profiling Warehouse angeben, müssen Sie den Profiling-Inhalt erstellen. Geben Sie ein bereits existierendes Profiling Warehouse an, können Sie den existierenden Inhalt verwenden oder ihn löschen und neue Inhalte erstellen.
Inhalte für ein Profiling Warehouse können Sie jederzeit löschen. Sie können den Inhalt eines Profiling Warehouse löschen, um verfälschte Daten zu löschen oder um Platz auf dem Laufwerk- bzw. der Datenbank freizugeben.
Erstellen und Löschen von Profiling-Warehouse-Inhalten
Der Datenintegrationsdienst muss ausgeführt werden, wenn Sie Inhalte für das Profiling-Warehouse erstellen.
1Klicken Sie im Administrator Tool auf die Registerkarte Verwalten > Ansicht Dienste und Knoten.
2Wählen Sie im Domänennavigator einen Datenintegrationsdienst aus, der über ein zugehöriges Profiling-Warehouse verfügt.
3Um Inhalt für das Profiling-Warehouse zu erstellen, klicken Sie im Menü „Aktionen“ auf die Registerkarte Verwaltenund wählen Sie Profiling-Warehouse-Datenbankinhalte > Erstellen aus.
4Um Inhalt aus dem Profiling-Warehouse zu löschen, klicken Sie im Menü „Aktionen“ auf die Registerkarte Verwalten und wählen Sie Profiling-Warehouse-Datenbankinhalte > Löschen aus.
Datenbankverwaltung
Sie müssen das Wachstum der Profiling-Warehouse-Datenbank regelmäßig überprüfen und verwalten. Sie können Profilinformationen, die Sie nicht mehr benötigen, entfernen und Profiling Warehouse-Tabellen überwachen oder aufrechterhalten.
Wartungsanforderungen sind von verschiedenen Szenarien abhängig, z. B. kurzfristige Projekte oder wenn Sie die Profilergebnisse nicht mehr benötigen. Sie können nicht verwendete Profilergebnisse löschen und den für die Ergebnisse genutzten Datenbankspeicherplatz für andere Anforderungen freimachen.
Purge
Bereinigt Profil- oder Scorecard-Ergebnisse aus dem Profiling Warehouse. Der Befehl infacmd ps Purge löscht alle Profil- und Scorecard-Ergebnisse mit Ausnahme der Ergebnisse aus der aktuellen Profil- oder Scorecard-Ausführung.
Der Befehl „infacmd ps Purge“ verwendet die folgende Syntax:
Purge
<-DomainName|-dn> domain_name
[<-Gateway|-hp> gateway_name]
[<-NodeName|-nn>] node_name
<-UserName|-un> user_name
<-Password|-pd> Password
[<-SecurityDomain|-sdn> security_domain]
<-MrsServiceName|-msn> MRS_name
<-DsServiceName|-dsn> data_integration_service_name
<-ObjectType|-ot> object_type
<-ObjectPathAndName|-opn> MRS_object_path
[<-RetainDays|-rd> results_retain_days]
[<-ProjectFolderPath|-pf> project_folder_path]
[<-ProfileName|-pt> profile_task_name]
[<-Recursive|-r> recursive]
[<-PurgeAllResults|-pa> purge_all_results]
In der folgenden Tabelle werden die Optionen und Argumente für „infacmd ps Purge“ beschrieben:
Option | Argument | Beschreibung |
|---|
-DomainName -dn | domain_name | Erforderlich. Der Name der Informatica-Domäne. Sie können den Domänennamen mit der Option -dn oder der Umgebungsvariable INFA_DEFAULT_DOMAIN festlegen. Wenn Sie einen Domänennamen mit beiden Methoden festlegen, hat die Option -dn Vorrang. |
-Gateway -hp | gateway_name | Optional, wenn Sie den Befehl aus dem Informatica-Installationsverzeichnis \bin ausführen. Erforderlich, wenn Sie den Befehl von einem anderen Speicherort aus ausführen. Der Name des Gateway-Knotens. Verwenden Sie folgende Syntax: [Domain_Host]:[HTTP_Port] |
-NodeName -nn | node_name | Erforderlich. Der Name des Knotens, auf dem der Datenintegrationsdienst ausgeführt wird. |
-UserName -un | user_name | Erforderlich, wenn die Domäne die native oder die LDAP-Authentifizierung verwendet. Benutzername zum Herstellen einer Verbindung zur Domäne. Sie können den Benutzernamen mit der Option -un oder der Umgebungsvariable INFA_DEFAULT_DOMAIN_USER festlegen. Wenn Sie einen Benutzernamen mit beiden Methoden festlegen, hat die Option -un Vorrang. Optional, wenn die Domäne Kerberos-Authentifizierung verwendet. Zum Ausführen des Befehls mit Single Sign-On legen Sie den Benutzernamen nicht fest. Wenn Sie den Benutzernamen festlegen, wird der Befehl ohne Single Sign-On ausgeführt. |
-Password -pd | Password | Erforderlich, wenn Sie den Benutzernamen angeben. Passwort für den Benutzernamen. Beim Passwort wird die Groß-/Kleinschreibung beachtet. Sie können ein Passwort mit der Option -pd oder der Umgebungsvariable INFA_DEFAULT_DOMAIN_PASSWORD festlegen. Wenn Sie ein Passwort mit beiden Methoden festlegen, hat das mit der Option „-pd“ festgelegte Passwort Vorrang. |
-SecurityDomain -sdn | security_domain | Erforderlich, wenn die Domäne LDAP-Authentifizierung verwendet. Optional, wenn die Domäne native Authentifizierung oder Kerberos-Authentifizierung verwendet. Name der Sicherheitsdomäne, zu der der Domänenbenutzer gehört. Sie können eine Sicherheitsdomäne mit der Option -sdn oder der Umgebungsvariable INFA_DEFAULT_SECURITY_DOMAIN festlegen. Wenn Sie einen Sicherheitsdomänennamen mit beiden Methoden festlegen, hat die Option -sdn Vorrang. Der Name der Sicherheitsdomäne unterliegt der Groß-/Kleinschreibung. Wenn die Domäne eine native oder eine LDAP-Authentifizierung verwendet, ist der Standardwert „Nativ“. Wenn die Domäne Kerberos-Authentifizierung verwendet, ist die während der Installation erstellte LDAP-Sicherheitsdomäne der Standardwert. Der Name der Sicherheitsdomäne ist mit dem während der Installation angegebenen Benutzerbereich identisch. |
-MrsServiceName -msn | MRS_name | Erforderlich. Der Modellrepository-Dienstname. |
-DsServiceName -dsn | data_integration_service_name | Erforderlich. Der Datenintegrationsdienst-Name. |
-ObjectType -ot | - | Erforderlich. Geben Sie ein Profil oder eine Scorecard ein. |
-ObjectPathAndName -opn * | MRS_object_path | Optional. Nicht mit ProjectFolderPath oder Recursive verwenden. Der Pfad zum Profil oder zur Scorecard im Modellrepository. Verwenden Sie folgende Syntax: ProjectName/FolderName/.../{SubFolder_Name/ObjectName|ProjectName/ObjectName} |
-RetainDays -rd | results_retain_days | Optional. Gibt den Zeitraum für die Profil- und Scorecard-Ergebnisse an, die für die Speicherung im Profiling Warehouse geeignet sind. Der Datenintegrationsdienst löscht die übrigen Profil- und Scorecard-Ergebnisse. Wenn Sie beispielsweise -rd 10 eingeben, werden die Ergebnisse vom aktuellen Tag und den letzten neun Tagen beibehalten und die übrigen Ergebnisse werden aus dem Profiling Warehouse gelöscht. |
-ProjectFolderPath -pf * | project_folder_path | Optional. Nicht mit ObjectPathAndName oder ProfileTaskName verwenden. Die Namen des Projekts und Ordners, in denen das Profil oder die Scorecard gespeichert ist. Verwenden Sie folgende Syntax: ProjectName/FolderName |
-ProfileName -pt * | profile_task_name | Optional. Der Name der Profilaufgabe, die Sie löschen möchten. Wenn ein Ordner nur ein Profil aufweist, können Sie nur die Option ProjectFolderPath verwenden, da ProjectFolderPath den Namen des Profils enthält, das die Profilaufgabe enthält. Wenn ein Ordner mehrere Profile in einem Ordner aufweist, müssen Sie für die Angabe des Profilnamens die Optionen ProfileName und ProjectFolderPath kombinieren. |
-Recursive -r | recursive | Optional. Nicht mit ObjectPathAndName verwenden. Wendet den Befehl auf Objekte in dem von Ihnen angegebenen Ordner und seinen Unterordnern an. |
-PurgeAllResults -pa | purge_all_results | Optional. Legen Sie diese Option fest, um alle Ergebnisse für das Profil- oder Scorecard-Objekt zu bereinigen. Verwenden Sie die -recursive-Option, um den Befehl auf Profil- und Scorecard-Ergebnisse in dem angegebenen Ordner und seinen Unterordnern anzuwenden. |
* Um den Befehl auszuführen, müssen Sie ObjectPathAndName oder ProjectFolderPath oder ProfileTaskName angeben. |
Tablespace-Wiederherstellung
Als Teil des regulären Profiloperationen schreibt der Datenintegrationsdienst Profilergebnisse in das Profiling-Warehouse und löscht die Ergebnisse aus dem Profiling-Warehouse. Die Indizes und Basistabellen können über einen gewissen Zeitraum fragmentiert werden. Sie müssen den freien Speicherplatz zurückgewinnen, insbesondere für indexbasierte Tabellen in der Oracle-Datenbank.
Die meisten der Profiling-Warehouse-Tabellen enthalten relativ kleine Datenmengen. Sie müssen daher den freien Tablespace- und Indexplatz nicht wiederherstellen.
Die folgenden Tabellen speichern große Mengen von Profildaten. Ein Löschen der Tabellen kann zu fragmentierten Tabellen führen:
Name | Beschreibung |
|---|
IDP_FIELD_VERBOSE_SMRY_DATA | Speichert die Werthäufigkeiten |
IDP_VERBOSE_FIELD_DTL_RES | Speichert die zwischengespeicherten Daten |
Wenn Sie die Tablespace-Wiederherstellung ausführen, stellen Sie sicher, dass kein Benutzer eine Profilaufgabe ausführt. Nach der Wiederherstellung der Daten aktualisieren Sie die Datenbankstatistiken, um die geänderte Struktur anzuzeigen.
IBM DB2
Es wird empfohlen, den Datenintegrationsdienst herunterzufahren, wenn Sie Tabellen und Indizes umstrukturieren.
Um die Datenbank für eine Tabelle wiederherzustellen, führen Sie den folgenden Befehl aus:
REORG TABLE <TABLE NAME>
REORG INDEXES ALL FOR TABLE <TABLE NAME> ALLOW WRITE ACCESS CLEANUP ONLY ALL
Oracle
Sie können indexbasierte Tabellen in Oracle neu erstellen. Bei dieser Aktion werden ungenutzte Fragmente im Index wiedergewonnen und auf die Profiling-Warehouse-Tabellen IDP_FIELD_VERBOSE_SMRY_DATA und IDP_FIELD_VERBOSE_SMRY_DATA angewendet.
Um die Datenbank für eine Tabelle wiederherzustellen, führen Sie den folgenden Befehl aus:
ALTER TABLE <Table Name> MOVE ONLINE
Microsoft SQL Server
Microsoft SQL Server gewinnt ungenutzen Speicherplatz für den Tablespace zurück und komprimiert Indizes, wenn Zeilen gelöscht werden. Sie müssen die Datenbank nicht aufrechterhalten.
Datenbankstatistiken
Aktualisieren Sie die Datenbankstatistiken, damit die Datenbank Abfragen zum Profiling-Warehouse schnell durchführen kann.
Datenbankstatistiken zu IBM DB2
IBM DB2 empfiehlt die Ausführung des RUNSTATS-Befehls zum Aktualisieren der Statistiken, wenn eine Tabelle häufig aktualisiert oder umstrukturiert wurde.
Um die Statistiken zu aktualisieren, führen Sie den folgenden Befehl aus:
RUNSTATS ON TABLE <TABLE NAME> WITH DISTRIBUTION AND DETAILED INDEXES ALL
Datenbankstatistiken zu Oracle
Oracle erfasst standardmäßig Datenbankstatistiken, ohne dass eine Aktion erforderlich ist. Weitere Informationen finden Sie in der Dokumentation zu Oracle zum Befehl DBMS_STATS.
Datenbankstatistiken zu Microsoft SQL Server
Microsoft SQL Server erfasst standardmäßig Statistiken, ohne dass eine Aktion erforderlich ist. Weitere Informationen zum Aktualisieren der Statistik über die empfohlene Standardoption hinaus finden Sie in der Dokumentation für SQL Server zum Befehl UPDATE STATISTICS.