Please enable JavaScript to view this site.

DATA|SUITE Handbuch

 

dupeit 2

 

Hier können Sie die Act! Felder auswählen, anhand derer die Datensätze auf Dubletten überprüft werden sollen. Passend dazu gibt es auch die Möglichkeit, eine Gewichtigung bei der Überprüfung vorzunehmen. Belassen Sie im Normalfall alle Gewichtungen auf Normal. Falls gewünscht, können Sie einzelne Spalten mehr oder weniger stark gewichten. Wählen Sie Identical, wenn beim Vergleich in dieser Spalte exakte Übereinstimmung erforderlich ist.

 

Bei der Dublettenüberprüfung werden Datensatzgruppen gebildet, sogenannte Cluster. Innerhalb dieser Gruppe haben alle Datensätze denselben Wert im Feld Ort, zum Beispiel. Das Feld, mit Hilfe dessen die Cluster gebildet werden, kann hier von Ihnen  bestimmt werden, indem Sie ein Häkchen in der Spalte Cluster setzen. Je kleiner die einzelnen Cluster, desto schneller die Dublettenüberprüfung. Markieren Sie 2-4 (in Einzelfällen auch mehr) Spalten, die für die Clusterbildung herangezogen werden sollen. Diese Spalten sollten sehr gut mit Daten gefüllt sein. Wählen Sie hier nur Spalten vom Typ Zeichenkette. Postleitzahlen sind für die Clusterbildung ungeeignet. Bei Adressdaten wählen Sie z.B. Nachname, Straße, Ort.

 

Markieren Sie NULL-Vergleich für Spalten, die in den meisten Datensätzen Werte enthalten (z.B. Nachname, Straße, PLZ, Ort). Für sonstige Spalten, die in Ihrer Datenbank schlecht gefüllt sind, markieren Sie NULL-Vergleich nicht (z.B. Vorname, Telefon, Fax, ...).

Beim NULL-Vergleich werden auch leere Einträge (NULL-Werte) für die Berechnung der durchschnittlichen Übereinstimmung herangezogen.

 

Markieren Sie mehrere Felder, die für die Dublettensuche herangezogen werden sollen. Verwenden Sie möglichst mehr als 3 Felder. Bei Adressdaten wählen Sie typischerweise Nachname, Vorname, eventuell Firma, PLZ, Strasse und Stadt.

Innerhalb der markierten Felder wird das Programm dann bei der Dublettensuche mit Hilfe von unscharfen Vergleichsalgorithmen jeweils eine Übereinstimmung berechnen. Anschliessend wird daraus die durchschnittliche Übereinstimmung zweier Datensätze berechnet.

 

Gehen Sie dann auf das neues schema erstellen 14 Symbol. Mit dem Pfeil Symbol gelangen Sie zum nächsten Abschnitt Option.