Excel – Dubletten prüfen (1)

Adresstabellen sind anfällig für doppelte und dreifache Einträge – vor allem, wenn mehrere Mitarbeiter an dieser Tabelle schreiben oder wenn die Adressen aus mehreren Tabellen zusammenkopiert werden. Excel bietet ab 2007 die Kennzeichnung und sogar das Löschen doppelter Einträge an. Heute geht es um die Kennzeichnung, morgen um das Löschen der Dubletten.

Tipp: Bevor Sie sich auf das Löschen der Dubletten einlassen, sollten Sie sie unbedingt vorher anzeigen lassen! Der Befehl “Daten / Dublikate entfernen” tut blitzschnell genau das: alle doppelten Einträge löschen! Sie werden nicht vorher angezeigt.

In der Tabelle oben gibt es zweimal Maier, dreimal Müller und zweimal Bauer – letzter sogar mit gleichem Vornamen. Aber Dubletten sind das nicht! Nur die Zeilen 9 und 10 sind tatsächlich doppelt. Hier stimmen Vor- und Nachname sowie die gesamte Adresse überein.

Excel bietet die Dubletten-Markierung mit der bedingten Formatierung an. Markieren Sie alle Spalten und wählen Sie “Start / Bedingte Formatierung / Regeln zum Hervorheben von Zellen”.

Wählen Sie “Doppelte Werte” und stellen Sie anschließend ein, mit welcher Farbe die Markierung erfolgen soll.

Das Ergebnis ist eher unbefriedigend, denn in den Spalten PLZ und Ort werden alle Einträge rot markiert. Klar, die Orte kommen mehrfach vor. Das ist nicht gerade übersichtlich.

Ich erstelle mir in solchen Fällen eine Hilfsspalte und kombiniere dort die wichtigsten Einträge, die eine Adresse charakterisieren: Vor- und Nachname, Straße, PLZ und (wenn vorhanden) Telefonnummer. Heraus kommt ein langer Rattenschwanz mit Buchstaben und Zahlen, der aber eindeutig ist.

Verwendet wird die Funktion VERKETTEN.

In F2 sehen Sie die Formel, darunter die fertigen Einträge. Auf den Ort verzichte ich, weil er mit der PLZ eindeutig bestimmt wird. Ich wende jetzt die bedingte Formatierung “Doppelte Werte” nur auf die Spalte F an.

Zum Schluss filtere ich in der Spalte F nach der Füllfarbe “rot”:

Hinweis! Diese Dublettenprüfung ist sehr vereinfacht, sie genügt in keiner Weise einer komplexen Dublettenprüfung. Beispielsweise berücksichtige ich nicht unterschiedliche Schreibweisen (Mueller und Müller sind identisch) oder Abkürzungen (Werner Maier oder W. Maier).

Werbeanzeigen

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google Foto

Du kommentierst mit Deinem Google-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s