Selbstdatenschutz: Der Fluch besonders origineller Benutzernamen / Online-Tool zum Test des "Entropiewerts"

von Dr. Michael Karger, veröffentlicht am 26.02.2011

Selbst-Vermarktung im Internet: Die erste Frage beim Einstieg bei Twitter oder in ein soziales Netzwerk ist: Welchen Benutzernamen wähle ich? Wird der Klarname verlangt, gibt's keine Wahl. Kann ich ein Psyeudonym wählen, dann heißt die Prämisse doch: Je einzigartiger, je unverwechselbarer, desto besser!

 

"Think twice!" rät eine Studie des Institut National De Recherche En Informatique et En Automatique (kurz: INRIA). Die Untersuchung hat ergeben, dass viele Nutzer dazu neigen, den gewählten Benutzernamen nicht nur einmal, sondern gleich mehrfach auf verschiedenen Plattformen zu verwenden. Je origineller und unverwechselbarer der Benutzername, desto besser läßt er sich von Datensammlern verfolgen - ein besonders einfacher Weg für "Marketer" und "Scammer", an Personenprofile zu gelangen - siehe hierzu auch den Bericht in Technology Review.

 

Beispiele: Aktive "Selbstdatenschützer" sollten darauf achten, dass ihr Benutzername einen geringen "Entropie"-Wert hat, also wenig Informationsgehalt aufweist und wenig unterscheidungskräftig ist. So weisen z.B. die Benutzernamen

  • “ladygaga” oder
  • “12345678″

nur einen sehr geringen Entropiewert von 24 bzw. 17 bits auf.

 

Wer es den Tracern dagegen einfach machen möchte, sollte Benutzernamen wie 

  •  “pdjkwerl” oder
  •  “yourejerky”

wählen, die einen hohen Entropiewert von ca. 40 bits aufweisen.

 

Die vorgenannten Beispiele finden sich auf der Website des INRIA Planete Teams, das wegen eines "Entropie-Checker-Tools" unbedingt einen Besuch wert ist, weil man dort den Entropiewert seiner Benutzenamen selbst überprüfen kann: Einfach den Namen in die Maske eingeben und das System gibt gleich Rückmeldung. Hier das Link zu "How unique are your usernames?"

 

Bei Eingabe eines eher ungewöhnlichen Testnamens habe ich etwa die folgende Anwort bekommen: "Your username has an "entropy" (specifically, Information Surprisal) of 38.52 bits. Based on our estimations, your username appears to uniquely identify you on the Internet."

 

Alternativ kann man auch zwei Namen eingeben, um überprüfen zu lassen, wie hoch die Wahrscheinlichkeit ist, dass diese Namen miteinander in Verbindung gebracht werden.

 

Hier noch das Link zu und der Titel der lesenswerten Studie (Zeit und Verständnis für Formeln erforderlich): Perito / Castelluccia / Kaafar / Manils, How Unique and Traceable are Usernames? arXiv:1101.5578v2 [cs.CR].

 

 

Diesen Beitrag per E-Mail weiterempfehlenDruckversion

Hinweise zur bestehenden Moderationspraxis
Kommentar schreiben

2 Kommentare

Kommentare als Feed abonnieren

Das Thema ist informationstheoretisch sehr interessant, das Online-Tool aber offenbar nicht für den Datenschutz brauchbar.

Das liegt daran, dass die Einzigartigkeit von Nicknames nur bedingt mit ihrer "Entropie" (hier nicht im klassischen Sinne) zusammen hängt und mehr mit soziokulturellen Aspekten. Empirische Ansätze halte ich da für aussagekräftiger. Gut abzulesen ist die Schwäche anhand weltweit sehr häufiger Nicknames: Homer soll mit einer "Entropie" von 16,22 Bit, identifizierend in einer Menge von 76.332, nur geringfügig besser sein als mein eigener Vorname mit 16,73 Bit, identifizierend in 108.701. Ein Darthvader soll dagegen sogar unter theoretisch 382.265.564 Usern identifizierbar sein.

0

Das Problem ist aber, dass ein nicht-wiedererkennbarer Username in gewissen Zusammenhängen ein großer Nachteil ist.  Abgesehen davon, dass man evt. bei EINEM geknackten Passwort dieses auf alle anderen, gleichnamigen Accounts anwenden könnte, ist die Nicht-Wiedererkennbarkeit eben nicht immer ein Feature.

Das betrifft das Verhältnis Öffentlichkeit zur Privatsphäre. Wer twittert oder in anderen sozialen Netzwerken unterwegs ist, will oftmals wiedererkannt werden.

0

Kommentar hinzufügen