Data Mining

»Anti-Terror-Maßnahme«

Medienberichten zufolge hat ein deutscher Telekom-Provider nach den Anschlägen vom 11. September 2001 im Auftrag des deutschen Bundeskriminalamts zwecks Identifizierung potenzieller »Schläfer« rechtswidriger Weise ein Data Mining der gespeicherten Verkehrsdaten vorgenommen. Aufgrund der Umsetzung der Vorratsdatenspeicherungs-Richtlinie in Deutschland wären heute wesentlich mehr Daten – insbesondere wer wann wem von welchem Ort aus eine E-Mail gesendet hat – einem etwaigen Data Mining ausgesetzt.

Bei Data Mining handelt es sich um ein Verfahren zur Entdeckung aussagekräftiger Korrelationen, Muster und Trends mithilfe der Untersuchung großer Datenmengen, wobei Pattern-Erkennungs-Techniken sowie statistische und andere mathematische Methoden eingesetzt werden.

Jede Form des Data Minings zur Identifizierung von »Terror-Verdächtigen« führt notwendigerweise zu zwei verschiedenen Arten von Fehlern: (1) »false positives« sind jene Fehler bei denen eine Person fälschlich als verdächtig eingestuft wird; (2) »false negatives« sind jene Fehler bei denen ein Terrorist als unverdächtig eingestuft wird. Da die Anzahl der Terroristen im Verhältnis zur Menge aller erfassten Personen verschwindend klein ist, handelt es sich um eine Suche nach der Nadel im Heuhaufen. Um beispielsweise in einer Menge von 8 Mio. Personen auch nur einen von 8 Terroristen zu finden, müsste die Rate der »false negatives« weniger als 1 in 1 Mio. betragen. Um eine derartig niedrige »false negative«-Rate zu erhalten, benötigt man entweder ein sehr genaues oder ein sehr weites »Profil eines Terroristen“. Ein präzises Profil eines typischen Terroristen lässt sich nicht erstellen. So warnt z.B. das U.S. Department of Homeland Security derzeit vor Terror-Akten durch Irak-Kriegs-Veteranen. Es müssen daher sehr weit definierte Profile eingesetzt werden, um die »false negative«-Rate entsprechend gering zu halten. Dies bedeutet jedoch, dass sich die »false positive«-Rate drastisch erhöht. Selbst wenn man annimmt, dass sie nur 1 in 1000 beträgt (99,9% Treffsicherheit), so würde dies bei einer Menge von 8 Mio. Personen zu 8000 fälschlich verdächtigten Personen führen. Will man die »false negatives«-Rate weiter senken, um im genannten Beispiel nicht nur einen von acht Terroristen zu identifizieren, so würde sich die »false positive«-Rate noch weiter erhöhen.

Im genannten Beispiel 7 von 8 Terroristen nicht zu identifizieren, jedoch 8000 Personen zu Unrecht zu verdächtigen, kann aus technischer Sicht kaum als effektive »Anti-Terror-Maßnahme“ bezeichnet werden.

Aus grundrechtlicher Sicht stellt sich zudem die Frage der Verhältnismäßigkeit eines in qualitativer als auch quantitativer Hinsicht derart massiven Grundrechtseingriffs. Es sind dabei einerseits das öffentliche Interesse an der Maßnahme und andererseits das Interesse der Betroffenen abzuwägen. Da selbst bei äußerst geringen »false positive«-Raten nur eine kleine Anzahl der gesuchten Terroristen identifiziert werden kann, ist das öffentliche Interesse im Verhältnis zum Interesse der Vielen durch das Data Mining zu Unrecht Verdächtigten als geringer einzustufen. Anderes kann nur dann gelten, wenn aufgrund der Genauigkeit des Profils die »false positive«- als auch die »false negative«-Raten nahe bei Null gehalten werden können – dies ist jedoch gerade bei der Suche nach »Terror-Verdächtigen« typischer Weise nicht der Fall.

Mag. Lukas Feiler, SSCP, Vize-Direktor des e-center

www.e-center.eu

No Comments Yet.

Leave a Comment

You must be logged in to post a comment.