Linguistik

Software identifiziert Autoren anonymer E-Mails gerichtsverwertbar

Kanadische Forscher haben ein neues Tool entwickelt, das mithilfe von sprachlichen Stilmustern die Autoren anonymer E-Mails identifizieren kann. Die Software soll eine Unterstützung für linguistische Forensiker sein und den Informatikern zufolge auch vor Gericht verwertbar.

„Die  Software hilft Sachverständigen, die Muster effizienter zu identifizieren“, erklärt Benjamin Fung, Professor für Information Systems Engineering an der Concordia University. Der Ansatz soll also helfen, „Cyber-Verbrecher“ schneller hinter Schloss und Riegel zu bringen.

In den letzten Jahren konnte ein alarmierenden Anstieg an Cyberverbrechen verzeichnet werden. Die anonymen E-Mails werden hierbei genutzt um Menschen zu bedrohen, zu betrügen oder um Kinderpornos zu verteilen. Oft dient dieses Kommunikationsmittel auch dem Virenversand oder einfach der kriminellen Kommunikation. Selbst, wenn die Behörden trotz Verschleierungsmaßnahmen wie gefälschten Headern den Ursprung einer E-Mail zurückverfolgen können, führt das oft zu einem großen Kreis an Verdächtigen. Gerade wenn ein Rechner in einem Internet-Caffee genutzt wurde, gilt es den tatsächlichen Verfasser zu ermitteln. Hierbei verspricht das neue Tool große Erleichterung.

Das Concordia-Team setzt auf Techniken aus den Bereichen Spracherkennung und Data Mining. Die Methode sucht in E-Mails nach auffallenden Mustern wie beispielsweise wiederkehrenden Rechtschreibfehlern oder einer durchgehenden Kleinschreibung. Muster, die in Vergleichsproben aller Verdächtigen vorkommen, werden verworfen. So ergibt sich ein „Schreib-Abdruck“, der ähnlich charakteristisch ist wie ein Fingerabdruck. Damit wird es möglich, den Verfasser zu bestimmen oder Ermittlern zumindest ein Täterprofil zu bieten.

Um die Software zu testen, haben die Forscher das „Enron E-Mail Dataset“ genutzt. Dieses umfasst über 200.000 echte E-Mails von 158 Autoren, die im Rahmen der Ermittlungen im Skandal um den Energiekonzern Enron gesammelt wurden. Je nach Feineinstellungen des Tools war es dabei möglich, anhand von je zehn Vergleichs-E-Mails von zehn möglichen Autoren den Verfasser einer Nachricht mit bis zu 90-prozentiger Sicherheit zu ermitteln.

Das Anwendungspotenzial des neuen Tools ist Lung zufolge groß, auch wenn die aktuelle Umsetzung nur auf Englisch funktioniert. Grundsätzlich ist die Methode aber auf alle Sprachen mit lateinischer Schrift anwendbar. Die genutzten Algorithmen sind theoretisch auch geeignet, um die Verfasser anderer Texte wie beispielsweise anonymer SMS zu ermitteln.

Matthias Walter, http://www.tec4net.com
EDV-Sachverständiger und Datenschutzauditor

————————————————————————————————————————-
Quelle:
http://www.schweizmagazin.ch