«Ich werde dich niederstrecken»
In der Verbrechensprävention und -bekämpfung müssen heutzutage grosse Mengen an textuellen Daten analysiert werden. Stefan Lütolf hat im Rahmen seiner Masterarbeit «Automatische Erkennung von Drohungen in Texten» im Masterstudiengang in Engineering (MSE) einen spezifischen Teil der Analysetätigkeiten, die Erkennung von strafrechtlich relevanten Drohungen in Texten, bearbeitet. Auftraggeber der Arbeit war die Kriminalpolizei Zürich.
Text: Prof. Martin Studer / Bild: Muriel Grau & Larissa Langone / Film: Mona Bärtschiger & Manuel Wenk
Im Rahmen der Prävention und Verfolgung von Straftaten müssen heutzutage grosse Mengen an – häufig unstrukturierten und durchmischten – textuellen Daten analysiert werden. Diese Daten stammen beispielsweise aus öffentlich zugänglichen Foren und sozialen Medien (Prävention von Straftaten) oder aus beschlagnahmten Laptops sowie mobilen Geräten (Verfolgung von Straftaten). Die Kriminalpolizei steht also vor der Aufgabe, beispielsweise den kompletten Mail- oder SMS-Verkehr einer Person zu analysieren. Diese Aufgabe wurde bisher manuell durchgeführt.
Text Mining Tools, die die grundlegenden Verfahren der Computerlinguistik beherrschen und Text nach einfachen Kriterien durchsuchen können, beispielsweise nach Mailadressen, Telefonnummern, Personennamen oder Ortschaften, sind am Markt erhältlich. Viele strafrechtliche relevante Aspekte lassen sich aber nicht durch einfache Verfahren herausschälen. Ein Beispiel dafür ist die Erkennung von Drohungen.
Was ist eine Drohung?
Eine einheitliche Definition einer Drohung existiert nicht. Das Schweizerische Strafgesetz erwähnt in Artikel 180, dass sich strafbar macht, wer «jemanden durch schwere Drohung in Schrecken oder Angst versetzt». Hinzu kommt, dass Drohungen sehr unterschiedlich formuliert werden können, beispielsweise direkt («Wenn ich dich mit einem anderen sehe, erschiess ich ihn») oder indirekt («Ich komme nicht zur Ruhe, bis du im Friedhof liegst»). Die Drohungen selber können wiederum in verschiedene Typen unterteilt werden, beispielsweise in die Androhung von Aggression oder Körperverletzungen sowie einer Vermögensschädigung, die Androhung des Einsatzes einer Waffe oder eines Gegenstands bis zu Tötungsdrohungen.
Erkennung von Sprachebenen
Ziel der Masterarbeit war es, die Ansätze zur Erkennung von Drohungen zu recherchieren und mit dem Text Mining Tool IBM Content Analytics umzusetzen. Der theoretische Hintergrund für den gewählten regelbasierten Ansatz bildet die Sprechakttheorie. Die Sprechakttheorie geht davon aus, dass Aussagen in Dialogen auf verschiedenen Ebenen wirken: Neben der reinen Wissensvermittlung (lokutiver Akt) enthält jeder Sprechakt einen illokutiven Akt, also eine Bitte, eine Warnung oder eben eine Drohung. Dass sprachliche Äusserungen nicht nur Sachverhalte schildern, sondern beim Gegenüber Handlungen auslösen, kennt jeder selbst: Die Aussage «Die Wohnung ist staubig» von Ehefrau zu Ehemann enthält neben der sachlichen Komponente, dass die Wohnung dreckig ist, den Wunsch (also die handlungsorientierte Komponente), der Ehemann solle doch bitte die Wohnung staubsaugen.
Auf der Schliche mit Regeln
Basierend auf dieser Theorie wurden nun Regeln für die Erkennung von Drohungen implementiert. Exemplarisch hier die Vorgehensweise für die Erkennung von Tötungsdrohungen, beispielsweise «Ich werde dich niederstrecken» oder «Ich werde dich töten» Performative Verben wie «töten» oder «niederstrecken» gelten als Indikator für eine Handlung. Entsprechend überprüft die erste Regel, ob der Satz ein performatives Verb enthält. Im zweiten wird untersucht, ob ein Satz in der ersten Person Einzahl formuliert ist, denn Drohungen enthalten oft das Wort «ich». Diese einfachen Indikatoren lassen sich mittels Regeln im Text Mining Tool IBM Content Analytics umsetzen. Leider konnte im Rahmen der Masterarbeit keine Evaluation des Ansatzes durchgeführt werden, da die realen Daten der Kantonspolizei nicht zugänglich waren.
Beitrag von
Leiter Institut für Informations- und Kommunikationstechnologien (IKT)