Texte enthalten Buchstaben, Interpunktionszeichen, Wörter, Sätze, Abschnitte, usw. Die Möglichkeiten zur Kombination von Buchstaben, Zeichen, Wörtern, Sätzen sind unermesslich. Deshalb ist die Analyse von Texten ein spannendes Forschungsfeld. Beispielweise hat die Analyse von Texten gezeigt, mit welcher Wahrscheinlichkeit die einzelnen Buchstaben des Alphabets im Durchschnitt auftreten. Diese Erkenntnisse haben es früher erlaubt, verschlüsselte Texte ohne Kenntnis des Schlüssels zu dechiffrieren. Heute sind auf allen Mail-Servern Anti-Spam-Programme im Einsatz, welche die ausgetauschten Mitteilungstexte analysieren, um unerwünschte Nachrichten (Spam) von den korrekten Mails unterscheiden zu können. Ein anderer Bereich der Textanalyse befasst sich mit dem Erkennen von Plagiaten, d.h. mit dem Erkennen von Texten (beispielweise von Studierenden), die aus irgendwelchen Quellen (z.B. im Web) kopiert wurden.
Das Gebiet der Textanalyse ist riesig. Jeder Teil dieses Gebiets ist interessant und bietet eine Vielzahl von Vertiefungsmöglichkeiten. Das Thema, welches uns am meisten interessiert hat, ist das Erkennen von Plagiaten. Wir finden diese sei ein sehr aktuelles und komplexes Thema.

Weiterlesen{lang: ‘de’}