Rostocker Mathematiker entschlüsseln Text-Archive

Tobias Grüning, Gundram Leifert und Tobias Strauß (v.l.) wollen Schrifterkennung historischer Dokumente optimieren.
Professor Roger Labahn stellt gezielt und erfolgreich Weichen für internationale Forschungsprojekte. (Fotos: Universität Rostock/Julia Tetzke)

„Wir wollen erreichen, dass der Computer zunächst die Schrift liest und dann zusammenfasst, worum es im Text geht“, sagt Professor Roger Labahn. Am Ende soll mit den Dokumenten effizient und bequem gearbeitet werden können. Partner für diese spannende Aufgabe haben die Wissenschaftler in Österreich, Finnland und Frankreich.

Die Rostocker Mathematiker haben sich bei Wettbewerben zur Bild- und Schrifterkennung bereits weltweit einen Namen gemacht. Sie entwickelten die besten Softwaresysteme für Schrift- und Handschriftlesung und brachten mehrfach internationale Preise nach Hause. Ihr Erfolgsrezept sei eine besonders gut funktionierende schöpferische Atmosphäre, in der Kreativität bestens gedeihe, sagt Professor Labahn. Doch die neue Aufgabe habe es noch einmal so richtig in sich.

Und genau das ist es, was die Rostocker Forscher so sehr reizt: Mathematiker Tobias Grüning verweist auf Wettbewerbe, die online gestellt werden und bei denen sich Forscher gegenseitig messen. „Unsere Forschung lebt mitunter von Wetten im Team“, sagt Tobias Grüning. „Dabei geht es manchmal auch um eine gute Flasche Wein“, zwinkert der junge Forscher.

Die hohe Kunst der Schrifterkennungsprogramme bleibt die Entzifferung gebundener Schrift. Das Erfolgsrezept der Rostocker Mathematiker: Sie arbeiten mit so genannten hierarchischen und rekurrenten künstlichen neuronalen Netzen. „Das sind mathematische Strukturen, die dem menschlichen Hirn nachempfunden sind und es vermögen, aus großen Datenmengen zu lernen, neue Bilder zu lesen“, erklärt Tobias Strauß. Das Problem besteht darin, aus einem Bild mit Handschrift die Bedeutung zu rekonstruieren. Es gibt zu viele mögliche Antworten auf die Frage, wo ein Buchstabe aufhört und der andere anfängt. Die Zahl der Kombinationsmöglichkeiten ist groß, auch wenn man nur sinnvolle Wörter als Lösung zulässt. Deshalb werden an der Universität Rostock Algorithmen entwickelt, die in akademischen Testszenarien implementiert und erprobt werden. Das Team hat inzwischen Kernalgorithmen zum Erkennen von handgeschriebenen Wörtern entwickelt. „Wir haben nichts von Grund auf Neues erfunden“, gibt sich Professor Labahn bescheiden. Doch seiner jungen Mannschaft gelang es inzwischen, bisher instabilen Algorithmen Zuverlässigkeit einzuhauchen.

Bei der Schriftanalyse gehen moderne Zeichenerkennungsprogramme nicht von einer Idealform der Buchstaben aus. Vielmehr besteht ein Ansatz in der Verwendung von neuronalen Netzen, die im Laufe der Zeit lernen, wie das ihnen vorgelegte Material richtig zu entziffern ist.

Für die Schrifterkennung historischer Dokumente gibt es einen stetig wachsenden Markt. Neben Mathematikern zeigen auch Historiker und Ahnenforscher ein großes Interesse. „Wir haben unter anderem Heiratsunterlagen von 1750 bearbeitet. Es ging darum herauszufinden, wer der Ehemann ist und welchen Stand er hatte“, nennt Strauß ein Beispiel. „Solche Aufgaben bedeuten gegenwärtig noch einen großen Anpassungsaufwand für das Programm“, bemerkt Tobias Grüning. Die ausgetüftelte Software, die am Institut für Mathematik ständig optimiert wird, hilft hier zukünftig weiter, um die Anpassung automatisiert vornehmen zu können.

Eine Schlüsselrolle kommt Gundram Leifert zu, der die Technologie den Historikern so gut aufbereitet zur Verfügung stellt, dass sie damit problemlos arbeiten können. Alles in allem also: Beste Voraussetzungen für das Erschließen historischer Archive.

Text: Wolfgang Thiel

 

Kontakt:
Tobias Strauß
Universität Rostock
Institut für Mathematik
Tel.: +49 381 498-6633
tobias.strauß@uni-rostock.de


Zurück zu allen Meldungen