Verbesserung der automatischen Lokalisierung von Artikeln

Im Rahmen einer Diplomarbeit von Henning Rauch (TU Ilmenau) soll die automatische Zuordnung eines Artikels zu einem geografischen Punkt verbessert werden. Dafür wird ein sogenanntes „Geographic Information Retrieval System“ (GIR) zur Kategorisierung von redaktionellen Texten entwickelt. GIR verknüpft klassisches Information Retrieval mit geographischen Metadaten.

Ziel dieses Projektes ist es, die bisher Trefferquote der automatischen Zuordnung von Artikel - Stadt weiter zu verbessern. Um dies zu erreichen, wird eine neue Suchmaschine zur fokussierten Suche konzipiert und implementiert. Dabei werden ausgefeilte Techniken aus den Bereichen Computerlinguistik und Text Engineering eingesetzt.

Probleme, wie die Ambiguität (Doppeldeutigkeit) bei bestimmten Städten - es gibt viele Frankfurts - oder bislang falsch erkannte nicht geographische Relevanzen eines Textes (Essen – Stadt und Essen – Mahlzeit), werden durch umfangreiche Metadaten- und Grammatik-Analyse der jeweiligen Artikel deutlich rückläufig sein. Die Diplomarbeit orientiert sich dabei an den aktuellen wissenschaftlichen Erkenntnissen zu diesem Thema und wird die bisher entwickelten Techniken zum GIR innovativ miteinander verknüpfen und weiterführen.

Wir werden an dieser Stelle weiter über dieses spannende Projekt berichten.

Einen Kommentar schreiben