MMT-Logo
Sitemap | English

Diplomarbeit

Intelligente Verwaltung natürlichsprachiger Textdokumente

Aufgabenstellung

Digitale Endgeräte und Medien gewinnen im privaten Umfeld zunehmend an Bedeutung. Die mitunter großen Mengen erzeugter Daten und Medienobjekte stellen jedoch den normalen Nutzer meist vor erhebliche technische wie auch organisatorische Probleme. Besonders im Bereich natürlichsprachiger Dokumente stellt die inhaltliche Struktur und Semantik ein wesentliches beschreibendes Merkmal dar, um diese zu annotieren und wieder zu finden. Techniken auf dem Gebiet der Verarbeitung "Natürlicher Sprache" (Natural Language Processing - NLP) liefern die geeigneten Grundlagen, um sich dieser Problematik anzunähern. Ziel dieser Arbeit ist es, den aktuellen Entwicklungsstand auf dem Gebiet der Verarbeitung und Verwaltung natürlichsprachiger Textdokumente sowie den zugrunde liegenden Techniken (NLP) darzustellen und bzgl. der Anforderungen aus dem Anwendungsbereich (Medienverwaltung) zu analysieren. Im Zuge dessen sollen existierende Projekte und Produkte (vorwiegend aus dem Bereich Open Source) untersucht und getestet werden. Davon ausgehend ist ein Konzept für ein geeignetes Werkzeug zu entwickeln. Aus dem Angebot existierender, frei verfügbarer Implementierungen sind geeignete Komponenten auszuwählen und in die Konzeption zu integrieren. Der daraus entstehende Prototyp soll soweit möglich in der Lage sein, eine Vielzahl Textformate zu unterstützen, entsprechende Dokumente, die Text enthalten, strukturell zum Zwecke der Kategorisierung und zum Teil syntaktisch und lexikalisch zu analysieren und ein effizientes Wiederfinden von Daten zu gewährleisten. Im Einzelnen sollen folgende Aufgaben bearbeitet werden:

Weitere Informationen

Autor(en): PersonThomas Renger
Laufzeit: 01.08.2005 - 31.01.2006
Verantwortlicher HSL: PersonProf. Dr.-Ing. Klaus Meißner
Betreuer: PersonDr.-Ing. Annett Mitschick
Institut, Lehrstuhl: SMT, Multimediatechnik
Zugehörige Projekte: K-IMM