MMT-Logo
Sitemap | English

Diplomarbeit

Informationsgewinnung aus kurzen Texten

Aufgabenstellung

Semantische Technologien gewinnen sowohl im geschäftlichen wie auch im privaten Umfeld eine immer größere Bedeutung. Basierte die Volltextsuche von Suchmaschinen und Applikationen zu Beginn auf Stichworten, sind es heute zunehmend Kontext und Semantik, die berücksichtigt werden müssen um noch genauere und passende Ergebnisse zu liefern. Ist es möglich aus einer Anzahl von Dokumenten semantische Informationen zu extrahieren, entstünde ein Mehrwert für den Nutzer, der in Suchmaschinen wie auch in Personal Information Management Lösungen wie K-IMM Anwendung finden könnte.
Ein großes Problem, dem sich die Forschung in diesem Zusammenhang stellen muss, ist die Qualität von extrahierten semantischen Informationen. Projekte wie TerMine, OntoLearn und TermExtractor sowie Methoden zur Taxonomiegenerierung von Hearst, Caraballo und Snow et al. haben gezeigt, dass bei einer ausreichend hohen Anzahl von Texten die Qualität und Korrektheit sichergestellt werden kann. Doch gerade im Umgang mit wenigen kurzen Texten, die dazu noch sehr unterschiedliche semantische Informationen enthalten, versagen diese Methoden. Im Rahmen dieser Arbeit soll der Stand der Forschung und Technik im Bereich der Informationsextraktion untersucht werden. Basierend auf den gewonnen Kenntnissen soll im Anschluss ein Konzept entwickelt werden, das es erlaubt, aus kleinen Textmengen automatisch soweit möglich korrekte semantische Informationen zu extrahieren und in geeigneter Form zu speichern. Anschließend soll das Konzept in Form eines Prototyps umgesetzt werden, der es erlaubt, Texte in die Anwendung zu importieren und Suchanfragen auf den dadurch gesammelten semantischen Informationen durchzuführen. Im Detail sollen folgende Teilaufgaben gelöst werden.

Weitere Informationen

Autor(en): PersonHendrik Freund
Laufzeit: 15.04.2011 - 14.10.2011
Verantwortlicher HSL: PersonProf. Dr.-Ing. Klaus Meißner
Betreuer: PersonDipl.-Medieninf. Sandro Schmidt
Institut, Lehrstuhl: SMT, Multimediatechnik
Zugehörige Projekte: Sonstiges
Zugehörige Partner: T-Systems Multimedia Solutions GmbH