Semantische
Technologien gewinnen sowohl im geschäftlichen wie auch im privaten Umfeld eine
immer größere Bedeutung. Basierte die Volltextsuche von Suchmaschinen und
Applikationen zu Beginn auf Stichworten, sind es heute zunehmend Kontext und Semantik,
die berücksichtigt werden müssen um noch genauere und passende Ergebnisse zu
liefern. Ist es möglich aus einer Anzahl von Dokumenten semantische Informationen
zu extrahieren, entstünde ein Mehrwert für den Nutzer, der in Suchmaschinen wie
auch in Personal Information Management Lösungen wie K-IMM Anwendung finden könnte.
Ein großes Problem, dem sich die Forschung in diesem
Zusammenhang stellen muss, ist die Qualität von extrahierten semantischen Informationen.
Projekte wie TerMine, OntoLearn und TermExtractor sowie Methoden zur
Taxonomiegenerierung von Hearst, Caraballo und Snow et al. haben gezeigt, dass bei einer ausreichend hohen Anzahl
von Texten die Qualität und Korrektheit sichergestellt werden kann. Doch gerade
im Umgang mit wenigen kurzen Texten, die dazu noch sehr unterschiedliche semantische
Informationen enthalten, versagen diese Methoden. Im Rahmen dieser Arbeit soll
der Stand der Forschung und Technik im Bereich der Informationsextraktion
untersucht werden. Basierend auf den gewonnen Kenntnissen soll im Anschluss ein
Konzept entwickelt werden, das es erlaubt, aus kleinen Textmengen automatisch soweit
möglich korrekte semantische Informationen zu extrahieren und in geeigneter
Form zu speichern. Anschließend soll das Konzept in Form eines Prototyps
umgesetzt werden, der es erlaubt, Texte in die Anwendung zu importieren und
Suchanfragen auf den dadurch gesammelten semantischen Informationen
durchzuführen. Im Detail sollen folgende Teilaufgaben gelöst werden.
Autor(en): |
Hendrik Freund |
---|---|
Laufzeit: | 15.04.2011 - 14.10.2011 |
Verantwortlicher HSL: | Prof. Dr.-Ing. Klaus Meißner |
Betreuer: |
Dipl.-Medieninf. Sandro Schmidt
|
Institut, Lehrstuhl: | SMT, Multimediatechnik |
Zugehörige Projekte: | Sonstiges
|
Zugehörige Partner: |
T-Systems Multimedia Solutions GmbH |