Ein Ziel des Topic/S-Projekts ist die semantische
Modellierung von (Nachrichten-)Themen, die aus verschiedensten
Nachrichtenkanälen im Newsroom einer Redaktion eintreffen. Dabei werden die
Informationen aus verschiedenen Kanälen
automatisch gesammelt, bereinigt, annotiert und in eine gemeinsame Datenbasis
eingepflegt. Hierzu werden semantische Technologien wie RDFS zur Modellierung
und SPARQL zur Abfrage der semantischen Daten eingesetzt. Diese W3C-Standards
beruhen auf dem Paradigma, das binäre „100%-Relationen" zwischen Ressourcen
etabliert werden. Problematisch ist dies jedoch, wenn manche Relationen nicht
mit hundertprozentiger Sicherheit definiert werden können. Ein Beispiel ist u. a.
die in einem Text erkannte Entität „Jaguar", die mit gewisser Wahrscheinlichkeit
dem Konzept „Automobilmarke", „Großkatze" oder „Betriebssystem" zugeordnet werden
kann. Ein ähnliches Problem existiert bei der Modellierung der Glaubwürdigkeit
von Informationen, die man zumeist nur unscharf spezifizieren kann.
Ziel dieser Arbeit ist, ein Konzept zur Verwendung von
Unschärfe in einem semantischen Modell für Informationen, die in Redaktionen
verarbeitet werden, aufzustellen. Hierbei ist zunächst ein Beispielszenario zu
entwickeln, das die Probleme und Ziele bei der Modellierung semantischer Medieninformationen
im Detail aufzeigt. Auf dessen Basis ist der aktuellen Stand der Forschung und
Technik zu untersuchen. Fragestellungen sind hier u.a.: Modelliert man
Unschärfe qualitative oder quantitativ? Welche Möglichkeiten bieten existierende
Sprachmittel, z. B. die Definition von n-ary Relations? Welche Quasi-Standards,
z. B. Fuzzy OWL oder N-Quads, kann man nutzen und werden diese von aktuellen
Frameworks unterstützt? Anschließend ist auf Basis aller Vorbetrachtungen ein
Anforderungskatalog für das Konzept zu definieren. Letzteres muss ermöglichen,
Informationen unscharf zu modellieren und diese aber auch abzufragen. Weiterhin
ist auf die technische Umsetzbarkeit zu achten. Diese soll durch eine
prototypische Implementierung auf Basis des einführenden Szenarios gezeigt
werden.
Im Einzelnen im theoretischen Teil (Vertiefung zur
Bachelorarbeit) folgende Teilziele zu erreichen:
In der eigentlichen Bachelorarbeit sind folgende Teilziele zur erreichen:
Autor(en): |
Jonas Schulz |
---|---|
Laufzeit: | 01.06.2012 - 27.08.2012 |
Verantwortlicher HSL: | Prof. Dr.-Ing. Klaus Meißner |
Betreuer: |
Dipl.-Medieninf. Martin Voigt
Dipl.-Medieninf. Sandro Schmidt |
Institut, Lehrstuhl: | SMT, Multimediatechnik |
Zugehörige Projekte: |
Topic/S
|
Zugehörige Partner: |
Fink & Partner Media Services GmbH |