Protégé und andere Ontology Development Tools

24.1.2007 Joscha Krutzki Vorlesung Netzbasierte Informations System Fu-Berlin

Was ist Protégé?

Die Wurzeln des Projekts Protégé reichen bis 1987 zurück. Die ursprüngliche Idee war ein Framework zur Entwicklung von Programmen zur Bearbeitung von Ontologien, programmiert mit Opal. Mittlerweile ist es das zentrale opensource Ontology Development Tool mit Dutzenden Plugins. Der Standard-Funktionsumfang reicht von der Codengenerierung für Java über das gemeinsamen Erstellen großer Ontologien bis hin zur Verarbeitung von instance data. Die Entwicklung wird aus einem akademischen Background heraus vorangetrieben, gefördert vor allem von Institutionen aus dem Bereich Medizin.

Aufbau Protégé

Protégé ist als Framework aufgebaut. Intern werden die Daten mit OKBC (seit 1998 nicht mehr weiterentwickelt) gespeichert. Für das GUI und diverse Import/Exports gibt es Plugins. Das OWL-Plugin hat ein eigenes GUI und eine eigene Plugin Schnittstelle. Im Zusammenspiel mit dem Java Jena Framework erlaubt es die spezielle Verarbeitung von OWL und RDFS Dateien.

Aufbau Protege - Architektur

Demonstration Protégé

Die Ontologie wird über verschieden Views bearbeitet. Der OWL-Code wird dabei automatisch generiert. Eine direkte Bearbeitung des OWL-Codes ist nicht möglich.

Standard Views für OWL

Metadata - Ontologien registrieren

Class

View zur Erstellung von Klassen und deren Spezifikation durch restrictions. Die Bearbeitung ist stark abstrahiert vom OWL/RDFS Code. Dabei wird eine Vielzahl von eigenen Begriffen benutzt.

Logic View

"Logic" View für Klassen, etwas näher am OWL Code, gut zur Bearbeitung von restrictions.

Properties View

View für Klassen mit spezieller Anzeige der relevanten Properties

Properties

View zur Erstellung von Properties

Individuals

View zur Erstellung von Individuals (instance data).

Forms

Formeditor zur Erstellung eine individuellen graphischen Oberfläche zur Eingabe von Individuals

Reasoner

Ein Reasoner überprüft die Konsistenz der Ontologie und wertet Ableitungsregeln aus. Dadurch werden Informationen erzeugt, die nicht direkt in die Ontologie geschrieben wurden.

Superklassen Ableiten (taxonomy)

Konsistenz überprüfen

SPARQL Abfragen

Plugins

Die wichtigsten Plugins sind enthalten. Hier noch ein paar interessante. Mehr gibt es im Protégé Wiki.

Features Protégé

* Graphischer Editor OWL/RDFS/RDF Dateien  

* Modellieren von Ontologien 

* Bearbeiten großer Datenmengen, ein Testlauf mit 10 MB Daten ohne Datenbank lief bei genügend Speicher problemlos, RDF Stores oder Relationale Datenbanken werden unterstützt.

* Bearbeiten und Abfragen von instance data (Objekten)

* Framework für Applikationen die Ontologien nutzen

* Codegenerator für Java

Vorteile/Nachteile (getestet Protégé 3.2.1)

* Vorteile:

    * Bearbeitung großer Datenmengen

    * sehr viele Plugins

    * große user community und gute Tutorials

    * opensource

* Nachteile:

    * import OWL-Ontologien scheitert manchmal

    * öffnen rdfs Datei, im Auswahlmenü nur owl Dateien

    * eigenes Vokabular für OWL, anders als beim W3C

    * komplexe Software die viel Speicher braucht, bei mir traten  manchmal Fehler oder  Abstürze bei langen Sessions auf.

Altova SemanticWorks

Was ist SemanticWorks?

SemanticWorks ist ein der OWL/RDFS/RDF Editor der Firma Atova, seit 2006 erhältlich. Altova ist markführer für XML tools wie XML Spy. Entsprechend sind auch die features von SemanticWorks

Features

Vorteile/Nachteile (getestet SemanticWorks 2006)

Vorteile:

Nachteile:

Andere OWL Editoren

Links

OWL und Ontologien

Protégé