Datamodel¶

Vorbemerkungen¶

Ein Großteil unserem menschlichen Daseins und Wirken definiert sich über Beziehungen zu anderen “Dingen” (hier im weitest möglichen Sinne zu verstehen). Möchte man diese Gegenstandsbereiche in technischen Systemen möglichst präzise und “naturgetreu” abbilden, so braucht es ausdrucksmächtige Beschreibungsformate und Datenstrukturmodelle. Viele bekannte Datenstrukturmodelle und Formate sind zwar sehr effizient in ihrer maschinellen Verarbeitung, ihnen fehlt es aber an der notwendigen Ausdrucksmächtigkeit, d.h., diese sind nicht in der Lage, die komplexen Beziehungen zwischen Dingen präzise und widerspruchsfrei (=unambiguitiv¹) abzubilden.

Example

Beispiel
Versuchen Sie nachfolgend beschriebenen Sachverhalt in einem Datenmodell ihrer Wahl möglichst widerspruchsfrei und eindeutig abzubilden.

“In seiner konstituierenden Sitzung vom 25.06.2019 beschloss der Fachbereichsrat in Bezug auf Berichtspunkt Nr. 5 des Protokolls vom 17.05.2019 mit 10 ‘Ja’-Stimmen, 0 Enthaltungen und keinen Gegenstimmen:
Prof. Dr. Kai Renz wird zum kommenden Sommersemester neues Mitglied des Stundenplanerteams.“

Bei der Durchführung des obigen Beispiels werden Sie sehr schnell feststellen, dass die Repräsentation in Form eines konzeptuellen Graphen mit Knoten und Kanten die Beziehungen zwischen den “Dingen” in einer natürlichen Darstellung am nächsten kommt².

Was wissen wir bisher aus Kapitel 2: Technologische Grundlagen

Ausschnitte aus Gegenstandsbereichen lassen sich am besten unter Reduzierung struktureller Heterogenität als konzeptueller Graph darstellen
Beziehungen sollten als First-Class Elemente behandelt werden
URIs/IRIs ermöglichen die eindeutige Identifizierung von “Dingen”
Zusammen mit dem Konzept der Content Negotiation ermöglichen sie eine Unterscheidung zwischen technischen- und realweltlichen Repräsentationen
Maschinen-verarbeitbare Semantik bedeutet: Definitions have Consequences – d.h., die Semantik eines Elements ist definiert durch die sich aus der Anwendung des mit dem Element assozierten Regelsatzes ergebenden Konsequenzen.

Wie werden Informationen in Semantic MediaWiki kodiert ?¶

Semantic MediaWiki allows to encode information in the form of facts: ~> “Berlin has a population of 3,520,031 people”
A fact consists of of three parts:: 1) Wikipage (subject), e.g. “Berlin”; 2) Property (predicate), e.g. “Has population”; 3) Value (object or literal), e.g. “3,520,031”
These three parts can be split into a relation and a statement:: Relation ~> Berlin has a population.; Statement ~> The population is “3,520,031”.
A statement consists of a property and its value:: Property (ie. predicate), e.g. “Has population”; Value (ie. object or literal), e.g. “3,520,031”

As a consequence, facts are encoded as property-value pairs on wiki pages.

Example

Example
(page – property – value):

1
2
3

Cologne   has population   1.017.155
Germany   has capital      Berlin
Spinoza   born on          24 Nov 1632

Adding a statement (property-value pair) to a page (the subject) is called annotation.

Knowledge Representation Model¶

From the previous section, we saw that SMW employs a triple-based data model similar to RDF, consisting of …: subject — the “thing” an assertion is about; predicate — the property or relation between a subject and object; object — the “value” in the statement, which could be another page or a literal value
In SMW terms, …: …the subject is always a page or an subobject (being a blank node in RDF terms); …the predicate always resembles a page in the property namespace; …the object can either be a page or a data type (string/number/telephone/etc.)
SMW encodes terminological knowledge (TBox) in form of …: …categories serve as classes; …concepts serve as role inclusion axioms; …special properties allow to represent terminological relationships between categories and property pages

The triple-based model employed by Semantic MediaWiki is inherited from W3Cs Resource Description Framework (RDF) specification.

A page-property-value triple resembles the subject-predicate-object triple pattern of RDF³

Pages can be related to pages via properties. That way, the object in the first statement becomes the subject of the second statement (in RDF-terms) (→ see has capital).

Frei von Mehrdeutigkeiten; Dinge mit singulärem Verständnis ↩
Selbstverständlich könnte man die Beziehungen auch als Assoziationen in einem UML Klassendiagramm abbilden; hierbei verliert man allerdings die Möglichkeit, die Beziehungen näher zu spezifizieren (bspw. Typ einer Beziehung, Beziehungen zwischen Beziehungstypen, and die Beziehung geknüpfte logische Bedingungen, etc). ↩
In RDF, a triple is also called a statement or assertion. ↩

Letztes Update: 18. September 2024