Semantic Web Grundlagen

Semantic Web Grundlagen Birte Glimm Institut fur Intelligenz | 17. Okt 2011 ¨ Kunstliche ¨ Einfuhrung und XML ¨ 2/47 Birte Glimm | Semantic Web G...
Author: Petra Seidel
5 downloads 0 Views 5MB Size
Semantic Web Grundlagen Birte Glimm Institut fur Intelligenz | 17. Okt 2011 ¨ Kunstliche ¨

Einfuhrung und XML ¨

2/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Agenda I

Vorstellung der Dozentin

I

Organisatorisches zur Vorlesung

I

Was ist das “Semantic Web”?

3/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Vorstellung der Dozentin Juniorprof. Dr. Birte Glimm Seit Jul 11 Juniorprofessorin am Institut fur ¨ Kunstliche ¨ ¨ Ulm Intelligenz, Universitat Aug 08 – Jun 11 Wissenschaftliche Mitarbeiterin Information Systems Group, Department of Computer Science, University of Oxford Apr 08 – Jul 08 Senior Software Engineer, sd&m AG, Hamburg ¨ 08 Wissenschaftliche Mitarbeiterin Information Okt 07 – Mar Systems Group, Department of Computer Science, University of Oxford Sep 04 – Sep 07 PhD Studentin, Information Management Group, School of Computer Science, University of Manchester

4/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Vorstellung der Dozentin Feb 2004 – Aug 2004 Austauschstudentin, Information Management Group, School of Computer Science, University of Manchester Sep 2001 – Sep 2004 BSc. Informatik, Hochschule fur ¨ angewandte Wissenschaften, Hamburg Jan 2000 – Aug 2001 Softwareentwicklung, Elephant Seven GmbH, Hamburg ¨ uhrende Apr 1998 – Dez 1999 Geschaftsf Gesellschafterin der ¨ JEN.net GmbH ¨ 1998 Berufsfachschule Hamburger Technische Apr 1995 – Mar Kunstschule, Kommunikationsdesign Stipendiatin der Stiftung der Deutschen Wirtschaft

5/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Vorstellung der Dozentin Wissenschaftliche Interessen I

Beschreibungslogiken

I I

Abfragesprachen (z.B. SPARQL) ¨ Komplexitatstheorie

I

Logik

I

Semantic Web

6/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Agenda I

Vorstellung der Dozentin

I

Organisatorisches zur Vorlesung

I

Was ist das “Semantic Web”?

7/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Organisatorisches: Zeit und Ort Vorlesung: Montag, 14:00 – 16:00 ¨ Ubung: Donnerstag, 14:00 – 16:00 ¨ Ort: Raum H21, Gebaude O28 Webseite: http://www.uni-ulm.de/in/ki/lehre/ winter-2011-2012/semweb11.html ILIAS: https: //elearning.uni-ulm.de/goto.php? target=crs_28608&client_id=Uni_Ulm

8/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Organisatorisches: Inhalt Einleitung und XML Einfuhrung in RDF ¨ RDF Schema ¨ aus fallt Logik – Grundlagen ¨ Ubung 1 Semantik von RDF(S) RDF(S) & Datalog Regeln OWL Syntax & Intuition ¨ Ubung 2 OWL & BLs OWL 2 Tableau ¨ Ubung 3 Blocking & Unravelling Hypertableau

17. Okt 20. Okt 24. Okt 27. Okt 31. Okt 3. Nov 7. Nov 10. Nov 14. Nov 17. Nov 21. Nov 24. Nov 28. Nov 1. Dez 5. Dez 8. Dez

SPARQL Syntax ¨ Ubung 4 SPARQL Semantik SPARQL 1.1 ¨ Ubung 5 SPARQL Entailment SPARQL Implemetierung Abfragen & RIF ¨ Ubung 6 Ontology Editing Ontology Engineering Linked Data ¨ Ubung 7 SemWeb Anwendungen Wiederholung ¨ Ubung 8

12. Dez 15. Dez 19. Dez 22. Dez 9. Jan 12. Jan 16. Jan 19. Jan 23. Jan 26. Jan 30. Jan 2. Feb 6. Feb 9. Feb 13. Feb 16. Feb

9/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Literatur

¨ Hitzler, Krotzsch, Rudolph, Sure “Sematic Web Grundlagen” Springer-Verlag

¨ Hitzler, Krotzsch, Rudolph, Sure “Foundations of Semantic Web Technologies” CRC Press

10/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Agenda I

Vorstellung der Dozentin

I

Organisatorisches zur Vorlesung

I

Was ist das “Semantic Web”?

11/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Das Web ¨ Das Web flankiert den Ubergang von der Industrie- zur Informationsgesellschaft und bietet die Infrastruktur fur ¨ eine ¨ neue Qualitat des Umgangs mit Information hinsichtlich Beschaffung wie auch Bereitstellung. I I I

hohe Verfugbarkeit ¨ ¨ hohe Aktualitat geringe Kosten

12/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Das Web ¨ Kommerzialisierung in allen Großenordnungen

13/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Das Web ¨ Kommerzialisierung in allen Großenordnungen

14/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Das Web Weitere Lebensbereiche werden “webisiert”: I Behorden, ¨ Verwaltung (eGovernment) I Ausbildung (eLearning, eEducation) I Sozialkontakte (Social-Networking-Plattformen, ¨ Partnerborsen) I Alltag?

15/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Warum Semantic Web? Exkurs: Syntax vs. Semantik Syntax (von grch. συντ αξις – Zusammenstellung, Satzbau) steht fur ¨ die (normative) Struktur von Daten, d.h. sie charakterisiert, was “wohlgeformte” Daten sind. ¨ Semantik (grch. σηµαυτ ικoς – zum Zeichen gehorend) steht fur ¨ die Bedeutung von Daten, d.h. sie charakterisiert beispielsweise, welche inhaltliche Schlussfolgerungen sich ziehen lassen. 4+) = ( syntaktisch falsch –

3 + 4 = 12 syntaktisch richtig semantisch falsch

3+4=7 syntaktisch richtig semantisch richtig

16/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Probleme des Web I I

Fulle ¨ an Informationen Ausgerichtet auf Menschen als Endnutzer

17/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Nur Computer-lesbare Layout Informationen

Ian Horrocks Professor Ian Horrocks FRS Professor of Computer Science Fellow, O [email protected] +44 1865 273939 +44 1865 273839 (fax) Wolfson Building, Parks Road, Oxford OX1 3QD

18/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Probleme des Web I I I

Lokalisierung von Information problematisch heutige Suchmaschinen gut, aber stichwortbasiert wunschenswert: inhaltliche, semantische Suche ¨

19/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Probleme des Web I

¨ der vorhandenen Information auf Heterogenitat verschiedensten Ebenen: I I I

Zeichenkodierung (z.B. ASCII vs. Unicode) verwendete naturliche Sprachen ¨ Anordnung von Information auf Webseiten

I

Informationsintegration aber stichwortbasiert

I

wunschenswert: inhaltliche, semantische Suc ¨

20/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Probleme des Web I

I I

implizites Wissen, d.h. Informationen, sind nicht explizit spezifiziert, folgen aber aus der Kombination gegebener Daten formallogische Methoden erforderlich automatisches Schlussfolgern

21/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Probleme des Web ¨ ¨ Losungsans atze: 1. Ad hoc: Verwendung von KI-Methoden zur Auswertung bestehender unstrukturierter Informationen im Web 2. A priori: Strukturierung der Web-Informationen zur Erleichterung der automatisierten Auswertung ⇒ Semantic Web

22/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Probleme des Web Zwei essentielle Voraussetzungen zur Realisierung: 1. offene Standards zur Beschreibung von Informationen I I I

klar definiert flexibel erweiterbar

2. Methoden zur Gewinnung von Informationen aus derlei Beschreibungen

23/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Semantic Web – Standards 1994 1998

2000

2002 2004 2008 2009 2010

First public presentation of the Semantic Web idea Start of standardization of data model (RDF) and a first ontology languages (RDFS) at W3C Start of large research projects about ontologies in the US and Europe (DAML & Ontoknowledge) Start of standardization of a new ontology language (OWL) based on research results Finalization of the standard for data (RDF) and ontology (OWL) Standardization of a query language (SPARQL) Extension of OWL to OWL 2.0 Standard Rule Interchange Format (RIF)

Birte Glimm |

24/47

Semantic Web Grundlagen |

17. Okt 2011

Einfuhrung in XML ¨ I

Einleitung und XML

I

Abfragesprache SPARQL

I

Einfuhrung in RDF ¨

I

SPARQL Semantik

I

RDF Schema

I

I

Logik – Grundlagen

SPARQL Entailment Regimes

I

Semantik von RDF(S)

I

Reasoning Verfahren 1

I

Regeln

I

Reasoning Verfahren 2

I

OWL – Syntax und Intuition 1

I

Reasoning Verfahren 3

I

Konj. Abfragen & Regeln

OWL – Syntax und Intuition 2

I

Linked Data

I

SemWeb Anwendungen

OWL Semantik

I

Wiederholung

I

I

25/47

Birte Glimm |

Semantic Web Grundlagen |

Agenda I

XML – Motivation/Idee

I

XML – Syntax

I

URIs

I

¨ Namensraume

17. Okt 2011

26/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Annotation mit Markup-Sprachen I

Grundidee des Markup: versehen von (unstrukturiertem) ¨ Text mit zusatzlicher Information (bzw. Struktur)

I

synonym: auszeichnen, auch: annotieren von Text Text Zusatzinformation

= Daten = Metadaten

27/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Annotation mit Markup-Sprachen I

¨ haufige Markup-Strategie: Einschließen des zu annotierenden Textes in sogenannte tags (engl.: Etikett, Schild):

. . .Text. . . ¨ offnendes Tag

I

schließendes Tag

Zusatzinformation wird von verarbeitenden Programmen gelesen und interpretiert

28/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Annotation mit Markup-Sprachen I

prominentestes Beispiel: HTML Tags kodieren Darstellungsinformationen: Dieses Buch hat den Titel Semantic Web Grundlagen.

I

Darstellung im Browser: Dieses Buch hat den Titel Semantic Web Grundlagen.

I

Strategie auch geeignet zur inhaltlichen Annotation, z.B.: Birte Glimm arbeitet in Ulm.

29/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Annotation mit Markup-Sprachen

I

Verschachtelung von Tags erlaubt

I

Doppelte Nutzung von Tags erlaubt

I

XML Tags bilden eine Baumstruktur

30/47

Birte Glimm |

Semantic Web Grundlagen |

Agenda I

XML – Motivation/Idee

I

XML – Syntax

I

URIs

I

¨ Namensraume

17. Okt 2011

31/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

XML I

eXtensible Markup Language

I

Ursprung: strukturierter Text (HTML4.0 ∈ XML ⊂ SGML) Web-Standard (W3C) zum Datenaustausch:

I

I

I

I

¨ Komplementarsprache zu HTML: I I

I

¨ Ein- und Ausgabedaten von Anwendungen konnen mittels XML beschrieben werden Industrie muss sich nur noch auf standardisierte Beschreibung (= Vokabular) einigen ¨ HTML beschreibt die Prasentation XML beschreibt den Inhalt

Datenbank-Sichtweise: XML als Datenmodell fur ¨ semistrukturierte Daten

32/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

¨ XML-Syntax – Praambel I I

XML-Dokument ist Textdokument Beginnt mit Deklaration I I

¨ Versionsnummer des verwendeten Standards Enthalt Optional: die Zeichenkodierung



33/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

XML-Syntax – XML-Element XML-Element (engl. element): I Beschreibung eines Objekts, die durch passende Markierungen (tags) geklammert ist I Inhalt eines Elements: Text und/oder weitere Elemente ¨ (beliebige Schachtelung moglich) I Leere Elemente: kurz: I “außerstes” ¨ Element heißt Wurzelelement (nur eines pro XML-Dokument)

34/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

XML-Syntax – XML-Attribute XML-Attribut (engl. attribute): I Name-Zeichenkettenwert-Paar in Start- oder selbstschließendem Tag I Assoziiert mit einem Element I Alternative Moglichkeit, ¨ Daten zu beschreiben

Weitere denkbare Beschreibung derselben Daten:

35/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

HTML vs. XML I I I

HTML: festes Vokabular (Menge von tags) und Semantik (die Darstellung von Text) XML: freie Bezeichner zur Beschreibung von anwendungsspezifischer Syntax und Semantik XML ⊂ SGML

36/47

Birte Glimm |

Semantic Web Grundlagen |

Agenda I

XML – Motivation/Idee

I

XML – Syntax

I

URIs

I

¨ Namensraume

17. Okt 2011

37/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

URIs – Idee I

URI = Uniform Resource Identifier

I

Dienen zur weltweit eindeutigen Bezeichnung von Ressourcen

I

Ressource kann jedes Objekt sein, was (im Kontext der ¨ besitzt (z.B. gegebenen Anwendung) eine klare Identitat Bucher, Orte, Menschen, Verlage, Beziehungen zwischen ¨ diesen Dingen, abstrakte Konzepte usw.) ¨ ¨ In bestimmten Domanen ahnliches bereits realisiert: ISBN fur ¨ Bucher ¨

I

38/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

URIs – Syntax I

Erweiterung des URL-Konzeptes; nicht jede URI bezeichnet aber ein Webdokument (umgekehrt wird als ¨ URI fur deren URL verwendet) ¨ Webdokumente haufig

I

Beginnt mit dem sogenannten URI-Schema, das durch einen Doppelpunkt (:) vom nachfolgenden Teil getrennt ist (z.B.: http, ftp, mailto) ¨ Haufig hierarchisch aufgebaut

I

39/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

URIs – Selbstdefinierte URIs I

¨ Notig, wenn fur ¨ eine Ressource (noch) keine URI existiert (bzw. bekannt ist)

I

Strategie zur Vermeidung von (ungewollten) ¨ Uberschneidungen: Nutzung von http-URIs einer eigenen Webseite ¨ Ermoglicht auch Ablegen einer Dokumentation zur URI an dieser Stelle

I

40/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Beschreibendes vs. Beschriebenes I

Trennung von URI fur ¨ Ressource und deren Dokumentation durch URI-Referenzen (durch “#” ¨ angehangte Fragmente) oder content negotiation

I

Z.B.: als URI fur ¨ Shakespeares “Othello” http://de.wikipedia.org/wiki/Othello nicht geeignet, besser http://de.wikipedia.org/wiki/Othello#URI

41/47

Birte Glimm |

Semantic Web Grundlagen |

Agenda I

XML – Motivation/Idee

I

XML – Syntax

I

URIs

I

¨ Namensraume

17. Okt 2011

42/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

¨ XML-Namensraume: Motivation I

XML-Dokumente besitzen Element- und Attributnamen (“Markup Vocabulary”) mit allgemeiner Gultigkeit ¨

I

Eine XML-Anwendung basiert auf allgemeiner Interpretation dieser Namen

I

Ein XML-Dokument soll Markup-Vokabular aus mehreren ¨ “Dictionaries” enthalten konnen. (Erinnerung: XML-Dokument muss keine DTD haben.)

I

Namespaces zur Vermeidung von Namenskonflikten

43/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

¨ XML-Namensraume I

¨ XML Namespaces sind ahnlich zu Modul-Konzepten in Programmiersprachen

I

Disambiguierung von Tag-Namen durch Verwendung unterschiedlicher “Prefixe”

I

Ein Prefix wird vom lokalen Namen separiert durch einen Doppelpunkt (:), so entstehen prefix:name Tags

I

Namespace-Bindungen werden von manchen Werkzeugen ignoriert, sog. “flache Namespaces”

44/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

Namensraum-Bindungen I

Prefixe werden belegt mit Namespace URIs, indem ein Attribut xmlns:prefix bei dem relevanten Element oder ¨ einem seiner Vorgangerelemente eingefugt ¨ wird: prefix:name1 , . . ., prefix:namen

I

Der Wert des xmlns:prefix-Attributes ist eine URI, welche (fur ¨ XML Schemata) auf eine Beschreibung der Namespace Syntax verweisen kann aber nicht muss

I

Ein Element kann Bindings nutzen fur ¨ mehrere (unterschiedliche) Namespaces durch Verwendung separater Attribute xmlns:prefix1 , . . ., xmlns:prefixm

45/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

¨ Beispiel: Ohne Namensraume

46/47

Birte Glimm |

Semantic Web Grundlagen |

17. Okt 2011

¨ Zwei verschiedene Namensraume

Titel wurde disambiguiert durch Verwendung der Prefixe lv und person

47/47

Birte Glimm |

Semantic Web Grundlagen |

Agenda I

XML – Motivation/Idee

I

XML – Syntax

I

URIs

I

¨ Namensraume

17. Okt 2011