Semantic Web Grundlagen

Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz | 02. Feb 2012 Linked Data 2/42 Birte Glimm | Semantic Web Grundlagen | ...
Author: Elvira Lang
3 downloads 2 Views 5MB Size
Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz | 02. Feb 2012

Linked Data

2/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Organisatorisches: Inhalt Einleitung und XML Einführung in RDF RDF Schema fällt aus Logik – Grundlagen Übung 1 Semantik von RDF(S) RDF(S) & Datalog Regeln OWL Syntax & Intuition Übung 2 OWL & BLs OWL 2 Tableau Übung 3 Blocking & Unravelling Hypertableau

17. Okt 20. Okt 24. Okt 27. Okt 31. Okt 3. Nov 7. Nov 10. Nov 14. Nov 17. Nov 21. Nov 24. Nov 28. Nov 1. Dez 5. Dez 8. Dez

Hypertableau II Übung 4 SPARQL Syntax & Intuition SPARQL Semantik SPARQL 1.1 Übung 5 SPARQL Entailment SPARQL Implemetierung Ontology Editing Übung 6 Ontology Engineering Linked Data SemWeb Anwendungen Übung 7 Wiederholung Übung 8

Abfragen und RIF wurde gestrichen

12. Dez 15. Dez 19. Dez 22. Dez 9. Jan 12. Jan 16. Jan 19. Jan 23. Jan 26. Jan 30. Jan 2. Feb 6. Feb 9. Feb 13. Feb 16. Feb

3/42

Birte Glimm |

Semantic Web Grundlagen |

Linked Data

02. Feb 2012

3/42

Birte Glimm |

Semantic Web Grundlagen |

Linked Data

02. Feb 2012

4/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Daten im Web I

Immer mehr Websites stellen einen programmatischen Zugriff auf ihre Daten zur Verfügung

I

Dabei werden Semantic Web Standards verwendet, z.B. die Linking Open Data (LOD) Initiative http://www.w3.org/wiki/SweoIG/TaskForces/ CommunityProjects/LinkingOpenData

I

Verwendet werden APIs, z.B. via JSON/REST

I

Semantic Web Technologien vereinfachen die Integration von Daten aus verschiedenen Quellen

I

Die Kombination von Daten erlaubt auf tiefere Einblicke

5/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Linked Data im Web 01.05.2007

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

6/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Linked Data im Web 31.03.2008 ECS Southampton

Musicbrainz

Jamendo

BBC Later + TOTP

Doapspace

AudioScrobbler

QDOS

Magnatune

BBC John Peel

updated

FOAF profiles

Geonames US Census Data

SemWebCentral

Flickr exporter

Ontoworld

riese

GovTrack

SW Conference Corpus OpenGuides

Revyu DBpedia

NEW!

SIOC profiles

World Factbook

Wikicompany

RDF Book Mashup lingvoj

DBLP Berlin NEW!

Eurostat

W3C WordNet

Open Cyc

RKB Explorer

flickr wrappr

Project Gutenberg

DBLP Hannover

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

7/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Linked Data im Web 14.07.2009 Surge Radio

BBC Playcount Data

Musicbrainz

MySpace Wrapper

BBC Music

AudioScrobbler

BBC John Peel

BBC Later + TOTP

Jamendo

Eurostat

Wikicompany

SemWebCentral

Doapspace

FOAF profiles

SIOC Sites

Virtuoso Sponger

Magnatune

US Census Data

GEO Species

UMBEL

Reactome

Yago

Homolo Gene

LAASCNRS UniRef

UniParc

Drug Bank

Daily Med

IBM

Taxonomy

PROSITE GeneID

KEGG

UniProt Pfam

Diseasome

CORDIS

Newcastle

IEEE

CiteSeer

DBLP Berlin

LinkedCT

Pub Chem

eprints

DBLP Hannover

W3C WordNet

GovTrack Open Cyc

Freebase

lingvoj

DBLP RKB Explorer

RKB ECS Southampton

RDF Book Mashup

DBpedia

Linked GeoData

National Science Foundation

RAE 2001

Pisa

Linked MDB

World Factbook

ReSIST Project Wiki

Eurécom

IRIT

Toulouse

ACM

Open Calais riese

Budapest BME

OpenGuides

BBC

Programmes

Resex

SW Conference Corpus

Revyu

flickr wrappr

Project Gutenberg

RDF ohloh

Semantic Web.org

Flickr exporter

QDOS

Crunch Base

Geonames

Pub Guide

ECS Southampton

LIBRIS

CAS ChEBI

OMIM

Symbol

Inter Pro UniSTS

HGNC

MGI

ProDom

Gene Ontology

PDB

PubMed As of July 2009

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

8/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Linked Data im Web 22.09.2010 DB Tropes biz. data. gov.uk

Population (EnAKTing)

NHS

John Peel (DB Tune)

education data.gov .uk

OpenEI

CO2

(EnAKTing)

(EnAKTing)

Ordnance Survey

legislation .gov.uk UK Postcodes

ESD standards

reference data.gov .uk

The London Gazette

BBC Program mes

LOIUS

rdfabout US SEC

GovTrack

Linked Sensor Data (Kno.e.sis)

The Open Library (Talis)

Poképédia

Linked LCCN

Fishes of Texas

Linked MDB

EventMedia

UMBEL

flickr wrappr

URI Burner

Twarql

WordNet (VUA)

Linked GeoData

RDF ohloh

RESEX

Wiki

Pisa

dbpedia lite Daily Med

Taxonomy

Linked Open Numbers

CiteSeer

IEEE

Roma

dotAC GESIS

Courseware

CORDIS

ePrints

Pub Chem OBO

KISTI KEGG Drug

JISC

LAAS

Diseasome

ChEBI

KEGG Cpd Reactome

PDB

Pfam

KEGG Enzyme

CAS ProDom

KEGG Glycan

KEGG Reaction

Chem2 Bio2RDF

Gene Ontology

UniSTS

KEGG Pathway

NSF

HGNC

Homolo Gene

SGD PubMed

Newcastle

UN/ LOCODE

UniProt

Gen Bank

IBM

RAE2001

STITCH

Drug Bank

Affymetrix

ACM

data dcs

ERA

SIDER

TCM Gene DIT

Budapest

IRIT

DBLP (RKB Explorer)

STW

PROSITE

Cornetto

Eurécom

OAI

SW Dog Food

DBLP (FU Berlin)

VIVO Cornell Project Gutenberg (FUB)

Medi Care

Uni Pathway

(RKB Explorer)

DBLP (L3S)

VIVO UF

Uberblic

Linked CT

Product DB

Revyu

OS

UniParc Airports

RISKS

DEPLOY

semantic web.org

BibBase

iServe

Lexvo

WordNet (W3C)

Lotico

VIVO Indiana

UniRef Climbing

P20

OpenCal ais

Freebase

lingvoj

Open Cyc

RDF Book Mashup

Ulm

ECS Southampton

UB Mannheim

ECS

YAGO

riese

Gem. Normdatei

Semantic Crunch Base

NSZL Catalog

totl.net

EUNIS

VIAF

Goodwin Family

Semantic XBRL

rdfabout US Census

PSH

PBAC

World Factbook (FUB)

Geo Species

ECS Southampton EPrints

lobid Resources

Pokedex

New York Times

Geo Names

lobid Organisations

LCSH

LIBRIS

DBpedia

Geo Linked Data (es)

Eurostat

Chronicling America

t4gm

RAMEAU SH

MARC Codes List

Telegraphis

Taxon Concept NASA (Data Incubator)

transport data.gov .uk Eurostat (FUB)

TWC LOGD

Jamendo

BBC Music

Rechtspraak. nl

The Open Library

Manchester Reading Lists

Last.FM (rdfize) classical (DB Tune)

BBC Wildlife Finder

Openly Local

statistics data.gov .uk

Linked Data for Intervals

Last.fm Artists (DBTune)

Music Brainz (zitgist) Music Brainz (DBTune)

Discogs (Data Incubator)

FanHubz

EUTC Productions

Mortality (EnAKTing)

Energy

Surge Radio

research data.gov .uk

(EnAKTing)

Music Brainz (Data Incubator)

NDL subjects NTU Resource Lists

Plymouth Reading Lists

GTAA Magnatune

St. Andrews Resource Lists

Sussex Reading Lists

Audioscrobbler (DBTune)

MySpace (DBTune)

Moseley Folk

GeneID MGI

OMIM

InterPro

As of September 2010

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

9/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Linked Data im Web 19.09.2011 Hellenic FBD Hellenic PD

Crime Reports UK

NHS (EnAKTing)

Ren. Energy Generators

EEA

Open Election Data Project

EU Institutions

Mortality (EnAKTing)

Ordnance Survey

legislation data.gov.uk UK Postcodes

ESD standards

ISTAT Immigration

Lichfield Spending

Scotland Pupils & Exams

Traffic Scotland

Data Gov.ie

reference data.gov. uk

London Gazette

TWC LOGD

Eurostat

Eurostat (FUB)

(RKB Explorer)

(Ontology Central)

GovTrack Linked EDGAR (Ontology Central)

EURES

Finnish Municipalities

New York Times

Open Cyc

Italian public schools

BibBase

Freebase

DBLP (FU Berlin)

dataopenac-uk

TCM Gene DIT

Daily Med

Twarql

EUNIS

Ocean Drilling Codices

Turismo de Zaragoza

Janus AMP

Climbing

Linked GeoData

PDB

Alpine Ski Austria

AEMET

Metoffice Weather Forecasts

Weather Stations

Yahoo! Geo Planet

PROSITE

ChEMBL Open Data Thesaurus

Sears

Pisa

ACM

RESEX

Scholarometer

NVD

IBM DEPLOY

Newcastle

RAE2001

LOCAH Roma

CiteSeer

Courseware

HGNC

(Bio2RDF)

Affymetrix

SISVU

GEMET

Airports National Radioactivity JP

GESIS

Budapest

IRIT

dotAC

ePrints

IEEE RISKS

PubMed

ProDom

VIVO Cornell

STITCH

Linked Open Colors

SGD

Gene Ontology

AGROV OC

Product DB

Swedish Open Cultural Heritage

STW

LAAS

KISTI

NSF

JISC

WordNet (RKB Explorer)

EARTh

DBLP (RKB Explorer)

VIVO Indiana

UniProt

Taxono my

Cornetto

WordNet (W3C)

lobid Organisations

ECS (RKB Explorer)

Pfam

LODE

SMC Journals

NSZL Catalog

Wiki

ECS Southampton

ECS Southampton EPrints

Eurécom

LinkedCT UniProt

WordNet (VUA)

lobid Resources

P20

UN/ LOCODE

SIDER

Drug Bank

Enipedia

Lexvo

DBLP (L3S)

ERA Diseasome

Europeana Deutsche Biographie

OAI

data dcs

Uberblic dbpedia lite

VIAF

UB Mannheim Ulm

data bnf.fr

BNB

lingvoj

Norwegian MeSH

GND

ndlna

Calames

OS

YAGO

Rådata nå!

PSH

IdRef Sudoc

DDC

Project Gutenberg

ntnusc

LIBRIS

LCSH

Sudoc

RDF Book Mashup

Open Calais

Greek DBpedia

LEM

Thesaurus W MARC Codes List

totl.net

US Census (rdfabout)

El Viajero Tourism

URI Burner

World Factbook

Geo Species

UMBEL

riese

GeoWord Net Piedmont Accomodations

Portuguese DBpedia

t4gm info

RAMEAU SH

LinkedL CCN

SW Dog Food

iServe

Geo Names

US SEC

Scotland Geography

Linked MDB

Event Media

DBpedia

(rdfabout)

Semantic XBRL

FTS

flickr wrappr

NDL subjects Open Library (Talis)

theses. fr

my Experiment

Revyu

Fishes of Texas

Linked Sensor Data (Kno.e.sis)

Eurostat

Chronicling America

Telegraphis

Geo Linked Data

CORDIS

CORDIS (FUB)

Goodwin Family

NTU Resource Lists

Open Library

Plymouth Reading Lists

SSW Thesaur us

semantic web.org

BBC Music

BBC Wildlife Finder

NASA (Data Incubator)

transport data.gov. uk

Source Code Ecosystem Linked Data

Didactal ia

Pokedex

St. Andrews Resource Lists

Manchester Reading Lists

gnoss Poképédia

Classical (DB Tune)

Taxon Concept

LOIUS

Jamendo (DBtune)

Last.FM (rdfize)

BBC Program mes

Rechtspraak. nl

Openly Local

data.gov.uk intervals

Music Brainz (DBTune)

Ontos News Portal

Sussex Reading Lists

Bricklink

yovisto

Semantic Tweet

Linked Crunchbase

RDF ohloh

(Data Incubator)

(DBTune)

OpenEI

statistics data.gov. uk

GovWILD

Brazilian Politicians

educatio n.data.g ov.uk

Music Brainz (zitgist)

Discogs

FanHubz

patents data.go v.uk

research data.gov. uk

CO2 Emission (EnAKTing)

Energy (EnAKTing)

Surge Radio

Klappstuhlclub

Lotico

(Data Incubator)

Last.FM artists

Population (EnAKTing)

reegle

business data.gov. uk

Crime (EnAKTing)

Ox Points

EUTC Productions

tags2con delicious

Slideshare 2RDF

(DBTune)

Music Brainz

John Peel (DBTune)

Linked User Feedback

LOV

Audio Scrobbler

Moseley Folk

GTAA

Magnatune

DB Tropes

OMIM

MGI

InterPro Smart Link

Product Types Ontology

Open Corporates

Italian Museums

Amsterdam Museum

UniParc

UniRef

UniSTS

GeneID

Linked Open Numbers

Reactome

OGOLOD

KEGG Pathway

Medi Care

Google Art wrapper

meducator

KEGG Drug

Pub Chem

UniPath way

Chem2 Bio2RDF

Homolo Gene

VIVO UF

ECCOTCP bible ontology

KEGG Enzyme

PBAC

KEGG Reaction

KEGG Compound

KEGG Glycan

As of September 2011

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

10/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Semantic Web Technologien I

I

Nützlich zum Publizieren, zum Austausch und zur Integration von Daten Semantic Web Technologien sind mittlerweile recht ausgereift I I I I I

I

I

IRIs (IETF RFC 3987, 2005) HTTP (IETF RFC 2616, 1999) RDF (W3C Recommendation, 1999, Update in 2004) RDFS (W3C Recommendation, 2004) SPARQL (W3C Recommendation, 2008, Update im Moment) OWL (W3C Recommendation, 2004, Update in 2009)

Linked Data besteht aus einigen Prinzipien zum Publizieren von Datem im Web

11/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Linked Data Principles* 1. Use URIs to name things; not only documents, but also people, locations, concepts, etc. 2. To enable agents (human users and machine agents alike) to look up those names, use HTTP URIs 3. When someone looks up a URI we provide useful information; with ’useful’ in the strict sense we usually mean structured data in RDF. 4. Include links to other URIs allowing agents (machines and humans) to discover more things

*http://www.w3.org/DesignIssues/LinkedData.html

12/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Zusammenhang zwischen URI einer Sache und URI einer Quelle

User Agent

HTTP GET

http://www.polleres.net/foaf.rdf#me

RDF

Web Server

http://www.polleres.net/foaf.rdf

13/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Zusammenhang zwischen URI einer Sache und URI einer Quelle

User Agent

HTTP GET

303*

HTTP GET

http://dbpedia.org/resource/Gordon_Brown

RDF

Web Server

http://dbpedia.org/data/Gordon_Brown

http://dbpedia.org/page/Gordon_Brown

*HTTP Response Code 303: See Other

14/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Hintergrund: Uniform Resource Identifiers I

Ein Uniform Resource Identifier ist eine kompakte Sequenz von Charakteren, die eine abstrakte oder physikalische Ressource identifizieren [RFC3986]

I

Syntax URI = Schema ":" hier-part [ "?" Abfrage ] [ "#" Fragment ]

I

Beispiel authority

query

z }| { z }| { examemple.com:8042/ bar ?name=peter foo:// |{z} |#titel {z } | {z }

Schema

path

Fragment

15/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

URIs/IRIs Protokoll

Domäne

z }| {z }| { http://semanticweb.org/id/Axel_Polleres {z } | {z }| Namensraum

Lokaler Name

Präfix

z }| {z }| { thing:Axel_Polleres I

URIs sind “Uniform Resource Identifiers” I

I I

IRIs sind Unicode-basierte “Internationalized Resource Identifiers”

Jede URI identifiziert eine Entität Semantic Web URIs nutzen üblicherweise HTTP I I

I

HyperText Transfer Protocol Können idealerweise aufgelöst werden, um weitere Daten zu erhalten Linked Data

16/42

Birte Glimm |

Semantic Web Grundlagen |

Auflösung von URIs

02. Feb 2012

17/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Das HTTP Protokoll Das HTTP Protokoll ist laut [RFC2616] I

an application-level protocol for distributed, collaborative, hypermedia information systems

I

a generic, stateless, protocol which can be used for many tasks beyond its use for hypertext

I

a protocol which includes the typing and negotiation of data representation, allowing systems to be built independently of the data being transferred

18/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

HTTP Übersicht I

HTTP Nachrichten bestehen aus der Anfrage eines Clients an einen Server und die Antworten des Servers zum Client

I

Bestimmte Methoden sind vordefiniert (z.B. GET, POST, etc.), aber weitere können definiert werden Eine Menge von Statuscodes ist definiert:

I

I I

I

I I

Informational 1xx, provisional response, (100 Continue) Successful 2xx, request successfully received, understood, and accepted (201 Created) Redirection 3xx, further action needs to be taken by user agent to fulfill the request (301 Moved Permanently) Client Error 4xx, client erred (405 Method Not Allowed) Server Error 5xx, server encountered an unexpected condition (501 Not Implemented)

19/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

HTTP Übersicht 1. Parse URI and find HTTP protocol 2. Look up DNS name to determine the associated IP address 3. Open a TCP stream to port 80 at the IP address determined above 4. Format an HTTP GET request for resource and send that to the server 5. Read response from the server 6. From status code (200) determine a successful request (representation of the resource is available) 7. Inspect the returned Content-Type (e.g., UTF-8 encoded text/html) 8. Pass the entity-body to the HTML rendering engine

20/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

HTTP GET Request GET /todaysnews HTTP/1.1 Host: example.com User-Agent: Mozilla/8.0 Accept: text/html,application/xhtml+xml;q=0.9,*/* Accept-language: en-us

21/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

HTTP Response HTTP/1.1 200 OK Date: Tue, 28 Aug 2007 01:49:33 GMT Server: Apache/2.2.11 Content-Type: text/html; charset=utf-8 Today’s news Today’s News: Oh boy!! [HTML FOR NEWS REPORT HERE]

22/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Repräsentationen I

Informationsressourcen können unterschiedliche Repräsentationen haben.

I

Eine Repräsentation ist ein Stream von Bytes in einem bestimmten Format wie z.B. HTML, RDF/XML oder JPEG.

I

Beispiel: Eine Rechnung ist eine Informationsressource, die in HTML, als druckbares PDF oder als RDF Dokument repräsentiert werden kann.

I

Eine einzelne Ressource kann viele verschiedene Repräsentationen haben z.B. in verschiedenen Formaten, Auflösungen oder Sprachen

23/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

HTTP Content Negotiation I

Content Negotiation (CN, conneg) ist der Prozess der Selektion der besten Repräsentation für eine Anfrage wenn mehrere Repräsentationen verfügbar sind

I

Drei Arten: server-driven, agent-driven, transparent

$ curl -H "Accept: application/rdf+xml" http://dbpedia.org/resource/Galway HTTP/1.1 303 See Other Content-Type: application/rdf+xml Location: http://dbpedia.org/data/Galway.rdf $ curl – Tool um Daten zu einerm Server zu schicken oder von einem Server zu empfangen -H bedeutet nur HTTP/HTTPS

24/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

RDF als Linked Data Andreas Harth Datei veröffentlicht unter http://harth.org/andreas/foaf.rdf URI bezeichnet Andreas: http://harth.org/andreas/foaf.rdf#ah

25/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Semantic Web Application Architecture

25/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Semantic Web Application Architecture

Birte Glimm |

26/42

Semantic Web Grundlagen |

02. Feb 2012

Ox Points

NHS (EnAKTing)

Ren. Energy Generators

Open Election Data Project

EU Institutions

Mortality (EnAKTing)

legislation data.gov.uk UK Postcodes

ESD standards

ISTAT Immigration

Lichfield Spending

Scotland Pupils & Exams

Traffic Scotland

Data Gov.ie

reference data.gov. uk

data.gov.uk intervals

London Gazette

TWC LOGD

Eurostat

Eurostat (FUB)

(RKB Explorer)

Finnish Municipalities

Event Media

New York Times

Geo Species

UMBEL

El Viajero Tourism

RDF Book Mashup

Greek DBpedia

BNB BibBase

DBLP (FU Berlin)

dataopenac-uk

TCM Gene DIT

Daily Med

DBLP (L3S)

Diseasome

SIDER

UniProt

PDB

PROSITE

ProDom

SMC Journals

Ocean Drilling Codices

Janus AMP

Climbing

Linked GeoData

WordNet (W3C)

Alpine Ski Austria

AEMET

Metoffice Weather Forecasts

Weather Stations

Yahoo! Geo Planet

Airports National Radioactivity JP

Sears

DEPLOY

RAE2001

LOCAH Roma Courseware

dotAC

IEEE RISKS

Affymetrix

SISVU

PubMed

ChEMBL Linked Open Colors

SGD

Gene Ontology

AGROV OC

Open Data Thesaurus

Product DB

NVD

IBM

ePrints

VIVO Cornell

STITCH

OMIM

MGI

InterPro Smart Link

Product Types Ontology

Open Corporates

Italian Museums

Amsterdam Museum

UniParc

UniRef

UniSTS

Linked Open Numbers

Reactome

OGOLOD

KEGG Pathway

Medi Care

Google Art wrapper

meducator

KEGG Drug

Pub Chem

GeneID

UniPath way

Chem2 Bio2RDF

Homolo Gene

Scholarometer

IRIT

Newcastle

CiteSeer

HGNC

GESIS

RESEX

LAAS

KISTI

NSF

JISC

WordNet (RKB Explorer)

GEMET

EARTh

Swedish Open Cultural Heritage

STW

Pisa

ACM

VIVO Indiana

UniProt

(Bio2RDF)

LODE

Turismo de Zaragoza

lobid Organisations Budapest

Pfam

LinkedCT

Taxono my

Wiki

ECS Southampton ECS (RKB Explorer)

DBLP (RKB Explorer)

Eurécom

Drug Bank

Enipedia

Cornetto

NSZL Catalog

P20

ECS Southampton EPrints

UN/ LOCODE

ERA

lingvoj

Lexvo

WordNet (VUA)

lobid Resources

OAI

data dcs

Uberblic dbpedia lite

Europeana Deutsche Biographie

Ulm

data bnf.fr

OS

Project Gutenberg

Norwegian MeSH

VIAF

UB Mannheim

Calames

Freebase

YAGO

Open Cyc

riese

Twarql

EUNIS

GeoWord Net

Italian public schools

URI Burner

World Factbook

Rådata nå!

GND

ndlna

totl.net

US Census (rdfabout)

Piedmont Accomodations

IdRef Sudoc

DDC

Open Calais

ntnusc

PSH

SW Dog Food

Portuguese DBpedia

LEM

LIBRIS

LCSH

MARC Codes List

Sudoc

iServe

Geo Names

US SEC

(rdfabout)

Semantic XBRL Scotland Geography

Linked MDB

t4gm info

RAMEAU SH

Thesaurus W theses. fr

my Experiment

flickr wrappr

DBpedia

Linked Sensor Data (Kno.e.sis)

Eurostat

(Ontology Central)

GovTrack Linked EDGAR (Ontology Central)

FTS

Pokedex

NDL subjects Open Library (Talis)

LinkedL CCN

SSW Thesaur us

Didactal ia Goodwin Family

NTU Resource Lists

Open Library

Plymouth Reading Lists

Revyu

Fishes of Texas

Geo Linked Data

CORDIS

CORDIS (FUB)

EURES

Chronicling America

Telegraphis

NASA (Data Incubator)

transport data.gov. uk

gnoss Poképédia

St. Andrews Resource Lists

Manchester Reading Lists

Source Code Ecosystem Linked Data

semantic web.org

BBC Music

Taxon Concept

LOIUS

Jamendo (DBtune)

Ontos News Portal

Sussex Reading Lists

Bricklink

yovisto

Semantic Tweet

Linked Crunchbase

RDF ohloh

Classical (DB Tune)

BBC Wildlife Finder

Rechtspraak. nl

Openly Local

Music Brainz (DBTune)

Klappstuhlclub

Lotico Music Brainz (zitgist)

Last.FM (rdfize)

BBC Program mes

OpenEI

statistics data.gov. uk

GovWILD

Brazilian Politicians

educatio n.data.g ov.uk

Ordnance Survey

(DBTune)

patents data.go v.uk

research data.gov. uk

CO2 Emission (EnAKTing)

Energy (EnAKTing)

EEA

FanHubz

tags2con delicious

Slideshare 2RDF

(DBTune)

Discogs

(Data Incubator)

Linked User Feedback

LOV

Audio Scrobbler

(Data Incubator)

Last.FM artists

Population (EnAKTing)

reegle

business data.gov. uk

Crime (EnAKTing)

Surge Radio

Moseley Folk

Music Brainz

John Peel (DBTune)

EUTC Productions

Antwort

Crime Reports UK

GTAA

Magnatune

DB Tropes Hellenic FBD Hellenic PD

Abfrage

Linked Data Anwendungen: Minimale Architektur

VIVO UF

ECCOTCP bible ontology

KEGG Enzyme

PBAC

KEGG Reaction

KEGG Compound

KEGG Glycan

As of September 2011

27/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Beispiel: Visualisierung der Wahlergebnisse I

Daten von IT.NRW (Landesbetrieb Information und Technik Nordrhein-Westfalen) im CSV Format

I

Schritt 1: Konvertierung nach RDF (mittels Google AppEngine* Wrapper oder Google Refine** mit RDF Extension***)

I

Schritt 2: Linked Data Abfragen

I

Schritt 3: Visualisierung der Ergebnisse

*http://code.google.com/appengine/ **http://code.google.com/p/google-refine/ ***http://lab.linkeddata.deri.ie/2010/ grefine-rdf-extension/ http://gesis-lod.appspot.com/vis/

28/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Beispiel: Visualisierung der Ökonomischen Situation I

Daten von GESIS (Leibniz-Institut für Sozialwissenschaften) im CSV Format

I

Schritt 1: Konvertierung nach RDF und publiziere die Daten online

I

Schritt 2: Linked Data Abfragen

I

Schritt 3: Visualisierung der Ergebnisse

http://gesis-lod.appspot.com/vis/

29/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Beispiel: Visualisierung Eurostat Daten I

Daten von Eurostat (Statistisches Büro der EU) im CSV oder SDMX Format

I

Schritt 1: Konvertierung nach RDF

I

Schritt 2: Linked Data Abfragen

I

Schritt 3: Visualisierung der Ergebnisse

http://estatwrap.ontologycentral.com/page/tsieb010

30/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Linked Data Services I

Einige Services erlauben nur eingeschränkten Zugriff auf Ihre Daten (z.B. APIs von sozialen Netzwerken)

I

Manchmal wird mehr als ein Parameter benötigt (z.B. um den kürzesten Abstand zwischen zwei Punkten zu berechnen)

I

Idealerweise sollte Linked Data derartige Service integrieren

31/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Szenario I

Typisches Datenintegrationsszenario

Gemeinsames

Daten

Interaktive

Datenformat

Integration

Datenexploration

I

Anfrage: Welche Jobangebote gibt es von Konkurrenten von Facebook?

I

Anfrage: Nach welchem Muster vergibt Vulcan Capital Mittel?

32/42

Birte Glimm |

Semantic Web Grundlagen |

Datenqueallen

02. Feb 2012

33/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Schritt 1: Vorbereitung der Daten - Gemeinsames Datenformat

34/42

Birte Glimm |

Semantic Web Grundlagen |

Schritt 2: Datenintegration

02. Feb 2012

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Schritt 3: Interaktive Datenexploration

1. Abfrage

2. Ergebnisse

35/42

3. Visualisierung

36/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Verlinkung von Daten mit Daten von Servicen? :facebook foaf:name "Facebook" . :facebook cb:has_office :facebook-hp . :facebook-hq geo:lat "37.416" . :facebook-hq geo:long "122.152" . :facebook-hq vc:locality "Palo Alto, CA" .

Gegeben der Firmenname und Ort, finde die Jobangebote

Gegeben die Koordinaten, finde nahegelegene Orte (via GeoNames)

37/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Daten Service? I I I

Gegeben eine Eingabe, erzeuge die Ausgabe Eingabe und Ausgabe hängen in einer Service-spezifischen Art zusammen Weltzustand bleibt unverändert

Eingabe

Relation

Ausgabe

definiert

Service I

Beispiel: GeoNames findNearbyWikipedia Service I I I

Eingabe: Latitude/Longitude Koordinaten Ausgabe: Orte Beziehung: Ausgabe Orte sind in der Nähe der Eingabekoordinaten

38/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

LIDS: Linked Data Services I

Wünschenswert wäre eine Integration von Daten Servicen mit Linked Data 1. LIDS müssen sich an die Linked Data Prinzipien halten

I

Wünschenswert wäre die Nutzung von Daten Servicen in Software Programmen 1. LIDS brauchen maschinenlesbare Beschreibungen von Eingabe und Ausgabe

39/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Data Services als Linked Data I

Eingabe ist gegeben als URI Eingabe

Service Endpoint

Parameter

Identifier

z }| {z }| { z }| { http://geowrap.openlids.org/findNearbyWikipedia?lat=37.416&lng=-122.152 #point I

Auflösung der URI ergibt RDF:

@prefix dbp: . Eingabe

}| { z @prefix : . Relation

z }| { :point foaf:based_near dbp:Palo_Alto%2C_California , dbp:Packard%27s_garage . | {z } Ausgabe

40/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

LIDS Beschreibungen mittels SPARQL I

I

Gegeben eine bestimmte Eingabe, kann die entsprechende Ausgabe von einer impliziten Datenquelle abgefragt werden Entspricht einer SPARQL CONSTRUCT Abfrage

CONSTRUCT { [output] } FROM [endpoint] WHERE { [input] } I I I

Eingabe beschreibt die benötigten Daten als Abfragemuster Der Endpunkt ist die base URI um eine Service Eingabe zu konstruieren Ausgabe beschreibt die Daten, die der Service geliefert hat

CONSTRUCT { ?point foaf:based_near ?feature. } FROM WHERE { ?point a Point ; geo:lat ?lat ; geo:long ?lng }

41/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

LIDS Zusammenfassung I

I

Dynamische Quellen (GeoNames Wrapper, Twitter Wrapper, Feeds Wrapper) können in Linked Data integriert werden LIDS nützlich für I I

I

I

I

Einfügen von LIDS in statische RDF Datensätze Linked Data Endpunkte, die dynamisch Links von ihren Daten zu LIDS hinzufügen Linked Data Browser, die abgefragte Daten um abgefragte Daten von LIDS erweitern Integration von LIDS in die SPARQL Abfrageverarbeitung

LIDS erlauben das Publizieren und Wiederbenutzen von Datenservices im Web

42/42

Birte Glimm |

Semantic Web Grundlagen |

02. Feb 2012

Zusammenfassung I

Die Menge an verfügbaren Daten wächst ständig

I

Semantik wird gebraucht, um Daten aus verschiedenen Quellen zu integrieren

I

Abfrage und Visualisierung von Daten in Kombination möglich

I

Die Verarbeitung und Abfrage von Daten aus verschiedenen Quellen erhöht die Transparenz und erleichtert die Forschung (Testen von Hypothesen wird einfacher)