Semantic Web Grundlagen Birte Glimm Institut für Künstliche Intelligenz | 02. Feb 2012
Linked Data
2/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Organisatorisches: Inhalt Einleitung und XML Einführung in RDF RDF Schema fällt aus Logik – Grundlagen Übung 1 Semantik von RDF(S) RDF(S) & Datalog Regeln OWL Syntax & Intuition Übung 2 OWL & BLs OWL 2 Tableau Übung 3 Blocking & Unravelling Hypertableau
17. Okt 20. Okt 24. Okt 27. Okt 31. Okt 3. Nov 7. Nov 10. Nov 14. Nov 17. Nov 21. Nov 24. Nov 28. Nov 1. Dez 5. Dez 8. Dez
Hypertableau II Übung 4 SPARQL Syntax & Intuition SPARQL Semantik SPARQL 1.1 Übung 5 SPARQL Entailment SPARQL Implemetierung Ontology Editing Übung 6 Ontology Engineering Linked Data SemWeb Anwendungen Übung 7 Wiederholung Übung 8
Abfragen und RIF wurde gestrichen
12. Dez 15. Dez 19. Dez 22. Dez 9. Jan 12. Jan 16. Jan 19. Jan 23. Jan 26. Jan 30. Jan 2. Feb 6. Feb 9. Feb 13. Feb 16. Feb
3/42
Birte Glimm |
Semantic Web Grundlagen |
Linked Data
02. Feb 2012
3/42
Birte Glimm |
Semantic Web Grundlagen |
Linked Data
02. Feb 2012
4/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Daten im Web I
Immer mehr Websites stellen einen programmatischen Zugriff auf ihre Daten zur Verfügung
I
Dabei werden Semantic Web Standards verwendet, z.B. die Linking Open Data (LOD) Initiative http://www.w3.org/wiki/SweoIG/TaskForces/ CommunityProjects/LinkingOpenData
I
Verwendet werden APIs, z.B. via JSON/REST
I
Semantic Web Technologien vereinfachen die Integration von Daten aus verschiedenen Quellen
I
Die Kombination von Daten erlaubt auf tiefere Einblicke
5/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Linked Data im Web 01.05.2007
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
6/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Linked Data im Web 31.03.2008 ECS Southampton
Musicbrainz
Jamendo
BBC Later + TOTP
Doapspace
AudioScrobbler
QDOS
Magnatune
BBC John Peel
updated
FOAF profiles
Geonames US Census Data
SemWebCentral
Flickr exporter
Ontoworld
riese
GovTrack
SW Conference Corpus OpenGuides
Revyu DBpedia
NEW!
SIOC profiles
World Factbook
Wikicompany
RDF Book Mashup lingvoj
DBLP Berlin NEW!
Eurostat
W3C WordNet
Open Cyc
RKB Explorer
flickr wrappr
Project Gutenberg
DBLP Hannover
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
7/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Linked Data im Web 14.07.2009 Surge Radio
BBC Playcount Data
Musicbrainz
MySpace Wrapper
BBC Music
AudioScrobbler
BBC John Peel
BBC Later + TOTP
Jamendo
Eurostat
Wikicompany
SemWebCentral
Doapspace
FOAF profiles
SIOC Sites
Virtuoso Sponger
Magnatune
US Census Data
GEO Species
UMBEL
Reactome
Yago
Homolo Gene
LAASCNRS UniRef
UniParc
Drug Bank
Daily Med
IBM
Taxonomy
PROSITE GeneID
KEGG
UniProt Pfam
Diseasome
CORDIS
Newcastle
IEEE
CiteSeer
DBLP Berlin
LinkedCT
Pub Chem
eprints
DBLP Hannover
W3C WordNet
GovTrack Open Cyc
Freebase
lingvoj
DBLP RKB Explorer
RKB ECS Southampton
RDF Book Mashup
DBpedia
Linked GeoData
National Science Foundation
RAE 2001
Pisa
Linked MDB
World Factbook
ReSIST Project Wiki
Eurécom
IRIT
Toulouse
ACM
Open Calais riese
Budapest BME
OpenGuides
BBC
Programmes
Resex
SW Conference Corpus
Revyu
flickr wrappr
Project Gutenberg
RDF ohloh
Semantic Web.org
Flickr exporter
QDOS
Crunch Base
Geonames
Pub Guide
ECS Southampton
LIBRIS
CAS ChEBI
OMIM
Symbol
Inter Pro UniSTS
HGNC
MGI
ProDom
Gene Ontology
PDB
PubMed As of July 2009
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
8/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Linked Data im Web 22.09.2010 DB Tropes biz. data. gov.uk
Population (EnAKTing)
NHS
John Peel (DB Tune)
education data.gov .uk
OpenEI
CO2
(EnAKTing)
(EnAKTing)
Ordnance Survey
legislation .gov.uk UK Postcodes
ESD standards
reference data.gov .uk
The London Gazette
BBC Program mes
LOIUS
rdfabout US SEC
GovTrack
Linked Sensor Data (Kno.e.sis)
The Open Library (Talis)
Poképédia
Linked LCCN
Fishes of Texas
Linked MDB
EventMedia
UMBEL
flickr wrappr
URI Burner
Twarql
WordNet (VUA)
Linked GeoData
RDF ohloh
RESEX
Wiki
Pisa
dbpedia lite Daily Med
Taxonomy
Linked Open Numbers
CiteSeer
IEEE
Roma
dotAC GESIS
Courseware
CORDIS
ePrints
Pub Chem OBO
KISTI KEGG Drug
JISC
LAAS
Diseasome
ChEBI
KEGG Cpd Reactome
PDB
Pfam
KEGG Enzyme
CAS ProDom
KEGG Glycan
KEGG Reaction
Chem2 Bio2RDF
Gene Ontology
UniSTS
KEGG Pathway
NSF
HGNC
Homolo Gene
SGD PubMed
Newcastle
UN/ LOCODE
UniProt
Gen Bank
IBM
RAE2001
STITCH
Drug Bank
Affymetrix
ACM
data dcs
ERA
SIDER
TCM Gene DIT
Budapest
IRIT
DBLP (RKB Explorer)
STW
PROSITE
Cornetto
Eurécom
OAI
SW Dog Food
DBLP (FU Berlin)
VIVO Cornell Project Gutenberg (FUB)
Medi Care
Uni Pathway
(RKB Explorer)
DBLP (L3S)
VIVO UF
Uberblic
Linked CT
Product DB
Revyu
OS
UniParc Airports
RISKS
DEPLOY
semantic web.org
BibBase
iServe
Lexvo
WordNet (W3C)
Lotico
VIVO Indiana
UniRef Climbing
P20
OpenCal ais
Freebase
lingvoj
Open Cyc
RDF Book Mashup
Ulm
ECS Southampton
UB Mannheim
ECS
YAGO
riese
Gem. Normdatei
Semantic Crunch Base
NSZL Catalog
totl.net
EUNIS
VIAF
Goodwin Family
Semantic XBRL
rdfabout US Census
PSH
PBAC
World Factbook (FUB)
Geo Species
ECS Southampton EPrints
lobid Resources
Pokedex
New York Times
Geo Names
lobid Organisations
LCSH
LIBRIS
DBpedia
Geo Linked Data (es)
Eurostat
Chronicling America
t4gm
RAMEAU SH
MARC Codes List
Telegraphis
Taxon Concept NASA (Data Incubator)
transport data.gov .uk Eurostat (FUB)
TWC LOGD
Jamendo
BBC Music
Rechtspraak. nl
The Open Library
Manchester Reading Lists
Last.FM (rdfize) classical (DB Tune)
BBC Wildlife Finder
Openly Local
statistics data.gov .uk
Linked Data for Intervals
Last.fm Artists (DBTune)
Music Brainz (zitgist) Music Brainz (DBTune)
Discogs (Data Incubator)
FanHubz
EUTC Productions
Mortality (EnAKTing)
Energy
Surge Radio
research data.gov .uk
(EnAKTing)
Music Brainz (Data Incubator)
NDL subjects NTU Resource Lists
Plymouth Reading Lists
GTAA Magnatune
St. Andrews Resource Lists
Sussex Reading Lists
Audioscrobbler (DBTune)
MySpace (DBTune)
Moseley Folk
GeneID MGI
OMIM
InterPro
As of September 2010
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
9/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Linked Data im Web 19.09.2011 Hellenic FBD Hellenic PD
Crime Reports UK
NHS (EnAKTing)
Ren. Energy Generators
EEA
Open Election Data Project
EU Institutions
Mortality (EnAKTing)
Ordnance Survey
legislation data.gov.uk UK Postcodes
ESD standards
ISTAT Immigration
Lichfield Spending
Scotland Pupils & Exams
Traffic Scotland
Data Gov.ie
reference data.gov. uk
London Gazette
TWC LOGD
Eurostat
Eurostat (FUB)
(RKB Explorer)
(Ontology Central)
GovTrack Linked EDGAR (Ontology Central)
EURES
Finnish Municipalities
New York Times
Open Cyc
Italian public schools
BibBase
Freebase
DBLP (FU Berlin)
dataopenac-uk
TCM Gene DIT
Daily Med
Twarql
EUNIS
Ocean Drilling Codices
Turismo de Zaragoza
Janus AMP
Climbing
Linked GeoData
PDB
Alpine Ski Austria
AEMET
Metoffice Weather Forecasts
Weather Stations
Yahoo! Geo Planet
PROSITE
ChEMBL Open Data Thesaurus
Sears
Pisa
ACM
RESEX
Scholarometer
NVD
IBM DEPLOY
Newcastle
RAE2001
LOCAH Roma
CiteSeer
Courseware
HGNC
(Bio2RDF)
Affymetrix
SISVU
GEMET
Airports National Radioactivity JP
GESIS
Budapest
IRIT
dotAC
ePrints
IEEE RISKS
PubMed
ProDom
VIVO Cornell
STITCH
Linked Open Colors
SGD
Gene Ontology
AGROV OC
Product DB
Swedish Open Cultural Heritage
STW
LAAS
KISTI
NSF
JISC
WordNet (RKB Explorer)
EARTh
DBLP (RKB Explorer)
VIVO Indiana
UniProt
Taxono my
Cornetto
WordNet (W3C)
lobid Organisations
ECS (RKB Explorer)
Pfam
LODE
SMC Journals
NSZL Catalog
Wiki
ECS Southampton
ECS Southampton EPrints
Eurécom
LinkedCT UniProt
WordNet (VUA)
lobid Resources
P20
UN/ LOCODE
SIDER
Drug Bank
Enipedia
Lexvo
DBLP (L3S)
ERA Diseasome
Europeana Deutsche Biographie
OAI
data dcs
Uberblic dbpedia lite
VIAF
UB Mannheim Ulm
data bnf.fr
BNB
lingvoj
Norwegian MeSH
GND
ndlna
Calames
OS
YAGO
Rådata nå!
PSH
IdRef Sudoc
DDC
Project Gutenberg
ntnusc
LIBRIS
LCSH
Sudoc
RDF Book Mashup
Open Calais
Greek DBpedia
LEM
Thesaurus W MARC Codes List
totl.net
US Census (rdfabout)
El Viajero Tourism
URI Burner
World Factbook
Geo Species
UMBEL
riese
GeoWord Net Piedmont Accomodations
Portuguese DBpedia
t4gm info
RAMEAU SH
LinkedL CCN
SW Dog Food
iServe
Geo Names
US SEC
Scotland Geography
Linked MDB
Event Media
DBpedia
(rdfabout)
Semantic XBRL
FTS
flickr wrappr
NDL subjects Open Library (Talis)
theses. fr
my Experiment
Revyu
Fishes of Texas
Linked Sensor Data (Kno.e.sis)
Eurostat
Chronicling America
Telegraphis
Geo Linked Data
CORDIS
CORDIS (FUB)
Goodwin Family
NTU Resource Lists
Open Library
Plymouth Reading Lists
SSW Thesaur us
semantic web.org
BBC Music
BBC Wildlife Finder
NASA (Data Incubator)
transport data.gov. uk
Source Code Ecosystem Linked Data
Didactal ia
Pokedex
St. Andrews Resource Lists
Manchester Reading Lists
gnoss Poképédia
Classical (DB Tune)
Taxon Concept
LOIUS
Jamendo (DBtune)
Last.FM (rdfize)
BBC Program mes
Rechtspraak. nl
Openly Local
data.gov.uk intervals
Music Brainz (DBTune)
Ontos News Portal
Sussex Reading Lists
Bricklink
yovisto
Semantic Tweet
Linked Crunchbase
RDF ohloh
(Data Incubator)
(DBTune)
OpenEI
statistics data.gov. uk
GovWILD
Brazilian Politicians
educatio n.data.g ov.uk
Music Brainz (zitgist)
Discogs
FanHubz
patents data.go v.uk
research data.gov. uk
CO2 Emission (EnAKTing)
Energy (EnAKTing)
Surge Radio
Klappstuhlclub
Lotico
(Data Incubator)
Last.FM artists
Population (EnAKTing)
reegle
business data.gov. uk
Crime (EnAKTing)
Ox Points
EUTC Productions
tags2con delicious
Slideshare 2RDF
(DBTune)
Music Brainz
John Peel (DBTune)
Linked User Feedback
LOV
Audio Scrobbler
Moseley Folk
GTAA
Magnatune
DB Tropes
OMIM
MGI
InterPro Smart Link
Product Types Ontology
Open Corporates
Italian Museums
Amsterdam Museum
UniParc
UniRef
UniSTS
GeneID
Linked Open Numbers
Reactome
OGOLOD
KEGG Pathway
Medi Care
Google Art wrapper
meducator
KEGG Drug
Pub Chem
UniPath way
Chem2 Bio2RDF
Homolo Gene
VIVO UF
ECCOTCP bible ontology
KEGG Enzyme
PBAC
KEGG Reaction
KEGG Compound
KEGG Glycan
As of September 2011
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
10/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Semantic Web Technologien I
I
Nützlich zum Publizieren, zum Austausch und zur Integration von Daten Semantic Web Technologien sind mittlerweile recht ausgereift I I I I I
I
I
IRIs (IETF RFC 3987, 2005) HTTP (IETF RFC 2616, 1999) RDF (W3C Recommendation, 1999, Update in 2004) RDFS (W3C Recommendation, 2004) SPARQL (W3C Recommendation, 2008, Update im Moment) OWL (W3C Recommendation, 2004, Update in 2009)
Linked Data besteht aus einigen Prinzipien zum Publizieren von Datem im Web
11/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Linked Data Principles* 1. Use URIs to name things; not only documents, but also people, locations, concepts, etc. 2. To enable agents (human users and machine agents alike) to look up those names, use HTTP URIs 3. When someone looks up a URI we provide useful information; with ’useful’ in the strict sense we usually mean structured data in RDF. 4. Include links to other URIs allowing agents (machines and humans) to discover more things
*http://www.w3.org/DesignIssues/LinkedData.html
12/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Zusammenhang zwischen URI einer Sache und URI einer Quelle
User Agent
HTTP GET
http://www.polleres.net/foaf.rdf#me
RDF
Web Server
http://www.polleres.net/foaf.rdf
13/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Zusammenhang zwischen URI einer Sache und URI einer Quelle
User Agent
HTTP GET
303*
HTTP GET
http://dbpedia.org/resource/Gordon_Brown
RDF
Web Server
http://dbpedia.org/data/Gordon_Brown
http://dbpedia.org/page/Gordon_Brown
*HTTP Response Code 303: See Other
14/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Hintergrund: Uniform Resource Identifiers I
Ein Uniform Resource Identifier ist eine kompakte Sequenz von Charakteren, die eine abstrakte oder physikalische Ressource identifizieren [RFC3986]
I
Syntax URI = Schema ":" hier-part [ "?" Abfrage ] [ "#" Fragment ]
I
Beispiel authority
query
z }| { z }| { examemple.com:8042/ bar ?name=peter foo:// |{z} |#titel {z } | {z }
Schema
path
Fragment
15/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
URIs/IRIs Protokoll
Domäne
z }| {z }| { http://semanticweb.org/id/Axel_Polleres {z } | {z }| Namensraum
Lokaler Name
Präfix
z }| {z }| { thing:Axel_Polleres I
URIs sind “Uniform Resource Identifiers” I
I I
IRIs sind Unicode-basierte “Internationalized Resource Identifiers”
Jede URI identifiziert eine Entität Semantic Web URIs nutzen üblicherweise HTTP I I
I
HyperText Transfer Protocol Können idealerweise aufgelöst werden, um weitere Daten zu erhalten Linked Data
16/42
Birte Glimm |
Semantic Web Grundlagen |
Auflösung von URIs
02. Feb 2012
17/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Das HTTP Protokoll Das HTTP Protokoll ist laut [RFC2616] I
an application-level protocol for distributed, collaborative, hypermedia information systems
I
a generic, stateless, protocol which can be used for many tasks beyond its use for hypertext
I
a protocol which includes the typing and negotiation of data representation, allowing systems to be built independently of the data being transferred
18/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
HTTP Übersicht I
HTTP Nachrichten bestehen aus der Anfrage eines Clients an einen Server und die Antworten des Servers zum Client
I
Bestimmte Methoden sind vordefiniert (z.B. GET, POST, etc.), aber weitere können definiert werden Eine Menge von Statuscodes ist definiert:
I
I I
I
I I
Informational 1xx, provisional response, (100 Continue) Successful 2xx, request successfully received, understood, and accepted (201 Created) Redirection 3xx, further action needs to be taken by user agent to fulfill the request (301 Moved Permanently) Client Error 4xx, client erred (405 Method Not Allowed) Server Error 5xx, server encountered an unexpected condition (501 Not Implemented)
19/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
HTTP Übersicht 1. Parse URI and find HTTP protocol 2. Look up DNS name to determine the associated IP address 3. Open a TCP stream to port 80 at the IP address determined above 4. Format an HTTP GET request for resource and send that to the server 5. Read response from the server 6. From status code (200) determine a successful request (representation of the resource is available) 7. Inspect the returned Content-Type (e.g., UTF-8 encoded text/html) 8. Pass the entity-body to the HTML rendering engine
20/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
HTTP GET Request GET /todaysnews HTTP/1.1 Host: example.com User-Agent: Mozilla/8.0 Accept: text/html,application/xhtml+xml;q=0.9,*/* Accept-language: en-us
21/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
HTTP Response HTTP/1.1 200 OK Date: Tue, 28 Aug 2007 01:49:33 GMT Server: Apache/2.2.11 Content-Type: text/html; charset=utf-8 Today’s news Today’s News: Oh boy!! [HTML FOR NEWS REPORT HERE]
22/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Repräsentationen I
Informationsressourcen können unterschiedliche Repräsentationen haben.
I
Eine Repräsentation ist ein Stream von Bytes in einem bestimmten Format wie z.B. HTML, RDF/XML oder JPEG.
I
Beispiel: Eine Rechnung ist eine Informationsressource, die in HTML, als druckbares PDF oder als RDF Dokument repräsentiert werden kann.
I
Eine einzelne Ressource kann viele verschiedene Repräsentationen haben z.B. in verschiedenen Formaten, Auflösungen oder Sprachen
23/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
HTTP Content Negotiation I
Content Negotiation (CN, conneg) ist der Prozess der Selektion der besten Repräsentation für eine Anfrage wenn mehrere Repräsentationen verfügbar sind
I
Drei Arten: server-driven, agent-driven, transparent
$ curl -H "Accept: application/rdf+xml" http://dbpedia.org/resource/Galway HTTP/1.1 303 See Other Content-Type: application/rdf+xml Location: http://dbpedia.org/data/Galway.rdf $ curl – Tool um Daten zu einerm Server zu schicken oder von einem Server zu empfangen -H bedeutet nur HTTP/HTTPS
24/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
RDF als Linked Data Andreas Harth Datei veröffentlicht unter http://harth.org/andreas/foaf.rdf URI bezeichnet Andreas: http://harth.org/andreas/foaf.rdf#ah
25/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Semantic Web Application Architecture
25/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Semantic Web Application Architecture
Birte Glimm |
26/42
Semantic Web Grundlagen |
02. Feb 2012
Ox Points
NHS (EnAKTing)
Ren. Energy Generators
Open Election Data Project
EU Institutions
Mortality (EnAKTing)
legislation data.gov.uk UK Postcodes
ESD standards
ISTAT Immigration
Lichfield Spending
Scotland Pupils & Exams
Traffic Scotland
Data Gov.ie
reference data.gov. uk
data.gov.uk intervals
London Gazette
TWC LOGD
Eurostat
Eurostat (FUB)
(RKB Explorer)
Finnish Municipalities
Event Media
New York Times
Geo Species
UMBEL
El Viajero Tourism
RDF Book Mashup
Greek DBpedia
BNB BibBase
DBLP (FU Berlin)
dataopenac-uk
TCM Gene DIT
Daily Med
DBLP (L3S)
Diseasome
SIDER
UniProt
PDB
PROSITE
ProDom
SMC Journals
Ocean Drilling Codices
Janus AMP
Climbing
Linked GeoData
WordNet (W3C)
Alpine Ski Austria
AEMET
Metoffice Weather Forecasts
Weather Stations
Yahoo! Geo Planet
Airports National Radioactivity JP
Sears
DEPLOY
RAE2001
LOCAH Roma Courseware
dotAC
IEEE RISKS
Affymetrix
SISVU
PubMed
ChEMBL Linked Open Colors
SGD
Gene Ontology
AGROV OC
Open Data Thesaurus
Product DB
NVD
IBM
ePrints
VIVO Cornell
STITCH
OMIM
MGI
InterPro Smart Link
Product Types Ontology
Open Corporates
Italian Museums
Amsterdam Museum
UniParc
UniRef
UniSTS
Linked Open Numbers
Reactome
OGOLOD
KEGG Pathway
Medi Care
Google Art wrapper
meducator
KEGG Drug
Pub Chem
GeneID
UniPath way
Chem2 Bio2RDF
Homolo Gene
Scholarometer
IRIT
Newcastle
CiteSeer
HGNC
GESIS
RESEX
LAAS
KISTI
NSF
JISC
WordNet (RKB Explorer)
GEMET
EARTh
Swedish Open Cultural Heritage
STW
Pisa
ACM
VIVO Indiana
UniProt
(Bio2RDF)
LODE
Turismo de Zaragoza
lobid Organisations Budapest
Pfam
LinkedCT
Taxono my
Wiki
ECS Southampton ECS (RKB Explorer)
DBLP (RKB Explorer)
Eurécom
Drug Bank
Enipedia
Cornetto
NSZL Catalog
P20
ECS Southampton EPrints
UN/ LOCODE
ERA
lingvoj
Lexvo
WordNet (VUA)
lobid Resources
OAI
data dcs
Uberblic dbpedia lite
Europeana Deutsche Biographie
Ulm
data bnf.fr
OS
Project Gutenberg
Norwegian MeSH
VIAF
UB Mannheim
Calames
Freebase
YAGO
Open Cyc
riese
Twarql
EUNIS
GeoWord Net
Italian public schools
URI Burner
World Factbook
Rådata nå!
GND
ndlna
totl.net
US Census (rdfabout)
Piedmont Accomodations
IdRef Sudoc
DDC
Open Calais
ntnusc
PSH
SW Dog Food
Portuguese DBpedia
LEM
LIBRIS
LCSH
MARC Codes List
Sudoc
iServe
Geo Names
US SEC
(rdfabout)
Semantic XBRL Scotland Geography
Linked MDB
t4gm info
RAMEAU SH
Thesaurus W theses. fr
my Experiment
flickr wrappr
DBpedia
Linked Sensor Data (Kno.e.sis)
Eurostat
(Ontology Central)
GovTrack Linked EDGAR (Ontology Central)
FTS
Pokedex
NDL subjects Open Library (Talis)
LinkedL CCN
SSW Thesaur us
Didactal ia Goodwin Family
NTU Resource Lists
Open Library
Plymouth Reading Lists
Revyu
Fishes of Texas
Geo Linked Data
CORDIS
CORDIS (FUB)
EURES
Chronicling America
Telegraphis
NASA (Data Incubator)
transport data.gov. uk
gnoss Poképédia
St. Andrews Resource Lists
Manchester Reading Lists
Source Code Ecosystem Linked Data
semantic web.org
BBC Music
Taxon Concept
LOIUS
Jamendo (DBtune)
Ontos News Portal
Sussex Reading Lists
Bricklink
yovisto
Semantic Tweet
Linked Crunchbase
RDF ohloh
Classical (DB Tune)
BBC Wildlife Finder
Rechtspraak. nl
Openly Local
Music Brainz (DBTune)
Klappstuhlclub
Lotico Music Brainz (zitgist)
Last.FM (rdfize)
BBC Program mes
OpenEI
statistics data.gov. uk
GovWILD
Brazilian Politicians
educatio n.data.g ov.uk
Ordnance Survey
(DBTune)
patents data.go v.uk
research data.gov. uk
CO2 Emission (EnAKTing)
Energy (EnAKTing)
EEA
FanHubz
tags2con delicious
Slideshare 2RDF
(DBTune)
Discogs
(Data Incubator)
Linked User Feedback
LOV
Audio Scrobbler
(Data Incubator)
Last.FM artists
Population (EnAKTing)
reegle
business data.gov. uk
Crime (EnAKTing)
Surge Radio
Moseley Folk
Music Brainz
John Peel (DBTune)
EUTC Productions
Antwort
Crime Reports UK
GTAA
Magnatune
DB Tropes Hellenic FBD Hellenic PD
Abfrage
Linked Data Anwendungen: Minimale Architektur
VIVO UF
ECCOTCP bible ontology
KEGG Enzyme
PBAC
KEGG Reaction
KEGG Compound
KEGG Glycan
As of September 2011
27/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Beispiel: Visualisierung der Wahlergebnisse I
Daten von IT.NRW (Landesbetrieb Information und Technik Nordrhein-Westfalen) im CSV Format
I
Schritt 1: Konvertierung nach RDF (mittels Google AppEngine* Wrapper oder Google Refine** mit RDF Extension***)
I
Schritt 2: Linked Data Abfragen
I
Schritt 3: Visualisierung der Ergebnisse
*http://code.google.com/appengine/ **http://code.google.com/p/google-refine/ ***http://lab.linkeddata.deri.ie/2010/ grefine-rdf-extension/ http://gesis-lod.appspot.com/vis/
28/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Beispiel: Visualisierung der Ökonomischen Situation I
Daten von GESIS (Leibniz-Institut für Sozialwissenschaften) im CSV Format
I
Schritt 1: Konvertierung nach RDF und publiziere die Daten online
I
Schritt 2: Linked Data Abfragen
I
Schritt 3: Visualisierung der Ergebnisse
http://gesis-lod.appspot.com/vis/
29/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Beispiel: Visualisierung Eurostat Daten I
Daten von Eurostat (Statistisches Büro der EU) im CSV oder SDMX Format
I
Schritt 1: Konvertierung nach RDF
I
Schritt 2: Linked Data Abfragen
I
Schritt 3: Visualisierung der Ergebnisse
http://estatwrap.ontologycentral.com/page/tsieb010
30/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Linked Data Services I
Einige Services erlauben nur eingeschränkten Zugriff auf Ihre Daten (z.B. APIs von sozialen Netzwerken)
I
Manchmal wird mehr als ein Parameter benötigt (z.B. um den kürzesten Abstand zwischen zwei Punkten zu berechnen)
I
Idealerweise sollte Linked Data derartige Service integrieren
31/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Szenario I
Typisches Datenintegrationsszenario
Gemeinsames
Daten
Interaktive
Datenformat
Integration
Datenexploration
I
Anfrage: Welche Jobangebote gibt es von Konkurrenten von Facebook?
I
Anfrage: Nach welchem Muster vergibt Vulcan Capital Mittel?
32/42
Birte Glimm |
Semantic Web Grundlagen |
Datenqueallen
02. Feb 2012
33/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Schritt 1: Vorbereitung der Daten - Gemeinsames Datenformat
34/42
Birte Glimm |
Semantic Web Grundlagen |
Schritt 2: Datenintegration
02. Feb 2012
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Schritt 3: Interaktive Datenexploration
1. Abfrage
2. Ergebnisse
35/42
3. Visualisierung
36/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Verlinkung von Daten mit Daten von Servicen? :facebook foaf:name "Facebook" . :facebook cb:has_office :facebook-hp . :facebook-hq geo:lat "37.416" . :facebook-hq geo:long "122.152" . :facebook-hq vc:locality "Palo Alto, CA" .
Gegeben der Firmenname und Ort, finde die Jobangebote
Gegeben die Koordinaten, finde nahegelegene Orte (via GeoNames)
37/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Daten Service? I I I
Gegeben eine Eingabe, erzeuge die Ausgabe Eingabe und Ausgabe hängen in einer Service-spezifischen Art zusammen Weltzustand bleibt unverändert
Eingabe
Relation
Ausgabe
definiert
Service I
Beispiel: GeoNames findNearbyWikipedia Service I I I
Eingabe: Latitude/Longitude Koordinaten Ausgabe: Orte Beziehung: Ausgabe Orte sind in der Nähe der Eingabekoordinaten
38/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
LIDS: Linked Data Services I
Wünschenswert wäre eine Integration von Daten Servicen mit Linked Data 1. LIDS müssen sich an die Linked Data Prinzipien halten
I
Wünschenswert wäre die Nutzung von Daten Servicen in Software Programmen 1. LIDS brauchen maschinenlesbare Beschreibungen von Eingabe und Ausgabe
39/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Data Services als Linked Data I
Eingabe ist gegeben als URI Eingabe
Service Endpoint
Parameter
Identifier
z }| {z }| { z }| { http://geowrap.openlids.org/findNearbyWikipedia?lat=37.416&lng=-122.152 #point I
Auflösung der URI ergibt RDF:
@prefix dbp: . Eingabe
}| { z @prefix : . Relation
z }| { :point foaf:based_near dbp:Palo_Alto%2C_California , dbp:Packard%27s_garage . | {z } Ausgabe
40/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
LIDS Beschreibungen mittels SPARQL I
I
Gegeben eine bestimmte Eingabe, kann die entsprechende Ausgabe von einer impliziten Datenquelle abgefragt werden Entspricht einer SPARQL CONSTRUCT Abfrage
CONSTRUCT { [output] } FROM [endpoint] WHERE { [input] } I I I
Eingabe beschreibt die benötigten Daten als Abfragemuster Der Endpunkt ist die base URI um eine Service Eingabe zu konstruieren Ausgabe beschreibt die Daten, die der Service geliefert hat
CONSTRUCT { ?point foaf:based_near ?feature. } FROM WHERE { ?point a Point ; geo:lat ?lat ; geo:long ?lng }
41/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
LIDS Zusammenfassung I
I
Dynamische Quellen (GeoNames Wrapper, Twitter Wrapper, Feeds Wrapper) können in Linked Data integriert werden LIDS nützlich für I I
I
I
I
Einfügen von LIDS in statische RDF Datensätze Linked Data Endpunkte, die dynamisch Links von ihren Daten zu LIDS hinzufügen Linked Data Browser, die abgefragte Daten um abgefragte Daten von LIDS erweitern Integration von LIDS in die SPARQL Abfrageverarbeitung
LIDS erlauben das Publizieren und Wiederbenutzen von Datenservices im Web
42/42
Birte Glimm |
Semantic Web Grundlagen |
02. Feb 2012
Zusammenfassung I
Die Menge an verfügbaren Daten wächst ständig
I
Semantik wird gebraucht, um Daten aus verschiedenen Quellen zu integrieren
I
Abfrage und Visualisierung von Daten in Kombination möglich
I
Die Verarbeitung und Abfrage von Daten aus verschiedenen Quellen erhöht die Transparenz und erleichtert die Forschung (Testen von Hypothesen wird einfacher)