Information Retrieval and Semantic Technologies

Information Retrieval and Semantic Technologies Gerhard Wohlgenannt 6. April 2013 Inhaltsverzeichnis 1 Informationen zur Lehrveranstaltung 1.1 Inhal...
2 downloads 0 Views 105KB Size
Information Retrieval and Semantic Technologies Gerhard Wohlgenannt 6. April 2013

Inhaltsverzeichnis 1

Informationen zur Lehrveranstaltung 1.1 Inhalt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2 2

2

Unterlagen 2.1 Haus¨ubungsbeispiele Semantic Technologies . . . . . . . . . . . . . . ¨ 2.2 Ubungsbeispiele Semantic Technologies . . . . . . . . . . . . . . . . . 2.3 Weiterf¨uhrende Literatur . . . . . . . . . . . . . . . . . . . . . . . . .

3 5 5 6

3

Wichtige Termine

7

4

Druckversion

7

1

1

Informationen zur Lehrveranstaltung • Vortragender: Dr. Gerhard Wohlgenannt • Termin und Ort: Fr 09:00-13:30. 2H363 (UZA2) • Sprechstunde: Tuesday 8:00-9:00am

1.1

Inhalt

• Teil: Information Retrieval – Einf¨uhrung Wozu IR? Aufgaben, Definitionen, Teilbereiche, Evaluierung – Suche und Indizierung Was sind invertierte Indizes, wie funktionieren diese? – Suchmaschinen Beispiele anhand Suchmaschinen im Internet – Natural Language Processing Grundlegende Methoden: Segmentation, POS-Tagging, NER, stemming, chunking, parsing – Klassisches IR Grundkonzepte des klassischen IR: Schlagw¨orter, Klassifikationssysteme, Thesauri – Clustering Was ist clustering. Wozu? Wie? (anhand KMeans) – Classification Was ist classification? Wozu? Wie? Einf¨uhrung in Machine Learning Methoden. – IR Usecase Demonstration vieler der besprochenen Technologien anhand http://www. ecoresearch.net/climate/ • Teil: Semantic Technologies – Einf¨uhrung, XML Warum werden Semantische Technologien ben¨otigt? Welche Probleme sollen diese l¨osen?

2

– Resource Description Framework (RDF) Wie stellt man Informationen in einem f¨ur Computer automatisch verarbeitbaren Format dar? – Information Retrieval Usecase Wie gehen klassische IR-Methoden vor? Was ist die Ausgangsposition f¨ur Semantische Technologien? – Ontologien - Theorie Was versteht man unter Ontologien? Wof¨ur werden diese ben¨otigt? – Ontologien - Sprachen (RDFS, OWL) Wie kann man selbst Ontologien spezifizieren? Welche Sprachen werden daf¨ur verwendet?

2

Unterlagen

Teil Information Retrieval • IR Basics, boolean retrival, invertierte Indizies1 – – – – (1 slide per page)2 • Ranked retrival, Vector Space Model, . . . 3 – – – – (1 slide per page)4 • Regular Expressions5 – – – – (1 slide per page)6 • Tolerant Retrieval and Index Creation7 – – – – (1 slide per page)8 • Classic IR (selected topics)9 – – – – (1 slide per page)10 • Advanced NLP11 – – – – (1 slide per page)12 • Machine Learning: Clustering and Classification13 – – – – (1 slide per page)14 1

pdf/4_ir_intro_basics.pdf pdf/ir_intro_basics.pdf 3 pdf/4_ir_ranked_retrieval.pdf 4 pdf/ir_ranked_retrieval.pdf 5 pdf/4_ir_regexp.pdf 6 pdf/ir_regexp.pdf 7 pdf/4_ir_index_creation.pdf 8 pdf/ir_index_creation.pdf 9 pdf/4_ir_classic.pdf 10 pdf/ir_classic.pdf 11 pdf/4_ir_advanced_nlp_merged.pdf 12 pdf/ir_advanced_nlp_merged.pdf 13 pdf/4_ir_cluster_classif.pdf 14 pdf/ir_cluster_classif.pdf 2

3

• IR Research Use Case (kein Teststoff)15 • IR Projects Use case – – – – Infos16 • IR Projects Use case – – – – Methods17 Teil Semantic Technologies • XML18 – – – – (1 slide per page)19 • Resource Description Framework (RDF)20 – – – – (1 slide per page)21 • Information Retrieval - Usecase22 – – – – (1 slide per page)23 • Ontologien - Theorie24 – – – – (1 slide per page)25 • Ontologien - Sprachen (RDFS, OWL)26 – – – – (1 slide per page)27 • Slides about Reasoning (external)28 • Linked (Open) Data29 – – – – (1 slide per page)30 • Querying the Semantic Web (SPARQL)31 – – – – (1 slide per page)32 • Topics33 15

pdf/ir_research_use_case.pdf pdf/ir_projects_usecase_infos_merged.pdf 17 pdf/ir_projects_usecase_methods_merged.pdf 18 pdf/4_xml.pdf 19 pdf/xml.pdf 20 pdf/4_rdf.pdf 21 pdf/rdf.pdf 22 pdf/4_ir_usecase.pdf 23 pdf/ir_usecase.pdf 24 pdf/4_owl_theory.pdf 25 pdf/owl_theory.pdf 26 pdf/4_owl_language.pdf 27 pdf/owl_language.pdf 28 http://de.slideshare.net/fulvio.corno/logic-and-reasoning-in-the-semantic-web 29 pdf/4_linked_data.pdf 30 pdf/linked_data.pdf 31 pdf/4_sparql.pdf 32 pdf/sparql.pdf 33 pdf/topics.pdf 16

4

2.1

¨ Hausubungsbeispiele Semantic Technologies

Die Haus¨ubungsbeispiele sind f¨ur die entsprechende Unterrichtseinheit vorzubereiten und werden gemeinsam in der LV besprochen: • unstrukturierte Daten und XML34 • Resource Description Framework35 (Haus¨ubung: Beispiel 1,2 und 4; nicht jedoch Beispiel 3) • Regular Expressions36

2.2

¨ Ubungsbeispiele Semantic Technologies

• unstrukturierte Daten und XML – Stellen Sie folgenden37 Datensatz als XML-File dar. Vergeben Sie selbst sinnvolle Namen f¨ur die Elemente. – Erstellen Sie den XML-Baum f¨ur obiges Beispiel. • Resource Description Framework – Zur Modellierung von Aussagen in .rdf gibt es folgendes Beispiel38 – Erweitern sie den Teilgraphen f¨ur das Buch Java f¨ur Studenten“ um die In” formation, dass es sich bei den Autoren um Personen handelt. Verwenden Sie hierf¨ur die Eigenschaft foaf:fullname (foaf:fullname kann nur Personen zugeordnet werden). Stellen Sie das Ergebnis als (Teil-)graph, in Form von Tripeln und in RDF/XML dar • Ontologien – Beispiel: The Robber and the Speeder39 (von xfront.com) – Gegeben ist folgende Ontologie: Beer Ontology40 (RDF/XML) ∗ Zeichnen Sie die Klassenhierarchie f¨ur diese Ontologie auf ∗ Theorie: 34

pdf/hausuebungsbeispiele/unit1.pdf pdf/hausuebungsbeispiele/unit3.pdf 36 pdf/hausuebungsbeispiele/unit2.pdf 37 pdf/examples/xml/example_xml.pdf 38 pdf/examples/rdf/example_rdf.pdf 39 pdf/examples/example4_robber_and_speeder_extended.pdf 40 http://www.schemaweb.info/webservices/rest/GetRDFByID.aspx?id=99 35

5

· Welche Werte kann die Eigenschaft brewedBy annehmen? · Welche Eigenschaft muss ein Individuum aufweisen, um an dieser Beziehung teilnehmen zu k¨onnen? · K¨onnen Individuen der Klasse ’Ale’ an der brewedBy Beziehung teilnehmen. - Wenn ja, warum?

2.3

¨ Weiterfuhrende Literatur

• Introduction to Information Retrieval41 Buch Christopher D. Manning, Prabhakar Raghavan and Hinrich Sch¨utze, Introduction to Information Retrieval, Cambridge University Press. 2008 (online verf¨ugbar) • Classic IR – Folien von Prof Panny42 Folien aus den vergangenen Semestern von Prof. Panny (Bereich: Klassisches IR) • Machine Learning course (Standford Univ)43 Online lectures on machine learning by Andrew Ng (Standford) – for the very interested that have no life :-) • World Wide Web Consortium44 - die wichtigsten Spezifikationen rund um das semantische Web • W3 Schools45 - Simple and good tutorials zu XML, RDF, . . . • The Semantic Web46 - Ein sehr guter einf¨uhrender Artikel von Tim Berners-Lee, James Hendler und Ora Lassila in Scientific America • Tutorial on Semantic Web Technologies47 • Building, Sharing, and Merging Ontologies48 - ein sehr guter Artikel von John F. Sowa • SPARQL W3C49 Offizielle Doku vom W3C. • Linked Data Book50 Ausf¨uhrliche Informationen zum Thema Linked Data – further reading. 41

http://nlp.stanford.edu/IR-book/ http://wwwai.wu.ac.at/˜panny/ir/ 43 http://www.academicearth.org/courses/machine-learning 44 http://www.w3.org/ 45 http://www.w3schools.com/ 46 http://www.sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21 47 http://www.w3.org/2005/Talks/1214-Trento-IH/ 48 http://www.jfsowa.com/ontology/ontoshar.htm 49 http://www.w3.org/TR/rdf-sparql-query/ 50 http://linkeddatabook.com/ 42

6

3

Wichtige Termine • Erste Einheit: 05. Apr 2013 • Test: 19. Apr 2013

4

Druckversion

Die Druckversion dieser Seite finden Sie auf (pdf/ir.pdf).

7

Suggest Documents