Algorithmen und Datenstrukturen II

Algorithmen und Datenstrukturen II Heiko Neuweger (Alexander Goesmann) Bioinformatics Resource Facility Center for Biotechnology Universität Bielefeld...
0 downloads 1 Views 318KB Size
Algorithmen und Datenstrukturen II Heiko Neuweger (Alexander Goesmann) Bioinformatics Resource Facility Center for Biotechnology Universität Bielefeld Vorlesung Sommer 2010

Überblick   Was ist XML und wofür kann man es gebrauchen?

  Bestandteile von XML

  Verarbeitung von XML Dokumenten in Java

XML - Extensible Markup Language Teil I

Was ist XML?   Daten sind strukturiert (Texte, Bilder, Messergebnisse, ...)   maschinelle Verarbeitung erfordert Kenntnis der Strukturen   gesucht: Formalismus, um beliebige Strukturen zu beschreiben   XML kann textuelle Daten strukturieren   standardisierte Methoden zur Verarbeitung von XML

Basierend auf XML-Praxis von Joern Clausen

Ursprünge: SGML   Standard Generalized Markup Language (ISO 8879:1986)   keine Markup-Sprache, sondern Grammatik-Sprache   maßgeschneidertes Vokabular für unterschiedliche Anwendungen   kommerzielle Produkte, vor allem im Verlagswesen   Problem: komplexe Spezifikation, Parser schwer zu implementieren   Instanz + DTD + SGML Declaration   1989: Hypertext Markup Language (HTML), World Wide Web   Anfang/Mitte 1990er Jahre: Browser Wars

Ausweg: XML   Entwicklung ab 1996 durch WWW Consortium   einfache Spezifikation, Parser leicht zu implementieren   erweiterbar: Spracherweiterungen möglich/erwünscht   Sprachumfang kann wachsen und Bedürfnissen angepasst werden

Analogien zu HTML, SGML & XHTML

XML - Nutzung   XML zur Datenrepräsentation   ”Darstellung” sekundäres Problem   XML muss weiterverarbeitet werden

XML verarbeiten   wenige Werkzeuge nötig (XML-Parser, XML-Editor, . . . )   wiederverwendbare Komponenten   Textformat Unicode: portabel, einfach zu verarbeiten   offene Standards, viele Open Source-Lösungen

Ein XML Beispiel XML & Friends for Dummies Joe User What is XML? XML is not a markup language (unlike HTML) XML instances can be well formed or even validating XML stands for &xml; ...

Example by Joern Clausen

Ein XML Beispiel XML & Friends for Dummies Joe User What is XML? XML is not a markup language (unlike HTML) XML instances can be well formed or even validating XML stands for &xml; ...

Example by Joern Clausen

Ein XML Beispiel XML & Friends for Dummies Joe User What is XML? XML is not a markup language (unlike HTML) XML instances can be well formed or even validating XML stands for &xml; ...

Example by Joern Clausen

Ein XML Beispiel XML & Friends for Dummies Joe User What is XML? XML is not a markup language (unlike HTML) XML instances can be well formed or even validating XML stands for &xml; ...

Example by Joern Clausen

Aufbau von XML   XML-Datei beginnt mit XML declaration   seit 4.2.2004: XML 1.1

  Empfehlung: bis auf weiteres XML 1.0 verwenden   Verwendete Kodierung

  sonst Unicode (UTF-8), Obermenge von ASCII   Kodierung im Dokument nicht unproblematisch

Elemente (elements)   öffnendes und schließendes TAG XML is not a ...

  Elemente können geschachtelt werden XML is not a ... ... well formed ...

  keine Minimierungsregeln leeres Element statt

Attribute (attributes)   Zusatzinformationen zu Elementen   nur im öffnenden TAG   Anführungszeichen " (double quote) oder ’ (single quote)   Attribut darf nur einmal vorkommen