Algorithmen und Datenstrukturen II Heiko Neuweger (Alexander Goesmann) Bioinformatics Resource Facility Center for Biotechnology Universität Bielefeld...
Algorithmen und Datenstrukturen II Heiko Neuweger (Alexander Goesmann) Bioinformatics Resource Facility Center for Biotechnology Universität Bielefeld Vorlesung Sommer 2010
Überblick Was ist XML und wofür kann man es gebrauchen?
Bestandteile von XML
Verarbeitung von XML Dokumenten in Java
XML - Extensible Markup Language Teil I
Was ist XML? Daten sind strukturiert (Texte, Bilder, Messergebnisse, ...) maschinelle Verarbeitung erfordert Kenntnis der Strukturen gesucht: Formalismus, um beliebige Strukturen zu beschreiben XML kann textuelle Daten strukturieren standardisierte Methoden zur Verarbeitung von XML
Basierend auf XML-Praxis von Joern Clausen
Ursprünge: SGML Standard Generalized Markup Language (ISO 8879:1986) keine Markup-Sprache, sondern Grammatik-Sprache maßgeschneidertes Vokabular für unterschiedliche Anwendungen kommerzielle Produkte, vor allem im Verlagswesen Problem: komplexe Spezifikation, Parser schwer zu implementieren Instanz + DTD + SGML Declaration 1989: Hypertext Markup Language (HTML), World Wide Web Anfang/Mitte 1990er Jahre: Browser Wars
Ausweg: XML Entwicklung ab 1996 durch WWW Consortium einfache Spezifikation, Parser leicht zu implementieren erweiterbar: Spracherweiterungen möglich/erwünscht Sprachumfang kann wachsen und Bedürfnissen angepasst werden
Analogien zu HTML, SGML & XHTML
XML - Nutzung XML zur Datenrepräsentation ”Darstellung” sekundäres Problem XML muss weiterverarbeitet werden
XML verarbeiten wenige Werkzeuge nötig (XML-Parser, XML-Editor, . . . ) wiederverwendbare Komponenten Textformat Unicode: portabel, einfach zu verarbeiten offene Standards, viele Open Source-Lösungen
Ein XML Beispiel XML & Friends for Dummies Joe User What is XML? XML is not a markup language (unlike HTML) XML instances can be well formed or even validating XML stands for &xml; ...
Example by Joern Clausen
Ein XML Beispiel XML & Friends for Dummies Joe User What is XML? XML is not a markup language (unlike HTML) XML instances can be well formed or even validating XML stands for &xml; ...
Example by Joern Clausen
Ein XML Beispiel XML & Friends for Dummies Joe User What is XML? XML is not a markup language (unlike HTML) XML instances can be well formed or even validating XML stands for &xml; ...
Example by Joern Clausen
Ein XML Beispiel XML & Friends for Dummies Joe User What is XML? XML is not a markup language (unlike HTML) XML instances can be well formed or even validating XML stands for &xml; ...
Example by Joern Clausen
Aufbau von XML XML-Datei beginnt mit XML declaration seit 4.2.2004: XML 1.1
Empfehlung: bis auf weiteres XML 1.0 verwenden Verwendete Kodierung
sonst Unicode (UTF-8), Obermenge von ASCII Kodierung im Dokument nicht unproblematisch
Elemente (elements) öffnendes und schließendes TAG XML is not a ...
Elemente können geschachtelt werden XML is not a ... ... well formed ...
keine Minimierungsregeln leeres Element statt
Attribute (attributes) Zusatzinformationen zu Elementen nur im öffnenden TAG Anführungszeichen " (double quote) oder ’ (single quote) Attribut darf nur einmal vorkommen