Der Begriff des e-Business als Abkürzung des englischsprachigen electronic Business hat sich inzwischen als Subsumption aller für ein Unternehmen wertschöpfenden Aktivitäten im Internet eingebürgert.
Die Sinngebung greift damit weiter als der historisch ältere Begriff e-Commerce, welcher ursprünglich ausschließlich Verkaufsaktivitäten bezeichnete. Inzwischen werden beide Terme jedoch nahezu synonym verwendet. Teilweise findet sich für den Teilbereich des internetgestützten Verkaufs von Waren und Dienstleistungen an Endkunden auch die Bezeichnung e-tailing (für electronic retailing) welcher jedoch nur einen Teilaspekt des e-Commercebegriffes abzudecken vermag.

	Definition 1: e-Business
	Electronic Business ist die Gesamtheit aller unternehmerischen Aktivitäten im Internet.

Gemäß dieser allgemeinen Definition werden sämtliche auf das Unternehmensziel gerichtete nach außen wirkende Aktivitäten als e-Business eingeordnet.
Gleichzeitig ergibt sich aus der Abstützung auf der Realisierungstechnik des Internets auch eine interne Sichtweise, sobald diese Technik innerhalb des Unternehmens zum Einsatz kommt.
Die Darstellung der Abbildung 1 unternimmt den Versuch der Einordnung der sich ergebenen Anwendungsdimensionen des e-Businessbegriffs.

Abbildung 1: Dimensionen des e-Business

(click on image to enlarge!)

Die naheliegendste Form des e-Business ist der Geschäftsverkehr mit dem (End-)Kunden, als dem typischen Konsumenten der durch ein Unternehmen zur Verfügung gestellten Güter und Dienstleistungen. Dieser Teilbereich wird mit dem Begriff Business-to-Customer (B2C) belegt.
In diese e-Businessvariante fallen alle Interaktionen zwischen Kunde und Unternehmen während des gesamten Lebenszyklus des angebotenen Produkts, angefangen von verkaufsfördernden Maßnahmen (Marketing) über den Verkaufs- bzw. Dienstleistungserbringungsakt selbst bis hin zur Abwicklung der Wartung, soweit nach Art des angebotenen Gutes elektronisch überhaupt möglich.

Entgegengesetzt zum durch ein Unternehmen produzierten ausgehenden Güter- und Dienstleistungsstrom verläuft die Beschaffung von nicht-menschlichen Produktionsfaktoren wie Roh-, Hilfs- und Betriebsstoffen sowie die Interunternehmenskommunikation. Dieser Teilbereich wird mit dem Begriff Business-to-Business (B2B) belegt.
In diese e-Businessvariante fallen die zwischen Unternehmungen ablaufenden elektronischen Kommunikationen. Die Spannbreite reicht hierbei von der kostenfrei nutzbaren statischen Präsentation des Güter- und Dienstleistungsangebots im Stile eines Katalogs über spezialisierte Marktplätze mit Angebots- und Nachfragefunktionalitäten bis hin zu Informationsdienstleistungen welche Zugriff auf die datenhaltenden Systeme des Geschäftspartners gewähren.

Die umfassende Betrachtung der zuvor ausgeklammerten Kommunikation mit potentiellen und bestehenden Mitarbeitern konstituiert die dritte Klasse der e-Businessanwendungen, welche auf die unternehmensinterne Kommunikation mit den Mitarbeitern fokussieren. Dieser Teilbereich wird mit dem Begriff Business-to-Employee (B2E) belegt.
Dieser Sparte werden alle elektronischen Informationsangebote an den Mitarbeiter, wie Auskunft über den aktuellen Gleitzeitstand, Adressstamm- sowie Gehaltsdaten, zugeordnet.

1.2 Relevante Techniken und ihre Einordnung

Orthogonal zu den drei Anwendungsdimensionen verdient die ebenfalls in Abbildung 1 dargestellte Realisierungstechnik Betrachtung.
Hierunter fallen gemäß Definition 1 alle sog. Internettechniken.

Dieser, in der Praxis nicht klar definiert und trennscharf gebrauchte Begriff umfaßt sowohl die Internetbasistechniken zur Datendarstellung und -übertragung als auch verschiedene Techniken zur Realisierung von Anwendungen, die über das Internet angesprochen und benutzt werden können.

Im wesentlichen zielen die eingesetzten Techniken auf die Lösung spezifischer Problemstellungen. Tabelle 1 stellt die im Rahmen der Vorlesung behandelten Techniken nebst den durch sie betrachteten Problemgebieten und einer Kurzcharakteristik zusammen.

Tabelle 1: Techniken: Einordnung und Kurzcharakterisierung

Problemdomäne	Technik	Charakteristik
Datendarstellung und -zugriff	XML	Generische Auszeichnungssprache zur Darstellung beliebiger Daten.
	XML-Namensräume	Syntaxmechanismus zur Unterscheidung von XML-Vokabularen.
	XML-Schema	Grammatiksprache zur Formulierung von XML-Vokabularen.
	XPath	Lokatorsprache zur Identikation von Knotenmengen in XML-Dokumenten.
Datenbankzugriff	JDBC	Durch SUN erarbeiteter Ansatz für den Zugriff auf tabellenartige Datenquellen. Zumeist für den Zugriff auf relationale Datenbanken benutzt.
	JDO	Mechanismus zur transparenten Persistierung von Java-Objekten in verschiedenen Datenspeichern.
	EJB	Durch SUN erarbeitete Komponententechnik. Hauptfocus in dieser Veranstaltung: Realisierung von Peristenz durch Entity Beans.
Funktionsintegration	JMS	Durch SUN für Java entwickelte Schnittstelle zur Verarbeitung asynchroner Nachrichten.
	RMI	Durch SUN für Java adaptierte Variante entfernter Funktionsaufrufe.
	REST	Interpretations- und Nutzungsvariante des HTTP-Protokolls zur Realisierung einfacher Web-Dienste.
Web Services	Ansatz zur Bereitstellung von Funktionalität über das Web mittels Nachrichtenaustausch und entfernter Funktionsaufrufe.
Präsentationsaspekte	XHTML und XForms	Bekannteste Hypertextsprache und Ansatz zur Realisierung einfacher Web-basierter Eingabeoberflächen.
	JSP	Durch SUN erarbeiteter Ansatz zur dynamischen serverseitigen Erzeugung von Webseiten.
	JSF	Durch SUN erarbeiteter Ansatz zur vereinfachten Erstellung von GUI-basierten Web-Dialoganwendungen.
	XSLT	W3C-Standard zur Transformation von XML-Inhalten.
Sicherheitsaspekte	Schlüsselaustausch	Erzeugung und Verteilung geheimer und öffentlicher Daten, die den Zugriff auf gesicherte Daten gestatten.
	Leitungssicherheit	Bereitstellung transparenter Verbindungssicherung im Internet.
	Digitale Signatur	Sicherung von Datenkonsistenz, Glaubwürdigkeits des Ursprungs, Verbindlichkeit und Berechtigung.
	Verschlüsselung	Sicherung von Vertraulichkeit.

1.3 Architektur moderner e-Business Applikationen

Abbildung 2 ordnet die zuvor eingeführten Techniken in ein Architekturmodell für e-Business Applikationen ein.

Abbildung 2: Architektur moderner e-Business Applikationen

(click on image to enlarge!)

Das Architekturmodell zeigt die im Rahmen der Vorlesung behandelten Techniken als Bestandteil einer hypothetischen Architektur. Sie zeigt die bevorzugten Einsatzbereiche der Einzeltechniken und gibt damit bereits einen Ausblick auf die gegenwärtig in der Praxis etablierte Pragmatik.
Besonders deutlich wird dies anhand der dargestellten Positionierung des Remote-Method-Invocation-Mechanismus. Zwar kann dieser grundsätzlich auch zur systemübergreifenden Kommunikation herangezogen werden. Jedoch wird RMI aktuell vorwiegend für die Realisierung systeminterner Kommunikationsbeziehungen, beispielsweise innerhalb J2EE-basierter Applikationsserver, herangezogen. Dies liegt in zwei Grundfaktoren begründet. Zum einen ist nur ein Teil der verfügbaren e-Business-Systeme unter Nutzung der Programmiersprache Java realisiert, worauf die RMI-Anwendbarkeit faktisch beschränkt ist. Zum anderen ist der RMI inhärent zugrundeliegende Zugriff auf binäre Applikationsschnittstellen unter Sicherheitsrestriktionen als problematisch anzusehen.

2 Datendarstellung und -zugriff

2.1 Extensible Markup Language -- Strukturelle Grundkonzepte

Im Grunde besitzt die Geschichte der eXtensible Markup Language zwei Anfänge. Einerseits stellt XML die evolutionäre Fortentwicklung existierender generischer Auszeichungssprachen dar; andererseits sind die Hintergründe der Sprache XML so eng mit dem Aufkommen des World Wide Webs (WWW) verwoben, daß die Geschichte auch hier ihren Anfang nehmen könnte...

Der chronologischen Ordnung folgend sei zunächst die Entwicklung aus der Idee des Hypertext aufgerissen.
Die ersten Ideen zum Konzept des Hypertexts, als Plan zur Überwindung der Beschränkungen und Unzulänglichkeiten des klassischen textbasierten Publikationsmediums Papier, datieren zurück bis in die 1950er Jahre. Sie postulieren neben der nichtsequentiellen Organisation des Mediums auch zentrale Begriffe wie Knoten, Link, Anker und Netz. Ziel dieser Überlegungen war es, den auszudrückenden Inhalt von editorieller- und Präsentationsinformation wie Seitenzahlen, Fußnoten, Paginierung usw. zu trennen. Durch die nichtlineare Organisation soll es dem Leser freigestellt werden, auf welchen Pfaden er sich durch das Dokument bewegt.

Zur Realisierung dieser Bemühungen wird das Dokument mit weiteren Informationen angereichert, die jedoch für den Leser unsichtbar bleiben. Dieser Gedanke reicht zurück bis in die Anfänge des Buchdrucks. Dort sind formatierungsorientierte Auszeichnungssymbole, etwa für Fettdruck oder Unterstreichung, seit jeher bekannt. Vor dem Aufkommen der what you see is what you get Textverarbeitungssysteme waren diese bildlichen Symbole die einzige Möglichkeit zur Kommunikation präsentationsorientierter Information an den Schriftsetzer und Drucker.
Jedem Schüler ist bereits ein weiteres Beispiel einer editoriellen Auszeichnungssprache bekannt: Die graphischen Korrekturzeichen der Deutschlehrer. Auch sie liefern Informationen über den Inhalt, die nicht Bestandteil des Dokuments sind.

Voraussetzung für die angestrebte Flexibilisierung der Struktur eines Textes ist eine -- wie auch immer geartete -- technische Unterstützung. Seit den 60er Jahren wurden hierfür die aufkommenden elektronischen Rechenanlagen herangezogen. Eine der ersten Aktivitäten hierzu ist das von Ted Nelson initiierte (inzwischen legendäre) Xanadu-Projekt.

Zunächst erforderte die maschinelle Verarbeitung die Überarbeitung des Auszeichnungssymbolvorrates. Dies wurde notwendig, da eingesetzte Technik keine Unterstützung der alt-hergebrachten graphischen Auszeichungssymbole bot.
In einem ersten Entwicklungsschritt wurden daher die vormalig bildhaften Zeichen durch textuelle Pendants ersetzt und verallgemeinert. Beispielsweise: Überschrift zur inhaltlichen Kennzeichnung einer entsprechenden Textzeile.
Mit diesem Schritt erfolgte auch der Übergang zur formatierungsunabhängigen Auszeichnung, die bewußt auf die Beschreibung des späteren visuellen Aussehens der Information zugunsten einer neutralen deskriptiven Beschreibung der Semantik verzichtete.

In den 60er und 70er Jahren werden verschiedene Weiterentwicklungen der generischen Auszeichnungssprachen betrieben; u.a. bei der IBM durch das Team um Goldfarb, Mosher und Loire. Sie stellen 1969 unter dem Namen Generalized Markup Language einen Sprachvorschlag zusammen, der in der Folgezeit durch IBM kommerziell vermarktet wird.

Aus den GML-Aktivitäten bei IBM entwickelt sich die internationale Standardisierungsbewegung der Standard GML (SGML).
Durch sie wird eine Sprache festgelegt, welche die Definition eigener Sprachen erlaubt; daher auch der Begriff Metasprache. SGML bietet somit keinen feststehenden problemspezifischen Sprachumfang an, sondern eine Menge verschiedenster struktureller Konstrukte zur Formulierung von Dokumentgrammatiken.
In der Praxis wird der Einsatz einer mit Hilfe von SGML definierten Sprache oftmals plakativ zum Einsatz von SGML verkürzt, obwohl diese Begrifflichkeit lediglich den Erstellungsprozeß der Grammatik bezeichnet.

Mittels SGML definiert Tim Berners-Lee Mitte der 80er Jahre eine eigene Sprache zur vereinfachten Formulierung von Dokumenten, die er HyperText Markup Language (HTML) nennt. Hauptbeweggrund seiner Aktivitäten ist der Versuch den Dokumentenaustausch am Europäischen Kernforschungszentrum CERN rechnergestützt zu vereinfachen.
Die Eingangs erwähnten zentralen Hypertextkonzepte finden sich bereits in seinem ersten Sprachvorschlag wieder. Zur technischen Realisierung der Verknüpfung zwischen den Dokumenten mittels Ankern und Links definiert er den Uniform Resource Locator (URL), eine global eindeutige Adresse für beliebige Inhalte.

Seine Aktivitäten in Genf bilden die Keimzelle des Web.

In der Folgezeit, insbesondere im Zuge der Kommerzialisierung des Word Wide Web, entstehen verschiedene Revisionen der ursprünglichen HTML. Einige der Erweiterungen werden durch die beiden großen Web Browser Hersteller Microsoft und Netscape proprietär vorgenommen, um ihre Position am Markt zu stärken.
In der Konsequenz entstehen während des oft apostrophierten browser war teilweise inkompatible HTML-Dialekte. (Man denke nur an die Tags: marquee (nur Microsoft Internet Explorer) oder layer (nur Netscape Navigator))
Darüberhinaus entwickelt sich HTML zunehmend von einer Präsentations-orientierten Auszeichnungssprache zu einer semantischen. Dies bedeutet: während HTML in der ersten Grundform zunächst überwiegend Elemente bot, durch die die Präsentation der Inhalte am Bildschirm festgelegt wurde (Beispiele: b für Fettdruck, u für Unterstreichungen oder i für Kursivschreibung), wurden später zunehmend semantische Elemente eingeführt. Durch sie wird die Bedeutung der ausgezeichneten Information ausgedrückt (Beispiele hierfür: acronym zur Kennzeichnung von Abkürzungen, address für Adressen oder strong zur besonderen Betonung einer Textpassage).

So wünschenswert die sukzessive Umgestaltung der HTML an die veränderten Bedürfnisse war, so aussichtslos waren die Bemühungen dennoch. Während bei den Präsentations-orientierten Elementen zunehmend Vollständigkeit hinsichtlich der Anwenderwünsche erzielt werden konnte, offenbaren sich die bisher erfolgten semantischen Erweiterungen als permanent inadäquat.
Letztlich war der Versuch, durch Standardisierung, semantische Erweiterungen in HTML einzubringen in doppelter Hinsicht zum Scheitern verurteilt:
1. birgt der Ansatz die Gefahr, die Elementmenge in unbekannte Größen zu erweitern
2. muß die Semantik jedes Tags definiert, abgestimmt und verabschiedet werden.

Aus diesen Gründen wurde seitens des W3C nach einer tragfähigeren Lösung gesucht. Unter Rückgriff auf die HTML-Wurzeln (als Anwendung der Metasprache SGML) wurde das Projekt SGML for the Web initiiert.
Der letztendlich verabschiedete Vorschlag zur eXtensible Markup Language (XML) bildet konzeptionell eine Untermenge der Sprachmöglichkeiten von SGML. Konsequenterweise ist jedes XML-Dokument auch ein gültiges SGML-Dokument.

Die Abweichung zu SGML wird besonders aus den Entwicklungszielen für XML deutlich:

Einfache Nutzung im Internet.
In Abkehr von den Hauptnutzung SGMLs als offline Dokumentationsformat wird die Untermengenbildung XML für die primäre Nutzung im Internet vorgenommen.
Unterstützung eines breiten Anwendungsspektrums.
Auch hier soll die Untermengenbildung das Einsatzspektrum über die Hauptnutzung SGMLs als Format der technischen Dokumentation hinaus befördern.
SGML Kompatibilität.
XML bildet eine echte Untermenge des ISO-Standards SGML, durch diesen Schritt kann jedes XML-Dokument auch als gültiges SGML-Dokument interpretiert und durch die entsprechenden SGML-Werkzeuge verarbeitet werden.
Einfache Applikationsentwicklung.
Die Untermengenbildung wird im Hinblick auf eine gegenüber SGML deutlich vereinfachte Entwicklung von XML verarbeitenden Applikationen vorgenommen.
Minimierung optionaler Sprachmerkmale -- Idealerweise gleich Null.
Auch dieses Ziel ist im Hinblick auf eine vereinfachte Applikationsentwicklung, aber auch eine einfachere Benutzbarkeit durch Menschen auf dem Wege der Komplexitätsreduktion zu interpretieren.
Lesbarkeit.
Das entstehende Textformat soll für Menschen und Maschinen gleichermaßen les- und verstehbar sein.
Kompakte Spezifikation.
Die erstehende XML-Spezifikation sollte deutlich weniger Umfang aufweisen als der SGML-Vorgängerstandard. Letztlich konnte die reine Seitenzahl von über 600 Seiten für die SGML-Spezifikation auf ungefähr 30 Seiten für XML reduziert werden.
Formaler und präziser Sprachentwurf.
Um die schnelle Akzeptanz seitens der Anwender zu forcieren erachteten die Mitglieder der XML-Arbeitsgruppe die schnelle Verfügbarkeit von XML-Werkzeugen für essentiell. Aus diesem Grunde sollte der XML-Sprachentwurf möglichst leicht und eindeutig in XML-Werkzeuge zu implementieren sein.
Leichte Dokumenterstellung.
Die Erstellung von korrekten XML-Dokumenten sollte idealerweise so einfach sein, daß hierfür keine speziellen Werkzeuge benötigt werden.
Nicht notwendigerweise knappes Markup.
Kompaktheit und Effizienz hinsichtlich des Volumens eines XML-Dokuments war zu keinem Zeitpunkt eines der Hauptentwicklungsziele. Auf der Basis des XML-Information Sets ist es jedoch möglich beliebig kompakte Binärformate identischer Mächtigkeit zur die in der XML-Spezifikation vorgestellten Textnotation zu definieren.

XML stellt jedoch keine echte semantische Auszeichnungssprache dar, da durch die Metasprache lediglich eine Möglichkeit zur Formulierung eigener Syntax gegeben ist. Die Bedeutung der Elemente bleibt jedoch unberücksichtigt, und kann mittels XML nicht ausgedrückt werden.

Tabelle 2: Einige chronologische Eckdaten

Jahr	Ereignis
1945	Vannevar Bush diskutiert in seinem Artikel As We May Think ein persönliches Informationssystem mit Kommunikationsmöglichkeiten und Zugriff auf Bücher, Tonaufnahmen, etc. unter dem Namen Memex.
1967	William Tunnicliffe (Chairman des Graphic Communications Association (GCA) Composition Committee) schlägt aus seinen Erfahrungen bei der wiederholten Erstellung von Telephonkatalogen (yellow pages) vor, häufig auftretende strukturelle Elemente zu standardisieren.
September 1967	William Tunnicliffe (Vorsitzender der Graphic Communication Association) spricht sich auf einer Konferenz des Printing Office der Regierung von Kanada für die Separierung von Inhalt und Format aus.
Ende der 1960er Jahre	Stanley Rice, ein New Yorker Schriftsetzer, schlägt editorial structure tags vor. Der CGA-Direktor Norman Scharpf initiiert das Projekt GenCode.
1969	Charles Goldfarb, Edward Mosher und Raymond Lorie entwickeln bei der IBM die Generalized Markup Language (GML). Anwendungshintergrund war ein Projekt zur Integration von Informationssystemen für Anwaltskanzleien.
1970	Goldfarb formuliert zwei Grundprinzipien generalisierter Auszeichungssprachen: 1) Auszeichnungssprachen beschreiben die Dokumentstruktur, nicht die physischen Charakteristika wie Präsentation 2) Die Struktur der Auszeichnungssprache soll so gewählt sein, daß sie sowohl von Menschen als auch Maschinen interpretiert werden kann
1978	ANSI ruft Computer Languages for the Processing of Text-Komitee ins Leben. Ziel ist die Weiterentwicklung der GML zu einem nationalen US-Standard.
1980	ANSI veröffentlicht ersten Entwurf einer standardisierten GML (SGML). Tim Berners-Lee tritt seine Arbeit am Europäischen Kernforschungszentrum CERN an. Dort entwickelt er in der Folgezeit die (niemals veröffentlichte) Hypertextanwendung Enquire.
1983	Der International Revenue Service (IRS) und das US Verteidigungsministerium (DoD) übernehmen den sechsten Entwurf zur SGML (auch bekannt als GCA 101-1983).
1984	Die SGML-Arbeitsgruppe nimmt unter Schirmherrschaft der International Standardization Organization (ISO) als ISO/IEC JTCI/SC18/WG8 ihre Arbeit auf. Goldfarb dient als technical leader der ISO-Gruppe, sowie dem umorganisierten ANSI-Komitee X3V1.8.
1985	Norm-Entwurf zu SGML veröffentlicht.
15. Oktober 1986	ISO verabschiedet SGML als ISO 8879:1986.
März 1989	Berners-Lee schlägt mit dem Dokument Information Management: A Proposal ein SGML-basiertes Hypertext-System zum Informationsaustausch vor.
1990	Am Weihnachtstag nimmt das World Wide Web seinen Betrieb mit zwei Maschinen am CERN auf. Die notwendigen Implementierungen von HTML, HTTP und URL erfolgten durch Berners-Lee. Die erste WWW-Verbindung wird zwischen Berners-Lees Workstation und Robert Cailliaus' NeXT-Rechner aufgebaut. Ein Screenshot des ersten Web-Browsers NeXTStep-Implementierung des Browsers
1991	Beginn der turnusmäßigen Überarbeitungsphase von ISO 8879.
3. November 1992	Erster Entwurf zu HTML
Juni 1993	Einreichung des ersten HTML Entwurfs bei IETF.
Oktober 1994	Gründung World Wide Web Consortium
14. November 1996	Erster Entwurf zu XML vorgestellt
14. Januar 1997	Verabschiedung der HTML v3.2
1998	W3C gibt die erste Version von XML als Recommendation frei.
2000	W3C gibt XHTML v1.0 -- die Reformulierung von HTML v4.01 zu einer XML-Anwendung -- frei. W3C verabschiedet XML 2^nd edition; sie integriert u.a. die XML Namespaces und behebt einige editorielle Fehler.
2. Mai 2001	Das W3C verabschiedet den XML Schema-Standard. Er geht an vielen Stellen deutlich über die ererbten SGML-Möglichkeiten hinaus, und markiert den Übergang von Präsentations-orientierten Strukturen hin zu Datenstrukturen.

Zum Abschluß dieser Einführung seinen die zehn Punkte zusammengestellt und kommentiert, die durch das World Wide Web Consortium als plakative Kurzcharakterisierung von XML veröffentlicht wurden:

XML steht für strukturierte Daten.
Diese Aussage betont die Rolle von XML als Sprache um Sprachen zu erzeugen. Nicht XML wird innerhalb verschiedenster Applikationen direkt verarbeitet, sondern XML basierte Formate. So steht nicht die XML selbst für all diese Anwendungsdomänen, sondern die jeweiligen problemspezifischen XML-basierten Sprachen. XML selbst dient lediglich der Strukturierung der verschiedensten darzustellenden Daten.
Gleichzeitig rückt durch Aussage die Rolle der XML als Datenformat in den Vordergrund und läßt so die Weiterentwicklung gegenüber den präsentationsorientierten Vorläufern deutlich werden.
Die Vorlesungskapitel Strukturelle Grundkonzepte und XML Schemasprachen vermitteln einen Eindruck dieses Wandels und dokumentieren die Grundlagen des gegenwärtigen datenorientierten Einsatzes der XML.
XML sieht ein wenig wie HTML aus.
Diese Aussage soll offenkundig einerseits den bisherigen HTML-verwendenden Web-Autoren den Einstieg in die XML schmackhaft werden lassen. Dennoch führt sie ein wenig von der Grundidee XMLs als generischer Auszeichnungssprache für beliebigste Anwendungen weg, indem sie den Blick auf HTML focussiert.
Die -- im Grunde der Verwandschaft zu SGML geschuldete -- offensichtliche syntaktische Ähnlichkeit zu HTML wird bereits bei der Betrachtung der strukturellen Grundkonzepte deutlich.
XML ist Text, aber nicht zum Lesen.
XML-Dokumente können sicherlich im wörtlichen Sinne „gelesen“ werden ... Die Aussage zielt jedoch auf den intendierten Einsatzzweck von XML: der Darstellung von Daten für den Austausch zwischen Maschinen. Unbenommen dessen kann XML selbstverständlich auch von Menschen gelesen und verstanden werden, wenngleich dies bei umfangreicheren XML-Dokumenten durchaus mühsam werden kann.
Aufschluß über die textuelle Natur XMLs, insbesondere im Hinblick auf die Verwendung unterschiedlicher Alphabete, liefert das Kapitel strukturelle Grundkonzepte.
XML ist vom Design her ausführlich.
Hiermit wird versucht dem häufig geäußerten Kritikpunkt der Platzzunahme XML-codierter Inhalte gegenüber klassischen Darstellungsweisen etwas pauschal entkräftend entgegenzutreten. Sicherlich geht das W3C in dieser Aussage nicht fehl, wenn die Entwicklung der Netzwerkbandbreiten, der CPU-Leistung und der Speicherkapazitäten berücksichtigt. Andererseits ist die Aufblähung der XML-formatierten Inhalte im Vergleich zu optimierten Binärformaten nicht von der Hand zu weisen, wird jedoch durch die mit der Verwendung von XML einhergehenden Vorteile mehr als ausgeglichen.
Einen ersten Eindruck der Natur XML-codierter Inhalte liefert das Kapitel strukturelle Grundkonzepte. Dort finden sich auch Ansätze die bekannte XML-Syntax kompaktifiziert darzustellen ohne die Vorteile der generischen Auszeichnungssprache aufgeben zu müssen.
XML ist eine Familie von Techniken.
Eine Aussage, die durch alle drei Kapitel der Vorlesung unterstrichen wird, die deutlich zeigen, daß XML nicht als isolierte Idee oder Technik anzusehen ist -- sondern erst im Zusammenspiel mit anderen XML-Standards und eingebettet in Applikationen und Infrastrukturen -- seine volle Wirkungsmächtigkeit entfalten kann.
XML ist neu, aber nicht so neu.
Diese Bezugnahme soll nochmals unterstreichen, daß XML keineswegs den Anspruch erhebt eine vollkommen neue technische Errungenschaft zu sein, sondern vielfach bekanntes und erprobtes aus der Informatik wiederverwendet und im neuen Verwendungskontext weiterentwickelt.
Diese Aussage wird durch die in den einzelnen Kapiteln dargebotenen Rückbezüge auf bereits bekannte Techniken und Lösungsformen untermauert.
XML überführt HTML in XHTML.
Diese Aussage greift nochmals die Beziehung zwischen XML und HTML auf. Diesmal soll die Rolle von XML im Bezug auf die Weiterentwicklung von HTML zum XML-basierten Vokabular XHTML unterstrichen werden. So löst XML die Abhängigkeit zwischen SGML und HTML auf und reformuliert HTML auf der Basis von XML.
Das Kapitel XHTML führt kurz in die Entwicklung der neuen HTML-Varianten auf Basis der XML ein und skizziert die vorgenommen Änderungen und zukünftige Erweiterungen dieser Hypertextsprache.
XML ist modular.
Hierdurch wird unterstrichen, daß XML kein in sich geschlossenes monolithisches Gebilde darstellt, sondern einzelne Vertreter aus der Familie der XML-Sprachen wahlfrei zur Lösung konkreter Probleme herangezogen werden können. Ebenso wird die Sprachfamilie beständig an verschiedensten Stellen unabhängig voneinander weiterentwickelt, ohne einer zentralen Koordination zu bedürfen.
XML ist die Basis für RDF und das Semantic Web.
Grundidee des Semantic Web ist die Weiterentwicklung des sichtbaren XHTML-basierten Webs unter Nutzung seiner datenorientierten Ergänzung XML zu einem Netz von Sinnzusammenhängen.
XML ist lizenzfrei, plattform- und herstellerunabhängig, und gut unterstützt.
XML ist eine durch das World Wide Web Consortium herausgegebene Spezifikation, die kostenfrei über das Web bezogen werden kann und durch Interessierte ohne weitere Lizenzkosten in eigenen kommerziellen Produkten verwendet werden. Durch den Standardisierungsprozeß innerhalb des World Wide Web Consortiums wird sichergestellt, daß keine Ausführungsplattform bevorzugt wird und gleichzeitig keine Nachteile für Andere entstehen. Dies wird durch die herstellerunabhängige Organisation des Gremiums versucht zu garantieren, in dem zwar Hersteller Mitglied werden können, die technischen Entscheidungen jedoch Arbeitsgruppen obliegen, die nicht durch eine Firma dominiert werden können.

	Web-Referenzen 1: Vertiefende Informationen
	•Artikel in der Online-Ausgabe des Economist über Ted Nelson -- The Babbage of the web •COT1800 Public Networks, Lecture 8, Standard Generalised Markup Language •Brief History of Document Markup •XML, Element Types, DTDs, and All That •Clark, J.: Comparison of SGML and XML

	Web-Referenzen 2: Weiterführende Links
	•Browser Timelines •Browser Emulator

	Definition 2: XML-Sprache
	Eine Anwendung der Extensible Markup Language. Ein Vokabular, das aus Symbolen und der ihnen zugewiesenen Bedeutung (Semantik) gebildet wird, ergänzt um Regeln (grammatikalische Struktur und Gültigkeitsregeln für den Inhalt (z.B. Datentypen)) zur Kombination der Vokabularelemente. Anwendungen einer so neu geschaffenen XML-Sprache L werden als XML-Dokumente, auch: L-Dokumente, bezeichnet.

Strukturelle Grundkonzepte

Die grundlegende XML-Syntax ist in der namensgebenden W3C-Recommendation der Extensible Markup Language definiert. Die Semantik der Metasprache wird hingegen durch den W3C-Standard des XML Information Set festgelegt.
Diese Spezifikationen beinhalten die grundlegenden Definitionen hinsichtlich Terminologie und Beziehung der verschiedenen möglichen Elemente eines XML-Dokuments. Im vorliegenden Teilkapitel werden beide Sprachaspekte grundlegend eingeführt und ein erstes Verständnis der XML vermittelt. Dabei wird in Form von Ausblicken auf nachfolgende Abschnitte der Bogen zu Grammatikdefinitionssprachen und weiterführenden Konzepten wie Namensräumen gespannt.
Zum leichteren Verständnis sind die aus der offiziellen Spezifikationen entnommenen formalen Grammatikdefinitionen der EBNF-Notation durch vereinfachte graphische Strukturdarstellungen ergänzt.

	Definition 3: XML Dokument
	Ein XML-Dokument ist ein Datenstrom (der nicht zwingend als Datei vorliegen muß), welcher den Strukturierungsprinzipien der eXtensible Markup Language genügt.

	Definition 4: XML Information Set
	Die Spezifikation des XML Information Sets definiert die Semantik der Metasprache XML, d.h. ihre zentralen Begriffe. Gleichzeitig setzt es diese Begriffe in Beziehung und definiert so syntaxunabhängig die Struktur eines XML-Dokumentes.

Ausgehend von der Allgemeinheit der Aussage aus Definition 1 folgt, daß der Infoset neben seinem theoretischen Wert als Semantikdefinition zur XML auch zur Formulierung der Datenstrukturen, welche innerhalb eines XML-Prozessors vorliegen müssen, um beliebige XML-Dokumente verarbeiten zu können, herangezogen werden kann.
Daher läßt sich ein XML-Prozessor definieren als:

	Definition 5: XML-Prozessor
	Ein XML-Prozessor ist eine maschinelle Komponente (typischerweise: Software), die zum Lesen, Speichern und Verarbeiten eines XML-Dokuments eingesetzt wird. Er erlaubt Zugriff auf den Inhalt und die Struktur des XML-Dokuments.

Die XML-Spezifikation faßt den XML-Prozessorbegriff etwas enger und beschränkt ihn lediglich auf Software-Module, die XML-Dokumente lesend verarbeiten. Konzeptionell spricht jedoch nichts gegen eine Umsetzung in Hardware, beispielsweise im Kontext eingebetter Systeme etc. (In XML-Spezifikation nachschlagen)
Ferner nimmt die XML-Spezifikation an, ein Prozessor operiere nicht eigenständig, sondern im integrierten Zusammenspiel mit einer Applikation.

Beispiel 1: Ein erstes XML-Dokument

(1)<?xml version="1.0" encoding="ISO-8859-15" standalone="yes"?>
(2)<Vorlesung>
(3)   <Pflichtfach/>
(4)   SS2003
(5)   <Titel beginn="2003-03-17T14:00:00+01:00">eBusiness-Engineering</Titel>
(6)   <Hochschule>Fachhochschule Furtwangen</Hochschule>
(7)   <Praktikum>Kein Übungsbetrieb</Praktikum>
(8)</Vorlesung>

[80]	EncodingDecl	::=	S 'encoding' Eq ('"' EncName '"' \| "'" EncName "'" )
[81]	EncName	::=	[A-Za-z] ([A-Za-z0-9._] \| '-')*
[3]	S	::=	(#x20 \| #x9 \| #xD \| #xA)+
[25]	Eq	::=	S? '=' S?

	Web-Referenzen 3: Weiterführende Links
	•Payer, M.: UNICODE, ISO/IEC 10646, UCS, UTF •Kuhn, M.: UTF-8 and Unicode FAQ •SC Unipad ein kostenfreier Unicode Editor

[40]	STag	::=	'<' Name (S Attribute)* S? '>'
[41]	Attribute	::=	Name Eq AttValue

[4]	NameChar	::=	Letter \| Digit \| '.' \| '-' \| '_' \| ':' \| CombiningChar \| Extender
[5]	Name	::=	(Letter \| '_' \| ':') (NameChar)*
[6]	Names	::=	Name (S Name)*
[7]	Nmtoken	::=	(NameChar)+
[8]	Nmtokens	::=	Nmtoken (S Nmtoken)*

	Beispiel 2: Element mit deklariertem Namensraum
	`(1)... (2) <myNS:aParent xmlns:myNS="example.com"> (3) <myNS:aElement/> (4) </myNS:aParent> (5)...`

	Web-Referenzen 4: Weiterführendes ... Die in XHTML v1.0 vordefinierten Entitäten
	Latin-1 Entities Special Entities Symbole

[16]	PI	::=	'<?' PITarget (S (Char* - (Char* '?>' Char*)))? '?>'
[17]	PITarget	::=	Name - (('X' \| 'x') ('M' \| 'm') ('L' \| 'l'))

	Beispiel 4: Verschiedene Processing Instructions
	`(1)<?xml version="1.0" encoding="UTF-8"?> (2)<?mySystem value="42"?> (3)<root> (4) <?System2?> (5) <elementA> (6) <?System3 a="1" anotherValue?> (7) </elementA> (8)</root>` Download des Beispiels

	Übung 1: Processing Instructions
	Begründen Sie mit Hilfe der XML-Spezifikation warum Processing Instructions nicht innerhalb von Elementen und Attributen zugelassen sind. Hinweis: Es gibt mehr als eine Begründung!

[URI1]	URI-reference	::=	(absoluteURI \| relativeURI)? ("#" fragment)?
[URI2]	absoluteURI	::=	scheme ":" ( hier_part \| opaque_part )
[URI3]	relativeURI	::=	( net_path \| abs_path \| rel_path ) [ "?" query ]
[URI4]	hier_part	::=	( net_path \| abs_path ) ("?" query)?
[URI5]	opaque_part	::=	uric_no_slash uric?
[URI6]	uric_no_slash	::=	unreserved \| escaped \| ";" \| "?" \| ":" \| "@" \|
			"&" \| "=" \| "+" \| "$" \| ","
[URI7]	net_path	::=	"//" authority abs_path?
[URI8]	abs_path	::=	"/" path_segments
[URI9]	rel_path	::=	rel_segment abs_path?
[URI10]	rel_segment	::=	(unreserved \| escaped \|
			";" \| "@" \| "&" \| "=" \| "+" \| "$" \| "," )+
[URI11]	scheme	::=	alpha (alpha \| digit \| "+" \| "-" \| "." )*
[URI12]	authority	::=	server \| reg_name
[URI13]	reg_name	::=	( unreserved \| escaped \| "$" \| "," \|
			";" \| ":" \| "@" \| "&" \| "=" \| "+" )+
[URI14]	server	::=	((userinfo "@")? hostport)?
[URI15]	userinfo	::=	( unreserved \| escaped \|
			";" \| ":" \| "&" \| "=" \| "+" \| "$" \| "," )*
[URI16]	hostport	::=	host (":" port)?
[URI17]	host	::=	hostname \| IPv4address
[URI18]	hostname	::=	( domainlabel "." )* toplabel (".")?
[URI19]	domainlabel	::=	alphanum \| alphanum *( alphanum \| "-" ) alphanum
[URI20]	toplabel	::=	alpha \| alpha (alphanum \| "-" )* alphanum
[URI21]	IPv4address	::=	digit+ "." digit+ "." digit+ "." digit+
[URI22]	port	::=	digit*
[URI23]	path	::=	(abs_path \| opaque_part)?
[URI24]	path_segments	::=	segment ("/" segment)*
[URI25]	segment	::=	pchar* (";" param)*
[URI26]	param	::=	pchar*
[URI27]	pchar	::=	unreserved \| escaped \|
			":" \| "@" \| "&" \| "=" \| "+" \| "$" \| ","
[URI28]	query	::=	uric*
[URI29]	fragment	::=	uric*
[URI30]	uric	::=	reserved \| unreserved \| escaped
[URI31]	reserved	::=	";" \| "/" \| "?" \| ":" \| "@" \| "&" \| "=" \| "+" \|
			"$" \| ","
[URI32]	unreserved	::=	alphanum \| mark
[URI33]	escaped	::=	"%" hex hex
[URI34]	hex	::=	digit \| "A" \| "B" \| "C" \| "D" \| "E" \| "F" \|
			"a" \| "b" \| "c" \| "d" \| "e" \| "f"
[URI35]	digit	::=	"0" \| "1" \| "2" \| "3" \| "4" \| "5" \| "6" \| "7" \|
			"8" \| "9"
[URI36]	uric_no_slash	::=	unreserved \| escaped \| ";" \| "?" \| ":" \| "@" \|
			"&" \| "=" \| "+" \| "$" \| ","

local name	=	aElement
namespace URI	=	example.com
prefix	=	myNS

	Web-Referenzen 5: Weiterführende Links
	•URIs, URLs, and URNs: Clarifications and Recommendations •The Anatomy of an URL

[NS7]	Präfix	::=	NCName
[NS4]	NCName	::=	(Letter \| '_') (NCNameChar)*
[NS5]	NCNameChar	::=	Letter \| Digit \| '.' \| '-' \| '_'
			\| CombiningChar
			\| Extender

[NS6]	QName	::=	(Präfix ':')? LocalPart
[NS8]	LocalPart	::=	NCName

	Definition 8: Namensraumidentifikation
	Jeder XML-Namensraum wird durch eine gültige URI identifziert. Diese URI dient ausschließlich der Benennung, daher muß sie nicht auf eine gültige Ressource verweisen.

	Beispiel 20:
	`(1)http://www.{iri-}example.com (http://www.%7Biri-%7Dexample.com) (2)mailto:marc léon@example.org (mailto:marc%20l%E9on@example.org)`

	Web-Referenzen 6: Weiterführende Links
	•XML-Namespace Recommendation •Namespace Recommendation in deutscher Übersetzung •Namespace Tutorial @ Zvon.org •Tim Bray: Namespaces by Example •Hintergrundartikel: Namespaces in XML Adopted by W3C •(Tutorial) Simon St. Laurent: Namespaces in XML •Roland Bourret: XML Namespaces FAQ

	Definition 10: Gültigkeit hinsichtlich eines Schemas
	Ein XML-Dokument heißt gültig hinsichtlich eines Schemas (schema valid), wenn es über ein Schema verfügt, und konform zu diesem aufgebaut ist.

	Beispiel 29: Bildung eines Aggregationstypen
	`(1)<xsd:simpleType name="WarenkorbElemente"> (2) <xsd:list itemType="xsd:string"/> (3)</xsd:simpleType>`

	Web-Referenzen 7: Weiterführende Links und Werkzeuge
	•XML Schema Part 0: Primer •XML Schema Part 1: Structures •XML Schema Part 2: Datatypes •XML Schema @ Cover-Pages •Parsing the Atom -- Diskussion über die Vor- und Nachteile inhärent komplexer atomarer Typen •Schema-Informationen @ jeckle.de •XML-Authority (DTD- und XSD-Editor) •XML Spy (DTD- und XSD-Editor)

	Beispiel 33: XPath-Ausdruck zur Lokalisierung aller Vornamen
	`XPath-Ausdruck: /ProjektVerwaltung/Person/Vorname Ergebnis: <Vorname>Hans</Vorname>, <Vorname>Franz</Vorname>, <Vorname>Xaver</Vorname>, <Vorname>Fritz</Vorname>`

	Beispiel 34: Platzhalter in Lokalisierungsschritten
	`XPath-Ausdruck: /ProjektVerwaltung/Person/Qualifikationsprofil/*/Qualifikation Ergebnis: <Qualifikation>Programmierung</Qualifikation> <Qualifikation>Projektleiterfunktion</Qualifikation>`

	Beispiel 36: Selektion unter Anwendung eines Prädikats
	`XPath-Ausdruck: //Person[Qualifikationsprofil]/Nachname Ergebnis: <Nachname>Obermüller</Nachname>`

	Web-Referenzen 8: Weiterführende Links
	•XPath Spezifikation •Deutsche Übersetzung der XPath-Spezifikation •XPath Visualisierer (Java-basiert) •Visual XPath (.NET Windows-Applikation) Originalbezugsquelle •XPath Explorer (Java-basiert) Originalbezugsquelle •Online Experimentieren mit XPath

	Web-Referenzen 9: Weiterführende Links
	•JDBC @ SUN •JDBC learning center @ SUN •JDBC Tutorial •JDBC FAQ @ JGuru.com •G. Reese: Database Programming with JDBC and Java. O'Reilly, 1997 •Verhältnis von X/Open CLI und ODBC

	Beispiel 68: Remote-Schnittstelle einer EJB
	`(1)import java.rmi.RemoteException; (2)import javax.ejb.EJBObject; (3) (4)public interface SayHello extends EJBObject { (5) public String sayHello(String name) throws RemoteException; (6)}` Download des Beispiels

	Web-Referenzen 10: Weiterführende Links
	•TJDO -- eine freie JDO-Implementierung •JDO @ SUN •JDOCentral.com -- Die Anlaufstelle der JDO-Entwickler •JDO-Spezifikation

	Web-Referenzen 11: Weiterführende Links
	•Introduction to Message-oriented Middleware •JMS FAQ

	Beispiel 94: Die Schnittstelle HelloInterface
	`(1)import java.rmi.Remote; (2)import java.rmi.RemoteException; (3) (4)public interface HelloInterface extends Remote { (5) public String sayHello() throws RemoteException; (6)}` Download des Beispiels

	Beispiel 97: Die Klasse ActivatableHelloInterface
	`(1)import java.rmi.Remote; (2)import java.rmi.RemoteException; (3) (4)public interface ActivatableHelloInterface extends Remote { (5) public String sayHello() throws RemoteException; (6)}` Download des Beispiels

	Web-Referenzen 12: Weiterführende Links
	•RMI @ SUN •RMI Tutorial @ SUN •Ninja RMI eine freie RMI-Implementierung •JDBC FAQ @ JGuru.com •G. Reese: Database Programming with JDBC and Java. O'Reilly, 1997. •Verhältnis von X/Open CLI und ODBC