Verwendung mathematischer Formeln in HTML-Dokumenten

Es gibt verschiedene Bemühungen um die Möglichkeit der Präsentation mathematischer Symbole und Formeln in HTML-Seiten. Das derzeit übliche Verfahren zur Bereitstellung mathematischer Texte im Internet ist die Dateiform im TEX-Ausgabe- (*.dvi) bzw. PostScript®-Format (*.ps) zum Herunterladen (vgl. hier). Dies setzt allerdings auch die Verfügbarkeit geeigneter Software zur Visualisierung oder zumindest - für das letztgenannte Datenformat - einen PostScript-Drucker voraus.

In sehr eingeschränktem Umfang können mathematische Sachverhalte auch mit den Mitteln von HTML realisiert werden (vgl. hier)

Nachstehend sollen einige Aspekte eines weiteren, aber auch seltener praktizierten Ansatzes diskutiert werden. Hierbei ist das eigentliche Anliegen nicht die Bereitstellung ganzer Dokumente, sondern die Integration von einzelnen Formeln in mit HTML gestalteten Seiten. Die Maximen dieses Ansatzes können wie folgt zusammengefaßt werden:

Sofort fallen einem Gegenargumente für ein solches Vorgehen ein: Bei genauerem Hinsehen eröffnen sich aber auch eine ganze Reihe von Vorteilen: Als weit verbreitetes Satzsystem für Texte mathematischen Inhalts ist TEX zu nennen, wobei mit geeigneten Druckertreibern das Ergebnis im PostScript-Format aufbereitet werden kann. Mit Ghostscript im Zusammenspiel mit dem Ghostscript Command Editor lassen sich unter MS-Windows auf einfache Weise Binärbilder erzeugen. (Das nachfolgende Beispiel wurde unter MS-DOS 6.0 mit MS-Windows 3.1 mit TurboTEX 3.0 mit dazugehörigem Gerätetreiber DVIALW, Ghostscript for Windows 2.6.1 und Ghostscript for Windows Command Line Interface 3.0b bearbeitet.)

Der Originaltext der Quelldatei lautet:

\vsize=1.5 true cm
\footline={\relax}
\input begmac.tex
$$\lambda\ptimes x(t)-\int^b_a k(t,s)\ptimes x(s)\intd s=f(t)\MathComma
\hbox{f\"ur $t\in[a,b]\subset\IR^q$}$$
\bye
Hierbei verbergen sich in der Datei begmac.tex eine ganze Reihe von Makros, von denen allerdings hier nur \intd, \MathComma, \ptimes und \IR relevant sind. Diese Makros sind wie folgt definiert:
\def\intd{\mskip\thinmuskip{\rm d}\nobreak}%
\def\MathComma{\hskip 10pt\mathpunct,}%
\def\ptimes{\mskip 1.5 mu}%
\font\Dbl=cmss10
\def\IR{\hbox{\Dbl I\kern-1.3pt R}}
Hierbei ist zu bemerken, daß cmss10 ein LaTEX-Font und damit im Standardumfang von TEX in der Regel enthalten ist. Nachdem dieser Originaltext von TurboTEX und dem Treiber DVIALW in das PostScript-Datenformat umgesetzt wurde, wurde Letzteres einer Umsetzung in das binäre GIF-Rastergraphikformat (2 Farben) durch Ghostscript for Windows Command Line Interface unterworfen - mit einer Auflösung 300 dpi horizontal und vertikal. Anschließend wurde lediglich mit PaintShopPro 3.12 noch ein angemessen kleines Rechteck, das die graphische Repräsentation der Formel enthält, ausgeschnitten und im Verhältnis 1:2 verkleinert und wieder im binären GIF-Format gespeichert.

Fredholmsche Integralgleichung 2. 
Art

Obwohl die Größe der Graphik und die Größen der darin verwendeten Symbole fest sind, kann erreicht werden, daß auch der Fließtext in einer passenden Größe angezeigt wird. Beim MS-Internet-Explorer (Version 3 und 4) ist dies die zweitgrößte der einstellbaren Schriftgrößen. Beim Netscape Navigator 4.04 ist dies ebenfalls erreichbar.

Es ist dazu zu bemerken, daß zwar gewisse aber keine qualitativen Unterschiede zu bemerken sind, wenn die Gleichung unmittelbar mit einer Auflösung von 150 dpi in das binäre GIF-Bildformat konvertiert wird und die Verkleinerung unterbleibt. Was das Datenvolumen angeht, benötigt obige Graphik lediglich 1084 Bytes.

Daneben wurde auch versucht, das Bild mit einer Aufösung von 300 dpi (in jeder Richtung) im Verhältnis 1:2 (also verkleinert) zu präsentieren. Bei keinem der zum Test herangezogenen Browser führte zu qualitativen Verbesserungen. Die Darstellung führte beim Netscape Navigator zur identischen graphischen Ausprägung wie das mit PaintShopPro verkleinerte Bild.

Abschließend bleibt auch festzustellen, daß die Verwendung dieser Technik für mathematische Symbole und Formeln im Fließtext nur bedingt geeignet und aufwendig erscheint. Zum einen stellt HTML nur wenige Möglichkeiten der Ausrichtung der Graphik in Bezug zum Text, in den eingebettet sie erscheinen soll, zur Verfügung, zum anderen - teilweise aus diesem Umstand folgend - ist die Dimensionierung der Graphik unverhältnismäßig kompliziert. In Fließtext eingefügten Graphiken führen auch zu unregelmäßen (weil nicht kontrollierbaren) Zeilenabständen.

So bleibt aber immerhin mit dieser Technik die Verwendung von hervorgehobenen Formeln in erläuternden Begleittexten, während zweckmäßig für die Ausarbeitung der mathematischen Sachverhalte auf die oben erwähnten Dateiformate ausgewichen werden sollte.

Ein völlig anderer Ansatz wird mit TeX2HTML begangen. Hier wird vorausgesetzt, daß im Zielsystem ein Symbolzeichensatz mit einem vorgegebenem Namen existiert. Dieser wird dann genutzt, um Sonderzeichen sowie griechische Buchstaben zur Darstellung zu bringen. Dies ist jedoch nur mit gegebenenfalls qualitativen Defiziten (vergleiche Beispiele zur Anwendung von TeX2HTML), die im hier verwendeten Beispiel nicht so offensichtlich werden und unter Umständen auch vom verwendeten Browser abhängen, und unter der oben formulierten Voraussetzung möglich.

Eine Datei folgenden Inhalts wurde von TeX2HTML verarbeitet; man beachte hierbei, daß TeX2HMTL nur einen eingeschränkten Umfang von TEX verarbeiten kann:

\vsize=1.5 true cm
\footline={\relax}
\def\intd{\ {\rm d}}%
\def\MathComma{\ \ \ ,}%
\def\ptimes{\ }%
\def\IR{\hbox{\bf R}}
$$\lambda\ptimes x(t)\ -\int^b_a k(t,s)\ptimes x(s)\intd s=f(t)\MathComma
\hbox{ f\"ur $t\in[a,b]\subset\IR^q$}$$
\bye 
Das Ergebnis soll nicht vorenthalten werden. Da die Präsentation nicht in allen Umgebungen gleichermaßen gelingt (Verfügbarkeit des Symbolzeichensatzes), wird sie nicht in das vorliegenden Dokument integriert, sondern als separate HTML-Seite bereitgestellt.

Das HTML-Fragment besitzt eine Länge von 660 Bytes, wobei hier die Variante mit der größten Ausprägung der Buchstaben und Symbole dargestellt ist. Das HTML-Fragment mit der "normalen" Zeichengröße besitzt eine Länge von 590 Bytes. Der von TeX2HTML generierte Code enthält in der Regel nicht nur Zeichen des 7-Bit-ASCII-Zeichensatzes - mit der Konsequenz, daß dies nicht den Vorgaben des HTML-Standards entspricht! Eine Umsetzung der Sonderzeichen in die übliche HTML-Notation der Form "#nnn;" führt beim MS Internet Explorer zu falschen Interpretation (Verwendung des Standard- statt des Symbolzeichensatzes).

Ein weiterer interessanter Ansatz ist die abstrakte Beschreibung von Formeln in einem HTML-ähnlichen Format. Seltsamerweise buhlen bereits jetzt mindestens zwei verschiedene Ansätze um die Gunst der Anwender:

Es ist nicht zu verhehlen, daß beide Ansätze derzeit geeignete Zusatz-Software zur Visualisierung der Formeln voraussetzen und damit dem Anspruch, mathematische Informationen einer breiten Öffentlichkeit zugänglich zu machen, nicht erfüllen. (Spezielle) Plugins sind in der Regel nicht Allgemeingut und nur auf ganze Dokumente (Dateien) anwendbar.

Abrundend sei festgestellt, daß in einer Demo-Version eine Umsetzung einer Formelbeschreibung in das im Projekt OpenMath definierte Format verfügbar ist. Um Fehlinterpretationen zu vermeiden, wurde im obigen Beispiel nur die Integralgleichung selbst ohne die Festlegung des Definitionsbereichs der Variablen t einer Umsetzung unterworfen. Gestalterische Elemente (wie vergrößerte Zwischenräume usw.) konnten nicht berücksichtigt werden. Das Ergebnis besitzt eine Nettodatenlänge von 2353 Bytes. Der Ressourcenbedarf (Datenvolumen) ist somit selbst bei der vorgenommenen Beschränkung des Inhalts wesentlich größer als bei den reinen Bilddaten (vergleiche oben).

Anmerkung: Mittlerweile weicht das Ergebnis der Umsetzung von dem hier referenzierten ab, doch wird bewusst darauf verzichtet, hier stets den aktuellen Stand widerzugeben.


Zurück zur Wurzel Erstellt von W. Volk im Juni 1999
Zuletzt korrigiert am 10. Oktober 2003