Sie sind hier:  AIB V3 > PC-Wissen > Internet & eMail > Dienste > WWW 

WWW (World Wide Web)

Diesen Dienst habe ich aus zwei Gründen bis zum Schluß aufgespart: Er ist die jüngste Erfindung im Netz und er integriert viele der anderen Dienste. Man kann deshalb fast alles mit nur einem Programm erledigen.


Erfinder des WWW: Tim Berners-Lee
WWW wurde 1989 im CERN (dem Europäischen Kernforschungszentrum in Genf, Conseil Européen pur la Récherche Nucléaire) entwickelt, basierend auf einem System namens Hypertext. Stellen Sie sich ein Lexikon vor. Sie schlagen einen Begriff nach und finden dort auch Querverweise auf verwandte Begriffe. Ist das Lexikon einbändig, müssen Sie nur etwas blättern, um den angegebenen Querverweis zu finden. Bei einem mehrbändigen Lexikon müssen Sie unter Umständen einen anderen Band aus dem Regal nehmen. Handelt es sich beim Querverweis um eine andere Literaturangabe, ist möglicherweise ein Gang zur Bibliothek notwendig. 'Hypertext' bedeutet also, daß der Text Querverweise enthält, die man mit dem Betrachtungsprogramm per Tastendruck oder Mausklick abrufen kann. Das Hilfesystem von MS-Windows verwendet ein sehr einfaches Hypertextsystem. Nur geht WWW sehr viel weiter, es können nicht nur lokale Dateien, sondern Dateien auf beliebigen Rechnern im Internet als Querverweis angegeben und per Knopfdruck erreicht werden.

Aber das WWW ist nicht nur ein weiterer verbesserter Informationsservice wie Gopher oder WAIS, sondern es erlaubt auch die Einbindung von Bildern, Sounds oder Animationen in die Hypertext-Dokumente. Das Informationsangebot kann nun multimedial sein. Das hat letztendlich auch zur derzeitigen Popularität des Internet geführt; aber auch dazu, daß leider viele Menschen WWW und Internet gleichsetzen.

WWW ist aber auch der Versuch, die gesamte Information im Internet zusammenzufassen und über ein einziges Benutzerinterface zugänglich zu machen. Für den Benutzer existieren Programme verschiedener Hersteller, 'Browser' genannt, die das WWW verfügbar machen. Die ausgewählten Wörter sind durch Farbe oder Unterstreichung hervorgehoben und können per Mausklick expandiert werden. Damit beginnt die Reise durch das WWW. Auf dieser Reise begegnen Sie unter Umständen recht unterschiedlichen Quellen des Internet (beispielsweise FTP, News, Telnet, Gopher, E-Mail). WWW ist dabei aber höchst flexibel und kann Ihnen sowohl einen FTP-Server als auch einen Telnet-Zugang, einen News-Reader oder weiteres komfortabel präsentieren, so daß es in naher Zukunft für viele Nutzer nur noch ein einziges Werkzeug geben wird, um im Internet zu recherchieren. Die einzelnen Informationsquellen werden durch URLs (URL = Unified Resource Locator) bezeichnet, die den gewählten Dienst und die Datenquelle (Rechner und Datei) angeben (siehe unten).

'Netscape Navigator', 'Internet Explorer', 'Opera', 'Hot Java' sind Programme zum Zugriff auf das WWW mit grafischer Benutzeroberfläche. Es gibt aber auch für einige Systeme textorientierte Browser, z. B. 'LYNX'. Wenn Sie das Programm starten, gelangen Sie automatisch in die 'Homepage' Ihres Systems (bzw. des Systems ihres Providers). Mit 'Homepage' wird normalerweise die Einstiegsseite eines WWW-Servers - oder auch eines Benutzers - bezeichnet. Von dort aus können Sie einfach durch Auswahl eines Querverweises mit der Maus oder den Cursortasten auf weitere Informationsseiten eines beliebigen Internetrechners wechseln, wobei der Verbindungsaufbau automatisch erfolgt. Woher die Information kommt, kann im Browser angezeigt werden. Aber nicht nur durch Unterstreichung und Farbe hervorgehobene Texte können als Link (so nennt man bei WWW die Querverweise) dienen, sondern auch Bilder, beispielsweise kleine Icons. Eine weitere Möglichkeit wird durch sogenannte 'Imagemaps' geboten. Hier kann der Benutzer beliebige Stellen auf einem Bild anklicken. Die Mauskoordinaten werden an den Informations-Server übertragen, und der kann entsprechend reagieren. Bei LEO (http://www.leo.org/) gibt es beispielsweise eine Deutschlandkarte, auf der man den gewünschten Zielort anklicken kann.

Wie Gopher basiert auch WWW auf dem Client-Server-Prinzip. Die Kommunikation erfolgt zwischen einem WWW-Server, der Informationen bereitstellt, und einem Client, der die Informationen anzeigt. Das Protokoll dafür heißt HTTP (HyperText Transfer Protocol). Mitttels dieses Protokolls fordert der Client bei einem Server eine ganz bestimmte Datei mit einem Hypertext-Dokument an, die oft auch als 'WWW-Seite' bezeichnet wird. Diese Datei wird dann vom Server an den Client übertragen und danach die Verbindung wieder geschlossen. Enthält das Dokument Bilder oder andere Multimedia-Teile, werden auch diese Datei für Datei übertragen. Weder Server noch Client 'merken' sich die Tatsache der Kommunikation (es gibt höchstens einen Eintrag in eine Protokolldatei auf dem Server). So ist jede Informationsanforderung ein abgeschlossener Vorgang. Etliche Browser können für ein Dokument, das aus mehreren Dateien besteht, auch mehrere Übertragungen parallel öffnen. Bilder bauen sich dann z. B. simultan auf. Dadurch wird aber auch die Belastung des Netzes erhöht. Damit Seiten, die öfter aufgerufen werden, nicht immer über das Netz transportiert werden müssen, können die meisten Browser WWW-Seiten lokal zwischenspeichern (Cache-Speicherung). Es erfolgt dann nur eine kurze Anfrage an den Server, ob sich die entsprechende Information seit dem letzten Zugriff geändert hat. Ist dies nicht der Fall, werden die Daten lokal von der Platte geholt. Die größeren Provider und Uni-Rechenzentren unterhalten ebenfalls ein Cache-System. Wenn ein Benutzer eine WWW-Seite anfordert, wird die Info auf der Platte des Providers zwischengespeichert. Bei der Anfrage eines weiteren Benutzers nach derselben Seite innerhalb eines bestimmten Zeitraums wird die lokale Kopie zur Verfügung gestellt ('Proxy-Cache', 'Proxy-Server'). Die Proxy-Software überprüft regelmäßig, ob sich die lokal gespeicherten Infos eventuell geändert haben und aktualisiert sie gegebenenfalls. Nicht mehr gefragte Seiten werden nach einiger Zeit gelöscht.

Die Browser selbst brauchen natürlich die Fähigkeit, nicht nur Text schön darzustellen, sondern auch Bilder anzuzeigen oder Töne abzuspielen. Für die gebräuchlichsten Dateiformate im WWW sind die entsprechenden Darstellungsprogramme im Browser integriert (z. B. für die Bildformate GIF und JPEG oder die Audioformate AU und WAV). Für andere Bildformate kann man dem Browser in einer Konfigurationsdatei mitteilen, welche externen Programme für bestimmte Dateiformate aufzurufen sind. Auf diese Weise kann man den Browser für beliebige Datenformate fit machen. Teilweise liefern auch schon die Browser-Hersteller solche Programme mit. Besinders komfortabel sind Programmen, die sich automatisch in den Browser einklinken (sogenannte 'Plug-In'-Programme) Die Angabe des Anzeigeprogramms kann sogar interaktiv erfolgen. Stößt der Browser auf ein unbekanntes Dateiformat, wird der Benutzer gefragt, ob er ein Anzeigeprogramm angeben möchte oder ob die Datei für später auf der Platte gespeichert werden soll. In diesem Zusammenhang noch ein Hinweis: Alles was man beim Surfen im WWW auf dem Bildschirm sieht, ist in den lokalen Rechner übertragen worden und kann natürlich auch dauerhaft abgespeichert werden (File-Menü des Browsers, Menüpunkt 'Save as...'). Ebenso lassen sich die Bilder abspeichern (beim Netscape-Browser Mauszeiger auf das Bild ziehen, rechte Maustaste drücken).

Eigentlich ist das, was der Browser auf dem Bildschirm zeigt, die Wiedergabe einer Textdatei, die bestimmte Strukturierungsmerkmale enthält (probieren Sie mal den Menüpunkt 'view source' Ihres Browsers aus). Die Definitionssprache für solche Hypertext-Dokumente ist recht einfach, sie heißt HTML (HyperText Markup Language). HTML besteht aus normalem Text, bei dem Steueranweisungen, sogenannte HTML-'Tags', in den Text eingefügt werden. Diese Tags beeinflussen das Schriftbild, das später im Betrachtungsprogramm angezeigt wird; so gibt es zum Beispiel Tags, die einen Text als Überschrift kennzeichnen, oder Tags, die das Schriftbild verändern können. die Tags werden immer in '<' und '>' eingeschlossen. Mit nur wenigen Tags lassen sich schon sehr ansprechende Dokumente erstellen (siehe Kapitel 4).

Damit sind wir bei einem sehr wichtigen Punkt angelangt. HTML beschreibt die Struktur eines Dokuments, nicht dessen Aussehen! Denn der Informationsanbieter kann ja nicht wissen, ob der Leser seine Infos mit einem grafischen oder textorientierten Browser liest. Auch Bildschirmauflösung des Client-Computers, aktuelle Größe des Browser-Fensters, Farb- und Schriftwahl des Benutzers spielen eine Rolle. Manchen Benutzer schalten die Darstellung der Bilder ab, um Übertragungszeit zu sparen. All das sollte der Anbieter berücksichtigen (manche tun es, manche nicht). HTML ist eben kein Desktop-Publishing, sondern eine Struktursprache.

Wie kommt man zu interessanten Informationen? Es gibt drei Möglichkeiten:

1. Durch Empfehlung von Bekannten (Es können auch Informationen aus den News sein). Jemand sagt also zu Ihnen: "Probiere mal: http://www.fh-muenchen.de/". Das tippen Sie dann ins Adreßfenster des Browsers, und schon landen Sie auf dem entsprechenden Computer, der Ihnen die gewünschte Information serviert.

2. Durch Netsurfen. Sie starten einfach irgendwo. Klicken Sie auf eines der Links, und Sie werden auf einem Server irgendwo in der großen weiten Welt landen. Die Chance ist groß, daß diese Web-Seite weitere Links enthält und so werden Sie von von Australien bis Japan springen und dabei ein paar interessante Dinge entdecken (und, falls Sie Ihr Datenvolumen bezahlen müssen, den nächsten Monat nicht mehr Netsurfen).

3. Durch Suchen. Ähnlich wie bei Gopher gibt es etliche Server, die mit Suchmaschinen einen Index vieler, vieler WWW-Server anlegen. In diesem Index kann man dann nach Stichworten suchen. Im Anhang sind einige Suchsysteme aufgelistet.

Oft hat man schon eine recht große Anzahl an Bildschirmen und WWW-Schritten hinter sich, bis man an der gewünschten Stelle oder interessanter Information angekommen ist. Um sich einen relativ langen oder umständlichen Weg bis zu dieser Stelle ein zweites Mal zu ersparen, kann man solche Stellen im WWW in der persönlichen 'Hotlist' eintragen.

Ein weiteres Merkmal des WWW ist die Schreiboption. Damit ist es möglich, Formulare, z. B. Bestellscheine von Bibliotheken oder Anmeldungen für Konferenzen, auszufüllen und abzuschicken. Diese Formulare werden dann von Programmen auf dem Server-Rechner bearbeitet. Diese schicken dann die Antwort wieder als WWW-Dokument zurück.

Was ist ein URL?

URL ist die Abkürzung für 'Uniform Resource Locator' und wird im Netz verwendet, um Informationen vollständig zu bezeichnen. Mit einem URL wird nicht nur eine Datei und das zugehörige Verzeichnis, sondern auch der Rechner festgehalten, auf dem sie zu finden ist. Nachdem es im Internet verschiedene Dienste (z. B. FTP, Gopher, WWW) und somit verschiedene Protokolle gibt, wird schließlich noch die Zugriffsmethode festgehalten. Die allgemeine Syntax eines URL lautet also:

Protokoll://Rechneradresse:Port/Dateipfad/Dateiname

Ein URL besteht also aus vier Teilen, wobei nicht immer alle Teile aufgeführt werden müssen (meist ist z. B. keine Portangabe nötig). Beim Gopher-Protokoll wird statt Pfad- und Dateiname der Menütyp (01 fürs Startmenü) und ein Pfad angegeben. Das Protokoll gibt an, welcher Dienst genutzt werden soll, hier sind gebräuchlich:

  • ftp - Dateitransfer mittels (anonymen) FTP
    z. B. ftp://ftp.microsoft.com/pub/drivers/mouse/mouse.sys

  • gopher - Informationsrecherche auf einen Gopher-Server
    z. B. gopher://gopher.dingsda.com

  • news - Lesen und Schreiben von News
    z. B. news://news.lrz-muenchen.de/lrz.misc

  • http - Lesen von WWW-Seiten (http HyperText Transport Protocol)
    z. B. http://lx-lbs.e-technik.fh-muenchen.de/index.html

  • mailto - Adresse für E-Mail
    z. B. mailto:plate@e-technik.fh-muenchen.de

Die Portangabe hat einen sehr technischen Hintergrund. Um die einzelnen Dienste zu unterscheiden, wird beim TCP/IP-Protokoll (vereinfacht gesagt) jedem Dienst eine Nummer zugewiesen, eben die Port-Nummer. Es gibt allgemein festgelegte Ports, z. B. 80 für das http-Protokoll. Solche Standard-Ports müssen nicht angegeben werden. Man kann aber auch unbelegte Portnummern verwenden, beispielsweise um einen modifizierten WWW-Dienst anzubieten. In diesem Fall muß dann die Portnummer angegeben werden.

Sie sehen, ein URL ist ein nützliches Instrument, um Informationsquellen im Netz eindeutig zu bezeichnen. Inzwischen wird die Form der URL-Schreibweise nicht nur in WWW-Dokumenten, sonder auch ganz allgemein verwendet, um auf eine Ressource hinzuweisen, z. B. in einer E-Mail.

Spam-Server "Grum" abgeschaltet

Für alle die sich schon immer über zuviel Spam im Postfach geärgert haben gibt es eine gute...

TYPO3 Version 4.7 verfügbar

Die finalen Version des TYPO3 CMS Version 4.7 ist veröffentlicht worden. In TYPO3 4.7 wurde...

Schleusingen jetzt mit UTMS versorgt

In Schleusingen ab sofort mit bis zu 42,2 Megabit pro Sekunde im Internet surfen....

neuer RC TYPO3 4.7 veröffentlicht

Der neue Release-Kandidat 2 von TYPO3 4.7 wartet mit einer Vielzahl neuer Funktionen auf, außerdem...

TYPO3 4.4.12, 4.5.8 und 4.6.1 sind online

Heute wurde bekannt gegeben, dass ab sofort TYPO3 4.4.12, 4.5.8 und 4.6.1 zur Verfügung stehen. Es...

Das Hennebergische Gymnasium Schleusingen hat eine neue Website !

Nach langen Wochen der Erstellung und Redaktionsschulung ist die neue Website www.gym-schleusingen...