# Das Internet

Das wohlüberlegte Treffen von Entscheidungen folgt einer alten Tradition: Zuerst raten und danach die anderen dafür verantwortlich machen.
Scott Adams, Schöpfer von »Dilbert«

# Entstehung

Das US-Verteidigungsministerium gab Ende der 50er Jahre die Initialzündung zur Entwicklung des heutigen Internets. Computernetze wurden damals mittels Kopfstationen zentral verwaltet. Wäre im Falle eines Atomschlags der UdSSR eine dieser Kopfstationen ausfallen, hätte das den Zusammenbruch des angeschlossenen Netzwerks zur Folge gehabt. Die Lösung des Problems war eine dezentrale Struktur. Der Zusammenbruch eines Teilsystems hätte dann nicht die Unterbrechung des gesamten Kommunikationssystems bedeutet. Das Ziel war es nun, ein Übertragungsprotokoll zu entwickeln, das unabhängig vom Übertragungsmedium ist, die Zusammenarbeit mit verschiedenen Rechnersystemen ermöglicht und gegenüber Verbindungsstörungen äußerst robust ist.

Erst im Jahre 1969 konnte diese Idee erfolgreich umgesetzt werden. Zwischen vier Rechnern der University of Utah, der University of California Los Angeles, der University of California Santa Barbara und der Stanford University wurde ein Netzwerk aufgebaut, das all diese Voraussetzungen erfüllte und unter dem Namen Arpanet bekannt wurde. Das Revolutionäre war die Art der Datenübermittlung. Der Absender zerlegte größere Datenmengen in kleinere Datenpakete und sandte diese zum Empfänger. Die Pakete suchten sich unabhängig voneinander den Weg zum Empfänger, wodurch eine direkte physikalische Datenverbindung zwischen Sender und Empfänger nicht mehr nötig war.

In den nachfolgenden Jahren wurden immer mehr Computer an dieses Netzwerk angeschlossen. Der wachsende Umfang deckte Schwächen im NCP-Kommunikationsprotokoll auf, das 1983 durch das effizientere TCP/IP-Protokoll ersetzt wurde. Immer mehr Wissenschaftler verschickten elektronische Nachrichten über das Netz und nutzten die Kapazitäten der angeschlossenen Rechner, woraufhin sich das US-Verteidigungsministerium 1985 aus der Finanzierung des Arpanets zurückzog und das Milnet aufbaute. Fortan übernahm die National Science Foundation (NSF) das Arpanet und benannte es in NSFnet um.

Anfang der 90er Jahre wandelte sich das NSFnet durch die Entwicklung von HTML durch Sir Tim Berners-Lee vom Wissenschaftsnetzwerk zum World Wide Web und löste die kryptischen Befehlsfolgen der Datenkommunikation ab. Tim Berners-Lee war seit 1984 Ingenieur für Echtzeit-Software am CERN-Institut in Genf und schlug 1989 das globale Projekt Hypertext vor, das er 1990 in World Wide Web umtaufte. Er entwickelte den ersten Webserver und Client und legte die Spezifikation von URLs, HTTP und HTML fest. Das Ziel dieses Projekts war die Strukturierung und Darstellung wissenschaftlicher Daten mit der Möglichkeit, Querverweise auf andere Dokumente zu legen und diese sofort abrufen zu können.

# So funktioniert das Internet

Das Internet in seiner heutigen Form ist nicht mehr zu vergleichen mit den Anfängen in den 1950er. Die einfachen Verbindungen für geringe Datenübertragungen sind hoch redundanten und performanten Glasfaserleitungen gewichen, die quer durch die drei großen Ozeane verlegt sind und Nutzern auf verschiedenen Kontinenten eine augenblickliche Kommunikation ermöglichen. Der Anwender bekommt von der dahinter stehenden Technik wenig mit. Er gibt lediglich die gewünschte Internetadresse in den Browser ein und erhält kurze Zeit darauf die entsprechende Webseite angezeigt.

# Struktur

Kernstück des Internets sind Backbone (dt. Rückgrat) getaufte Systeme, über die der gesamte Internetverkehr geleitet wird. Betrieben werden die Backbones durch Carrier, die teils international teils national agieren. Allein in Deutschland sind über 110 Carrier registriert. Untereinander sind die Backbones mit Glasfaserleitungen redundant verbunden. Fallen ein oder mehrere Backbones aus, wird die Datenkommunikation einfach über andere Backbones geleitet. Dieses Netz aus Backbones wird Kernnetz genannt.

Internet Service Provider wie Arcor, Freenet oder AOL verfügen zwar über eigene Backbones, nutzen jedoch auch Backbones von anderen Carriern um Ihre Reichweite und Flächendeckung zu erhöhen. Während die ISPs in den Städten in der Regel die eigenen Backbones nutzen können, wird in ländlichen Gegenden häufig auf das Kernnetz der Telekom zurückgegriffen.

Der Zugriff auf die Backbones erfolgt für Kunden nicht direkt sondern über Zugangsnetze (engl. access networks). Der Zugang kann auf zwei verschiedene Arten erfolgen: Per Einwahl oder per dauerhafter Verbindung. Letztere Verbindungsart die auch als Standleitung bekannt ist, macht lediglich einen kleinen Teil aller Zugänge aus. Primär liegt dies an den hohen Kosten für eine Standleitung, weshalb in der Regel nur Firmen über eine dauerhafte Verbindung zum Internet verfügen. Einwahlverbindungen finden sich hingegen im Großteil aller privaten Haushalte. Probleme beim Zugriff auf das Internet sind häufig auf Störungen in den Zugangsnetzen zurückzuführen.

Lokale Netzwerke – auch LAN genannt – sind räumlich begrenzt und fassen alle Netzwerke in einem Unternehmen, Büro oder privaten Wohnungen zusammen. Bereits zwei miteinander verbundene Computer gelten als Netzwerk.

Die Verbindung zwischen lokalem Netzwerk und Zugangsnetz kann auf verschiedene Arten erfolgen. Die in Deutschland am häufigsten vorzufindenden Verbindungsmittel sind ISDN und DSL. In einigen Fällen kommen auch noch analoge Modemverbindungen zum Einsatz. Weit seltener wird die mobile Kommunikation über UMTS oder per Satellit eingesetzt. Gerade UMTS-Verbindungen sind zwar schnell, aber auch kostenintensiv. Die neueste Variante ist der Internetzugriff via Fernsehkabel.

Struktur des Internets Abbildung 2.1: Struktur des Internets

Die Zeichnung in Abbildung 2.1 veranschaulicht – auf vereinfachte Art - die Struktur des Internets. Der Kreis mit dem weißen Hintergrund stellt das Kernnetz bestehend aus mehreren, redundant verbundenen Backbones dar. Die dunkelgrau schraffierten Kreise sind Zugangsnetze, die ebenfalls mehrfach per dauerhafter Verbindung an das Kernnetz angeschlossen sind. Die Kreise mit hellgrauer Schraffur sind hingegen lokale Netzwerke, die aus einem oder mehreren Rechnern bestehen können. Die Anbindung an die Zugangsnetze erfolgt entweder per Einwahlverbindung (gestrichelte Linien) oder per Standardleitung (durchgezogene Linien).

# Kommunikation

Über das Internet werden verschiedenste Informationen versandt z.B. beim Aufruf einer Webseite oder dem Versand einer Email. Das Medium in der die Kommunikation über das Internet erfolgt ist TCP/IP. TCP steht für transport control protocol und dieses Protokoll kümmert sich um den Transport von Daten über das Internet. IP steht für internet protocol und sorgt für die korrekte Adressierung der Daten. TCP/IP ist vergleichbar mit dem Medium Brief zur Kommunikation mit der Großmutter oder der Bank.

Während ein Brief in Deutsch, Englisch, Französisch oder einer anderen der vielen Sprachen verfasst sein kann, gilt dies auch für die Kommunikation im Internet. Rufen Sie z.B. eine einfache ungeschützte Webseite auf, wird Sie Sprache – bei der Kommunikation zwischen Computern wird sie Protokoll genannt - HTTP ist die Abkürzung für hypertext transfer protocolHTTP verwendet. Der Emailversand wiederum erfolgt mit Hilfe des Protokolls SMTP.

Schematische Darstellung einer HTTP-Verbindung

Abbildung 2.2: Schematische Darstellung einer HTTP-Verbindung

Gibt ein Anwender in den Browser eine Internetadresse z.B. http://de.wikipedia.org/wiki/Rosen ein, kontaktiert der Browser den entsprechenden Server indem er eine Verbindung aufbaut und die gewünschte Seite anfordert. Der Server überprüft die Anfrage, bereitet die Seite zur Ausgabe an den Browser auf und sendet diese an den Clientrechner zurück. Anschließend wird die Verbindung wieder getrennt. Erst wenn der Browser eine weitere Anfrage stellt, z.B. beim Laden von Bildern oder einer anderen Seite, wird eine neue Verbindung aufgebaut, die Daten übermittelt und die Verbindung getrennt. Diese vier Schritte „Verbindungsaufbau“, „Anfrage“, „Antwort“ und „Verbindungstrennung“ werden solange durchgeführt bis die Seite vollständig im Browser dargestellt werden kann.

Startseite der Internet-Suchmaschine Google

Abbildung 2.3: Startseite der Internet-Suchmaschine Google

Beispiel: Beim Aufruf der Webseite www.google.de/index.html im Webbrowser stellt der Webbrowser eine Anfrage an den Server www.google.de und verlangt nach dem HTML-Dokument index.html. Der Server formuliert die Antwort und sendet die Daten des HTML-Dokuments, sprich den Inhalt der Datei, an den Browser. Der Browser wertet das HTML-Dokument aus und stellt weitere Anfragen an den Webserver. Denn im HTML-Dokument ist festgelegt, dass noch vier Bilder angezeigt werden sollen (das Google-Logo oben auf der Webseite besteht aus vier Teilen). Er stellt nun weitere vier Anfragen in denen er die einzelnen Grafiken anfordert, aus denen sich auf der Webseite das Google-Logo zusammensetzt. Der Ladevorgang der Seite ist abgeschlossen und der Webbrowser kann diese abschließend dem Nutzer anzeigen.

Schematische Darstellung des Ladevorgangs der Google-Startseite Abbildung 2.4: Schematische Darstellung des Ladevorgangs der Google-Startseite

# Dienste des Internets

Das Internet beschränkt sich aber nicht nur auf die Bereitstellung und das Abrufen von HTML-Dokumenten. Es bietet z. B. die Möglichkeit, Emails zu versenden und zu empfangen, nach bestimmten Begriffen zu suchen und Daten von einem auf den anderen Rechner zu transferieren bzw. zu kopieren.

# Email

Auf Emails ist im heutigen Kommunikationswesen kaum noch zu verzichten. Längst werden täglich mehr Emails als herkömmliche Briefe verschickt, immerhin ist diese Art der Kommunikation wesentlich schneller und verzeiht es auch, wenn mal nur ein oder zwei Zeilen geschrieben werden.

Am 25. Januar 2002 feierte die Email ihren 30. Geburtstag. Der Internet-Pionier Raymond S. Tomlinson gilt als Erfinder der elektronischen Post und versandte und empfing 1972 mit seinen beiden Programmen SNDMSG und READMAIL die erste Email über das Internet. Angeblich soll der Inhalt der ersten Email nicht besonders originell gewesen sein: QWERTYUIOP. Auf englischen Tastaturen entspricht dies der ersten Buchstabenreihe.

Wesentlich interessanter ist die Wahl des Trennzeichens, um eine eindeutige Adressierung zu ermöglichen: der Klammeraffe @. Heute zum Symbol der digitalen Generation (häufig auch als »Generation @« bezeichnet) geworden, stammt es aus dem Handel. So wurde das Zeichen für Kursangaben wie: »10 Eier à 50 Cent« verwendet. Das @-Zeichen ist die angloamerikanische Entsprechung des französischen a mit accent grave und bedeutet at. Ob Tomlinson das Zeichen wirklich nur durch puren Zufall wählte, ist nicht ganz klar, aber es passt besser als jedes andere Zeichen, da es den Adressaten von der Domäne trennt. So würde someone@bbn.com gesprochen »someone at bbn.com« lauten. Die Übersetzung: jemand bei bbn.com.

Von den damals üblichen Briefköpfen der Universitäten wurden die Felder einer heutigen Email übernommen: To, From, CC (carbon copy) und Subject. Das Feld To enthält den Empfänger, From den Absender, CC den Kopie- bzw. Durchschriftempfänger und Subject den Betreff der Email. Dazu kam dann noch BCC, das für »blind carbon copy« steht und übersetzt »verdeckter Kopieempfänger« bedeutet.

# FTP

Neben HTTP, das normalerweise für Seitenaufrufe verwendet wird, bietet das Internet auch die Möglichkeit, Daten in Form von Dateien zu transportieren. Über HTTP ist dies meistens nicht sehr komfortabel und wird auch nur sehr selten verwendet. FTP, das eine Abkürzung für File Transfer Protocol ist, schließt diese Lücke.

Mit einem so genannten FTP-Client können Sie sich auf dem Server einloggen und beliebig in den freigeschalteten Verzeichnissen navigieren, einzelne Dateien oder ganze Verzeichnisse kopieren, löschen, umbenennen oder verschieben. Dabei unterteilen sich die FTP-Clients in zwei Kategorien: grafische und Kommandozeilen-Clients. Ein Kommandozeilen-Client ist den meisten Windows-Betriebssystemen bereits beigelegt und lässt sich über StartAusführen...ftp.exe und Enter aufrufen. Sie können jedoch auch einen beliebigen anderen Client verwenden. Grafische FTP-Clients gibt es im Internet mittlerweile mehr als genug: für UNIX/Linux, Windows, Solaris etc.

Bevor Sie auf dem Server arbeiten können, müssen Sie sich entweder anonym anmelden (Sie haben dann oft weniger Rechte, auf Verzeichnisse zuzugreifen) oder mit einem Benutzernamen und einem Passwort. Besonders beliebt ist FTP, da sich schon einmal begonnene Transfers wieder aufnehmen lassen, und die Übertragung von Dateien wesentlich stabiler als mittels HTTP ist, denn FTP verwendet dabei zwei getrennte Kanäle. Ein Kanal überträgt die Kommandos und der andere Kanal die Daten. Bei HTTP wird alles über einen Kanal übertragen und ist somit wesentlich anfälliger für Fehler während der Übertragung.

# Telnet

Telnet ist eine Anwendung, die Ihnen den Fernzugriff auf andere Computer ermöglicht. Dies geschieht konsolenbasiert. Je nachdem, welche Zugriffsrechte Ihnen eingeräumt worden sind, können Sie nun unterschiedliche Kommandos an den Server absetzen. Ihr Rechner fungiert in diesem Moment also als eine Art Terminal.

So können Sie mit Telnet eine so genannte Shell-Session auf dem Server starten. Eine solche Session simuliert Ihnen die Anwendungsoberfläche des Webservers auf Ihrem Rechner zu Hause. Der Client überträgt Ihre Tastatureingaben an den Server und empfängt die Textausgabe des Servers, um sie auf Ihrem Rechner wiederum auszugeben. Dadurch eignet sich Telnet optimal, um einen Webserver zu pflegen, der nicht bei Ihnen zu Hause steht.

Sowohl unter Linux als auch unter Windows steht standardmäßig ein Telnet-Client zur Verfügung. In Windows können Sie diesen mit StartAusführen...telnet.exe und Enter öffnen. Unter UNIX/Linux reicht es aus, in einer Konsole telnet, gefolgt von der IP-Adresse des Servers anzugeben.

Jedoch sind Verbindungen mit Telnet nicht sicher, da alle Kommandos und Daten im Klartext übertragen werden, so auch Anmeldeinformationen wie Ihr Benutzername und Ihr Passwort. Verwenden Sie stattdessen also lieber SSH (secure shell). Ein empfehlenswerter SSH-Client ist Putty, den es sowohl für UNIX/Linux als auch für Windows gibt. Der Vorteil: Die übermittelten Daten werden verschlüsselt, so dass es für Hacker schwieriger wird, unbefugt an Benutzernamen oder Passwörter heranzukommen.

Putty-Webseite: http://www.chiark.greenend.org.uk/~sgtatham/putty/

# Whois

Whois ist ein Datenbankdienst, der Informationen über Domains, Email-Adressen und im Internet präsente Institutionen bereitstellt. So stellt jeder Domain-Registrar die entsprechenden Informationen zu den Domain-Eigentümern seiner Top-level-Domain bereit, und auch einige Universitäten bieten eine solche Datenbank an. Die Datenbanken werden jedoch nicht abgeglichen, was dazu führt, dass alle Datenbanken unterschiedliche Daten enthalten.

Viele dieser Datenbanken sind mittlerweile auch über eine grafische Oberfläche zu bedienen. Die Whois-Datenbank des Registrars für deutsche Top-level-Domains ist die DeNIC, und der Whois-Dienst ist über http://www.denic.de/servlet/Whois erreichbar.

Weitere Informationen über Adressierung und DNS finden Sie im Kapitel Adressierung.