Archiver sind Programme, die Informationen in Dateien komprimieren können. Moderne Archivierungsprogramme ermöglichen es Ihnen, mehrere Dateien zu einem Archiv zusammenzufassen und den Inhalt solcher Archive anzuzeigen. Die Größe des mit ihrer Hilfe erstellten Archivs ist viel kleiner als die Größe der Originaldatei.
Anleitung
Schritt 1
Das allgemeine Funktionsprinzip der meisten Archiver basiert auf einem Algorithmus, der in den 80er Jahren des letzten Jahrhunderts von den Forschern A. Lampel und J. Ziv entwickelt wurde. Der von Ziv und Lampel erstellte Algorithmus ermöglicht es, doppelten Code in einer Datei zu berechnen und so deren Größe zu reduzieren. Dazu wird aus Datensequenzen ein Wörterbuch zusammengestellt. Der Binärcode der Datei enthält beispielsweise die folgende Kombination: 10111011101110110011. Es ist leicht zu erkennen, dass der Code 1011 darin mehrmals wiederholt wird. Der Archivierer erkennt einen solchen Code und schreibt ihn nur einmal in das Archiv und ersetzt ihn beim Entpacken wieder an den erforderlichen Stellen in der Datei.
Schritt 2
Wie gut der Archiver die Datei komprimiert, hängt von der Größe des Quellwörterbuchs ab. Wenn das Wörterbuch zu groß ist, wirkt sich dies auf die Größe des Archivs aus. Wenn die Größe des Wörterbuchs zu klein ist, können Fehler im erstellten Archiv auftreten. Sie können die Komprimierungsrate einer Datei durch Entropiecodierung (die sogenannte Huffman-Methode) erhöhen. Bei der Entropiecodierung werden sich wiederholende binäre Chunks mit einem Shortcode geschrieben. In modernen Archivern wird die Entropiekodierung als zusätzliche Kodierungsmethode verwendet.
Schritt 3
Auf Unix-Systemen ist gzip der beliebteste Archivierer. Dieser Archiver komprimiert Daten verlustfrei und basiert auf dem Deflate-Algorithmus. Die Komprimierung von Dateien erfolgt hier auf zwei Arten - zuerst werden doppelte Codeteile ersetzt, und dann werden die darin enthaltenen Zeichen mit der Huffman-Methode durch neue Zeichen ersetzt. Archiver für Unix-Systeme haben eine Reihe von Nachteilen. Sie richten sich in erster Linie an Archive, die aus vielen Dateien bestehen, daher ist das Entpacken einer einzelnen Datei schwierig. Dies liegt daran, dass Unix-Archivierer ein Archiv als kontinuierliches Array aller darin gepackten Dateien betrachten. Das Archiv wird auf der Grundlage der in jeder Datei enthaltenen Informationen gebildet.
Schritt 4
Auf Windows-Systemen sind solche Archivierungsprogramme wie WinZip, 7-zip und WinRAR üblich. Im Gegensatz zu Unix-Systemen konzentrieren sich diese Archiver darauf, sowohl mit einzelnen Dateien als auch mit fortlaufenden Archiven zu arbeiten, die aus vielen Dateien bestehen. Die meisten modernen Windows-Archiver "verstehen" viele Archivformate, unterstützen Verschlüsselung und sind in der Lage, sehr große Dateien zu komprimieren (zum Beispiel beträgt die maximale Dateigröße für den WinRAR-Archiver mehr als acht Milliarden Gigabyte).