Kompression unter Linux

Aus dem IServ-Wiki
Version vom 3. Januar 2007, 00:05 Uhr von Roland Hieber (Diskussion | Beiträge)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Unter Linux gibt es neben den von Windows bekannten Kompressionsformaten Icon Wikipedia De.gifZIP und Icon Wikipedia De.gifRAR auch noch eine weitere Anzahl Archiv- und Kompressionsprogramme. Hier sind vor allen Icon Wikipedia De.giftar, Icon Wikipedia De.gifGNU zip und Icon Wikipedia De.gifbzip2 zu nennen, in letzter Zeit ist auch verstärkt Icon Wikipedia De.gif7z anzutreffen, das eine sehr große Kompressionsrate ermöglicht.

Bei all diesen Programmen ist grundsätzlich eine Einteilung in Archivprogramme und Kompressionsprogramme vorzunehmen: Archivprogramme dienen in erster Linie dazu, mehrere Dateien in einer einzigen Datei zusammenzufassen (bspw. für ein Backup), während Kompressionsprogramme in erster Linie die Dateigröße einer Datei verringern sollen.

{{Wichtig| In den hier aufgeführten Beispielen werden nur Grundlagen erläutert. Für weitere Informationen genügt ein Blick in die Icon Wikipedia De.gifManpage (man befehl) oder befehl --help

Inhaltsverzeichnis

GNU zip

GNU Zip ist ein reines Kompressionsprogramm, das heißt, es kann nur eine einzelne Datei damit komprimiert werden. Diese Dateien werden dadurch gekennzeichnet, dass die Endung .gz an den Dateinamen angehängt wird, so wird aus datei.txt etwa datei.txt.gz. GNU zip wird oft in Kombination mit tar (s. u.) verwendet, um mehrere Dateien zu komprimieren. Das Kommando zum Komprimieren lautet gzip, das zum Entpacken gunzip. Die meisten Editoren (z.B. vi) können aber auch GNU zip-komprimierte Dateien lesen und schreiben (z.B. vi datei.txt.gz).

Beispiele:

  • gzip datei.txt komprimiert die Datei datei.txt und speichert sie unter datei.txt.gz. Zu beachten ist, dass die Datei datei.txt nachher gelöscht wird, sodass nur noch die komprimierte Version existiert!
  • gunzip datei.txt.gz entpackt die Datei datei.txt.gz. Darin ist die Datei namens datei.txt enthalten, wie man am Dateinamen erkennen kann. Diesmal wird die Datei datei.txt.gz nachher gelöscht, sodass nur die unkomprimierte Version der Datei existiert.

bzip2

bzip2 ermöglicht eine effizientere Kompression der Daten als mit GNU zip und ZIP, ist aber dementsprechend auch zeitaufwändiger. Ebenso wie GNU zip ist es ein reines Kompressionsprogramm, kann also nur einzelne Dateien komprimieren. Die Handhabung gleicht weitgehend GNU zip; die komprimierten Dateien sind an der Endung bz oder bz2 zu erkennen.

Beispiele:

  • bzip2 datei.txt komprimiert die Datei datei.txt und speichert sie unter datei.txt.bz2. Zu beachten ist, dass die Datei datei.txt nachher gelöscht wird, sodass nur noch die komprimierte Version existiert!
  • bunzip2 datei.txt.bz2 entpackt die Datei datei.txt.bz2. Darin ist die Datei namens datei.txt enthalten, wie man am Dateinamen erkennen kann. Diesmal wird die Datei datei.txt.bz2 nachher gelöscht, sodass nur die unkomprimierte Version der Datei existiert.

ZIP

Linux kommt auch mit dem Windows-Standard-Format ZIP zurecht. ZIP verbindet ein Kompressions- mit einem Archivprogramm, es können also mehrere Dateien in einem Archiv unter Platzersparnis gespeichert werden. Dem entsprechend kann ZIP auch Pfadinformationen speichern, sodass die Kompression eines gesamten Verzeichnisses möglich ist. ZIP-Dateien werden auf der Konsole mit dem Befehl unzip, gefolgt vom Dateinamen, entpackt. Das Kommando zip erstellt dem entsprechend ZIP-Archive.

Beispiele:

  • unzip archive.zip entpackt das Archiv mit dem Namen archive.zip.
  • unzip file.zip -d /opt/ entpackt das Archiv mit dem Namen file.zip ins Verzeichnis /opt, sofern man dort Schreibrechte besitzt.
  • zip source.zip *.c *.h erstellt ein Archiv namens source.zip, das alle Dateien im aktuellen Verzeichnis enthält, die auf .c oder .h enden.

tar

tar ist im Unterschied zu allen oben genannten Werkzeugen ein reines Archivierungsprogramm. Es fasst mehrere Dateien in einer einzigen Datei zusammen, nimmt jedoch keine Kompression vor. Dem entsprechend ist es auch möglich, Pfadangaben im Archiv zu speichern, sodass ganze Verzeichnisse archiviert werden können. Um trotzdem eine Kompression zu erzielen, wird tar meist in Verbindung mit GNU zip (s. o.) oder bzip2 (s. o.) verwendet: die Dateien werden erst mit tar zusammengefasst, dann wird das entstehende Archiv durch GNU zip bzw. bzip2 komprimiert. tar arbeitet dabei effizient mit diesen beiden Kompressionsprogrammen zusammen, sodass ein Kommandoaufruf genügt. Die Archivdateien sind an den Endungen .tar.gz oder .tgz (für Kompression mit GNU zip) und .tar.bz bzw. .tar.bz2 oder .tbz (für Kompression mit bzip2) zu erkennen. Wenn keine Kompression vorgenommen wird, tragen die Archive nur die Endung .tar.

Beispiele:

  • tar czf source.tar.gz *.c *.h erstellt das Archiv source.tar.gz, das alle Dateien mit den Endungen .c und .h enthält, und komprimiert dieses Archiv mit GNU zip. Die Buchstaben bedeuten:
    • c für create, also das Erstellen eines Archivs,
    • z für die zusätzliche Kompression mit GNU zip,
    • f für die Angabe eines Dateinamens, unter dem das Archiv erstellt werden soll.
  • tar jzf source.tar.bz2 *.c *.h erstellt dem entsprechend das selbe Archiv wie das obige Kommando; j teilt hierbei dem Programm mit, dass eine Kompression mit bzip2 gewünscht wird.
  • tar xzf source.tar.gz packt das Archiv source.tar.gz aus. Dabei wird erst die komprimierte Datei mit GNU zip entpackt (dazu der Schalter z). Anschließend wird das in der .gz-Datei enthaltene tar-Archiv entpackt. Das x steht hier für extract, also das Auspacken eines Archivs. Dabei werden auch die Pfadinformationen berücksichtigt, die im Archiv gespeichert sind, die benötigten Verzeichnisse werden ggf. erstellt und vorhandene Dateien überschrieben!
  • tar xjf source.tar.bz2 macht das gleiche mit einem bzip2-komprimierten tar-Archiv (hierfür wieder der Schalter j).
  • tar tzf source.tgz zeigt die Dateien an, die im GNU zip-komprimierten Archiv source.tgz enthalten sind.
  • Entsprechend wird hier wieder tar tjf source.tbz für bzip2-komprimierte Archive verwendet.

Meist werden jedoch nicht einzelne Dateien sondern ein ganzes Verzeichnis eingepackt. Dies hat den Vorteil, dass man beim Entpacken nicht erst ein Verzeichnis erstellen muss, indem man die Dateien dann entpackt. Beispiel:

  • tar czf source.tgz my-program-v1.0/ packt alle Dateien und Unterverzeichnisse im Ordner my-program-v1.0 zusammen in ein GNU zip-komprimiertes Archiv. Die Verzeichnisstruktur wird dabei vollständig beibehalten.
  • Wenn das oben erstellte Archiv jetzt wieder entpackt wird, wird erst der Ordner my-program-v1.0 im aktuellen Verzeichnis erstellt und dann darin die gesamte Verzeichnisstruktur entpackt.

7-Zip

7-Zip fasst, ähnlich wie Icon Wikipedia De.gifWinRAR oder Icon Wikipedia De.gifWinZIP unter Windows, mehrere Kompressions- und Archivprogramme in einem einzigen Werkzeug zusammen. Es bringt ein eigenes Format mit, das sich 7z nennt und sehr hohe Kompression ermöglicht, verarbeitet jedoch auch alle gängigen Formate (zur Zeit: ZIP, GNU zip, tar, bzip2, Z, CPIO, ARJ, Microsoft CAB, RPM, LZH, CHM, RPM- und deb-Pakete und ISO-Images; RAR steckt jedoch noch in den Kinderschuhen…) und stellt dabei automatisch das jeweilige Format der Datei fest. 7-Zip kann jedoch nur 7z-Archive erstellen, bei anderen Formaten ist nur das Hinzufügen von Dateien zu Archiven, das Aktualisieren von Dateien in Archiven und das Entpacken von Archiven möglich.

Beispiele:

  • 7z a file.7z * erstellt ein 7z-Archiv namens file.7z und fügt alle Dateien im aktuellen Ordner hinzu (a für add)
  • 7z x file.gz entpackt das Archiv file.gz.
  • 7z x file.tar: ebenso lässt sich jedes andere Archiv entpacken.
  • 7z a file.tar *.c *.h fügt alle Dateien, die auf .c oder .h enden, zum angegebenen Archiv hinzu. Hierbei ist zu beachten, dass das angegebene Archiv die Archivierung mehrerer Dateien unterstützen muss, wenn mehrere Dateien zum Aktualisieren angegeben werden (wenn das Archiv z. B. ein GNU zip-Archiv ist, können nicht mehrere Dateien enthalten sein – dann gibt man die Datei an, die im Archiv komprimiert ist).
  • 7z u file.tar *.c aktualisiert alle Dateien, die auf .c enden, im angegebenen Archiv und fügt sie ggf. hinzu (in Bezug auf mehrere Dateien gilt das gleiche wie oben).