Kompression unter Linux: Unterschied zwischen den Versionen

Aus dem IServ-Wiki
Zur Navigation springen Zur Suche springen
(überarbeitet)
K (Änderungen von Reverse22 (Diskussion) rückgängig gemacht und letzte Version von 134.169.135.170 wiederhergestellt)
 
(Eine dazwischenliegende Version von einem anderen Benutzer wird nicht angezeigt)
(kein Unterschied)

Aktuelle Version vom 4. Januar 2012, 11:10 Uhr

Unter Linux gibt es neben den von Windows bekannten Kompressionsformaten Icon Wikipedia De.gifZIP und Icon Wikipedia De.gifRAR auch noch eine weitere Anzahl Archiv- und Kompressionsprogramme. Hier sind vor allen Icon Wikipedia De.giftar, Icon Wikipedia De.gifgzip und Icon Wikipedia De.gifbzip2 zu nennen, in letzter Zeit ist auch verstärkt Icon Wikipedia De.gif7z anzutreffen, das eine sehr große Kompressionsrate ermöglicht.

Bei all diesen Programmen ist grundsätzlich eine Einteilung in Archivprogramme und Kompressionsprogramme vorzunehmen: Archivprogramme dienen in erster Linie dazu, mehrere Dateien in einer einzigen Datei zusammenzufassen (bspw. für ein Backup), während Kompressionsprogramme in erster Linie die Dateigröße einer Datei verringern sollen.

Information In den hier aufgeführten Beispielen werden nur Grundlagen erläutert. Für weitere Informationen genügt ein Blick in die Manpage (man befehl) oder befehl --help.

Inhaltsverzeichnis

gzip

gzip (abgekürzt für GNU zip) ist ein reines Kompressionsprogramm, das heißt, es kann nur eine einzelne Datei damit komprimiert werden. Diese Dateien werden dadurch gekennzeichnet, dass die Endung .gz an den Dateinamen angehängt wird, so wird aus datei.txt etwa datei.txt.gz. gzip wird oft in Kombination mit tar (s. u.) verwendet, um mehrere Dateien zu komprimieren. Das Kommando zum Komprimieren lautet gzip, das zum Entpacken gunzip. Die meisten Editoren (z.B. vi) können aber auch gzip-komprimierte Dateien lesen und schreiben (z.B. vi datei.txt.gz).

Beispiele:

befehl
gzip datei.txt

komprimiert die Datei datei.txt und speichert sie unter datei.txt.gz. Das unkomprimierte Original datei.txt wird anschließend automatisch gelöscht.

befehl
gunzip datei.txt.gz

entpackt die Datei datei.txt.gz. Darin ist die Datei namens datei.txt enthalten, wie man am Dateinamen erkennen kann. Das komprimierte Original datei.txt.gz wird anschließend automatisch gelöscht.

bzip2

bzip2 ermöglicht eine effizientere Kompression der Daten als mit gzip und ZIP, ist aber dementsprechend auch zeitaufwändiger. Ebenso wie gzip ist es ein reines Kompressionsprogramm, kann also nur einzelne Dateien komprimieren. Die Handhabung gleicht weitgehend gzip; die komprimierten Dateien sind an der Endung bz2 (selten auch bz) zu erkennen.

Beispiele:

befehl
bzip2 datei.txt

komprimiert die Datei datei.txt und speichert sie unter datei.txt.bz2. Das unkomprimierte Original datei.txt wird anschließend automatisch gelöscht.

befehl
bunzip2 datei.txt.bz2

entpackt die Datei datei.txt.bz2. Darin ist die Datei namens datei.txt enthalten, wie man am Dateinamen erkennen kann. Das komprimierte Original datei.txt.bz2 wird anschließend automatisch gelöscht.

ZIP

Linux kommt auch mit dem Windows-Standard-Format ZIP zurecht. ZIP verbindet ein Kompressions- mit einem Archivprogramm, es können also mehrere Dateien oder gesamte Verzeichnisse in einem Archiv gespeichert werden. ZIP-Dateien werden auf der Konsole mit dem Befehl unzip, gefolgt vom Dateinamen, entpackt. Das Kommando zip erstellt dem entsprechend ZIP-Archive.

Beispiele:

befehl
unzip archive.zip

entpackt das Archiv mit dem Namen archive.zip.

befehl
unzip file.zip -d /opt/

entpackt das Archiv mit dem Namen file.zip ins Verzeichnis /opt, sofern man dort Schreibrechte besitzt.

befehl
zip source.zip *.c *.h

erstellt ein Archiv namens source.zip, das alle Dateien im aktuellen Verzeichnis enthält, die auf .c oder .h enden.

tar

tar ist im Unterschied zu allen oben genannten Werkzeugen ein reines Archivierungsprogramm. Es fasst mehrere Dateien oder ganze Verzeichnisse in einer einzigen Datei zusammen, ohne diese zu komprimieren. Zur Kompression werden tar-Archive überlicherweise durch gzip (s. o.) oder bzip2 (s. o.) "gefiltert": die Dateien werden erst mit tar in einem Archiv zusammengefasst, dann wird das entstehende Archiv durch gzip bzw. bzip2 komprimiert.

tar arbeitet dabei effizient mit diesen beiden Kompressionsprogrammen zusammen, sodass ein Kommandoaufruf genügt, um ein komprimiertes Archiv zu erstellen. Die Archivdateien sind an den Endungen .tar.gz oder .tgz (für Kompression mit gzip) und .tar.bz bzw. .tar.bz2 oder .tbz (für Kompression mit bzip2) zu erkennen. Unkomprimierte tar-Archive haben die Endung .tar.

Beispiele:

befehl
tar czf source.tar.gz *.c *.h

erstellt das Archiv source.tar.gz, das alle Dateien mit den Endungen .c und .h enthält, und komprimiert dieses Archiv mit gzip. Die Buchstaben bedeuten:

  • c: create, also das Erstellen eines Archivs
  • z: g'zip, gzip-Filter verwenden
  • f: file, das Archiv ist eine Datei und kein Band
befehl
tar cjf source.tar.bz2 *.c *.h

wie oben; verwendet jedoch den bzip2-Filter anstatt dem gzip-Filter.

befehl
tar xzf source.tar.gz

entpackt das Archiv source.tar.gz. Dabei wird erst die komprimierte Datei mit gzip entpackt (Schalter z). Anschließend wird das in der .gz-Datei enthaltene tar-Archiv entpackt. Das x steht hier für extract, also das Auspacken eines Archivs. Dabei werden auch die Pfadinformationen berücksichtigt, die im Archiv gespeichert sind, die benötigten Verzeichnisse werden ggf. erstellt und vorhandene Dateien überschrieben.

befehl
tar xjf source.tar.bz2

macht das gleiche mit einem bzip2-komprimierten tar-Archiv (Schalter j).

befehl
tar tzf source.tgz

zeigt die Dateien an, die im gzip-komprimierten Archiv source.tgz enthalten sind.

befehl
tar tjf source.tbz

wird hier wieder entsprechend für bzip2-komprimierte Archive verwendet.


Will man nur tar-Archive erstellen bzw. entpacken, entfallen die Optionen zur Kompression:

befehl
tar xf file.tar *.c

packt alle Dateien mit der Endung .c in das unkomprimierte Archiv file.tar.

Meist werden jedoch nicht einzelne Dateien sondern ein ganzes Verzeichnis eingepackt. Dies hat den Vorteil, dass man beim Entpacken nicht erst ein Verzeichnis erstellen muss, indem man die Dateien dann entpackt. Beispiel:

befehl
tar czf source.tgz my-program-v1.0/

packt alle Dateien und Unterverzeichnisse im Ordner my-program-v1.0 zusammen in ein gzip-komprimiertes Archiv. Die Verzeichnisstruktur wird dabei vollständig beibehalten. Wenn das Archiv jetzt wieder entpackt wird, wird erst der Ordner my-program-v1.0 im aktuellen Verzeichnis erstellt und dann darin die gesamte Verzeichnisstruktur entpackt.

7-Zip

7-Zip fasst, ähnlich wie Icon Wikipedia De.gifWinRAR oder Icon Wikipedia De.gifWinZIP unter Windows, mehrere Kompressions- und Archivprogramme in einem einzigen Werkzeug zusammen. Es bringt ein eigenes Format mit, das sich 7z nennt und mit dem Icon Wikipedia De.gifLZMA-Algorithmus sehr hohe Kompressionraten erreicht (allerdings sehr zeitaufwendig), verarbeitet jedoch auch alle gängigen Formate (zur Zeit: ZIP, GNU zip, tar, bzip2, Z, CPIO, ARJ, Microsoft CAB, RPM, LZH, CHM, RPM- und deb-Pakete und ISO-Images; RAR steckt jedoch noch in den Kinderschuhen…) und stellt dabei automatisch das jeweilige Format der Datei fest. 7-Zip kann jedoch nur 7z-Archive erstellen, bei anderen Formaten ist nur das Hinzufügen/Aktualisieren von Dateien zu vorhandenen Archiven und das Entpacken möglich.

Beispiele:

befehl
7z a file.7z *

Erstellt ein 7zip-Archiv namens file.7z und fügt alle Dateien im aktuellen Ordner hinzu (a für add)

befehl
7z x file.gz

Entpackt das Archiv file.gz.

befehl
7z x file.tar

Entpackt ein tar-Archiv.

befehl
7z a file.tar *.c *.h

fügt alle Dateien, die auf .c oder .h enden, zum angegebenen Archiv hinzu. Hierbei ist zu beachten, dass das angegebene Archiv die Archivierung mehrerer Dateien unterstützen muss, wenn mehrere Dateien zum Aktualisieren angegeben werden (wenn das Archiv z. B. ein gzip-Archiv ist, können nicht mehrere Dateien enthalten sein – dann gibt man die Datei an, die im Archiv komprimiert ist).

befehl
7z u file.tar *.c

aktualisiert alle Dateien, die auf .c enden, im angegebenen Archiv und fügt sie ggf. hinzu (in Bezug auf mehrere Dateien gilt das gleiche wie oben).