Perbezaan Antara GZIP dan BZIP2 Perbezaan Antara

Anonim

GZIP vs BZIP2

GNU zip (juga dikenali sebagai GZIP) adalah aplikasi perisian dengan tujuan untuk memampatkan fail. Ia pada mulanya bertujuan untuk menggantikan program kompres yang digunakan pada sistem Unix awal - untuk digunakan dalam Projek GNU (projek perisian percuma).

BZIP2 adalah algoritma pemampatan data lossless sumber - pada asasnya, algoritma mampatan data kelas yang membolehkan data asal fail dimampatkan untuk sepenuhnya direkonstruksikan dari data termampat.

GZIP didasarkan pada algoritma yang dikenali sebagai DEFLATE. Ini juga merupakan algoritma mampatan data lossless. Ia menggunakan kedua-dua algoritma LZ77 dan pengekodan Huffman. Pada asasnya, GZIP merujuk kepada format fail nama yang sama. Format ini adalah tajuk 10-bait yang mengandungi nombor sihir (yang bermaksud nilai berangka atau teks yang tidak pernah berubah dan digunakan untuk menandakan format atau protokol fail, nilai berangka yang tidak dinamakan yang tidak pernah berubah, atau nilai yang berbeza yang tidak dapat disalah tafsir untuk apa-apa lagi), tajuk tambahan yang mungkin atau mungkin tidak semestinya diperlukan (nama fail asli, sebagai contoh), sebuah badan yang mengandungi muatan yang dikompresi DEFLATE (iaitu data yang diarahkan oleh pengepala), dan satu footer 8-byte yang mengandungi pemeriksaan CRC-32, serta panjang sebenar data tidak terkompresi yang asal.

Terdapat pelbagai teknik pemampatan yang menggunakan format BZIP2, yang disusun di atas satu sama lain dalam beberapa lapisan. Mereka berlaku dalam susunan yang sangat tersendiri: Pengekodan jangka panjang (iaitu mana-mana urutan empat hingga 255 simbol pendua yang digantikan oleh empat simbol pertama, dan panjang pengekodan yang diulang antara 0 dan 251), Transformer Burrows-Wheeler (yang merupakan jenis blok boleh ubah yang menjadikan teras BZIP2), Pindah ke hadapan (meninggalkan saiz blok yang diproses tidak berubah), Pengekodan jangka panjang (yang terdiri daripada simbol panjang simbol - biasanya nol - yang sentiasa ulangi dalam output, dan digantikan oleh kedua-dua simbol dan urutan dua kod), pengekodan Huffman (yang merupakan proses yang menggantikan simbol panjang tetap dari 8-bit byte dengan menukar kod panjang), Multiple Hoffman coding (yang terdiri daripada pelbagai saiz Hoffman saiz yang sama), pengekodan asas Unary 1, pengekodan Delta, dan pelbagai bit Sparse.

Ringkasan:

1. GZIP adalah aplikasi percuma yang digunakan untuk memampatkan fail; BZIP2 adalah algoritma pemampatan data lossless sumber yang memungkinkan untuk mendapatkan semula data asal fail dimampatkan.

2. GZIP terdiri daripada header 10-byte, header pilihan, badan, dan footer 8-byte; BZIP2 terdiri daripada tidak kurang daripada sembilan lapisan teknik pemampatan.