लेख में जिप फ़ाइलों की 9 परतों का उल्लेख किया गया है, इसलिए यह शून्य के झुंड का एक साधारण मामला नहीं है। क्यों 9, प्रत्येक में 10 फाइलें क्यों?
सबसे पहले, विकिपीडिया लेख वर्तमान में 16 फ़ाइलों के साथ 5 परतों को कहता है। निश्चित नहीं है कि विसंगति कहां से आती है, लेकिन यह सब प्रासंगिक नहीं है। असली सवाल यह है कि पहली जगह में घोंसले के शिकार का उपयोग क्यों करें।
DEFLATE, ज़िप फाइलों के लिए एकमात्र समर्थित सहायक विधि * है, जिसका अधिकतम संपीड़न अनुपात 1032 है। इसे 1-3 बाइट्स के किसी भी दोहराए जाने वाले अनुक्रम के लिए asymptotically प्राप्त किया जा सकता है। कोई फर्क नहीं पड़ता कि आप एक ज़िप फ़ाइल में क्या करते हैं, जब तक कि यह केवल DEFLATE का उपयोग कर रहा है, अनपैक्ड आकार मूल ज़िप फ़ाइल के आकार का अधिकतम 1032 गुना होगा।
इसलिए, वास्तव में अपमानजनक संपीड़न अनुपात को प्राप्त करने के लिए नेस्टेड ज़िप फ़ाइलों का उपयोग करना आवश्यक है। यदि आपके पास संपीड़न की 2 परतें हैं, तो अधिकतम अनुपात 1032 ^ 2 = 1065024 हो जाता है। 3 के लिए, यह 1099104768 है, और इसी तरह। 42.zip में उपयोग की जाने वाली 5 परतों के लिए, सैद्धांतिक अधिकतम संपीड़न अनुपात 1170572956434432 है। जैसा कि आप देख सकते हैं, वास्तविक 42.zip उस स्तर से बहुत दूर है। इसका एक हिस्सा ज़िप प्रारूप का ओवरहेड है, और इसका हिस्सा यह है कि उन्होंने सिर्फ परवाह नहीं की।
अगर मुझे अनुमान लगाना था, तो मैं कहूंगा कि 42.zip का गठन केवल एक बड़ी खाली फ़ाइल बनाने के द्वारा किया गया था, और बार-बार इसे ज़िप करना और कॉपी करना। प्रारूप की सीमाओं को धक्का देने या संपीड़न या किसी भी चीज को अधिकतम करने का कोई प्रयास नहीं है - उन्होंने सिर्फ मनमाने ढंग से प्रति परत 16 प्रतियां लीं। बिंदु यह था कि बिना अधिक प्रयास के एक बड़ा पेलोड बनाया जाए।
नोट: अन्य संपीड़न प्रारूप, जैसे bzip2, बहुत अधिक, बहुत अधिक अधिकतम संपीड़न अनुपात प्रदान करते हैं। हालाँकि, अधिकांश जिप पार्सर उन्हें स्वीकार नहीं करते हैं।
PS यह एक ज़िप फ़ाइल बनाना संभव है जो खुद की एक प्रति (एक क्वीन) को अनज़िप करेगा। आप एक ऐसी भी बना सकते हैं जो स्वयं की कई प्रतियों को खोल देती है। इसलिए, यदि आप किसी फ़ाइल को हमेशा के लिए पुनरावृत्ति करते हैं, तो अधिकतम संभव आकार अनंत है। एकमात्र सीमा यह है कि प्रत्येक पुनरावृत्ति पर यह अधिकतम 1032 तक बढ़ सकता है।
पीपीएस 1032 का आंकड़ा मानता है कि जिप में फाइल डेटा असंतुष्ट हैं। जिप फाइल फॉर्मेट का एक क्विकर्क यह है कि इसमें एक सेंट्रल डायरेक्टरी है जो आर्काइव और फाइल को फाइल डेटा में लिस्ट करती है। यदि आप एक ही डेटा की ओर इशारा करते हुए कई फ़ाइल प्रविष्टियाँ बनाते हैं, तो आप बिना किसी नेस्टिंग के भी बहुत अधिक कम्प्रेशन अनुपात प्राप्त कर सकते हैं, लेकिन ऐसी ज़िप फ़ाइल को पार्सर्स द्वारा अस्वीकार किए जाने की संभावना है।