मेरा मानना है कि आप LZ अनुकूली एल्गोरिदम के बारे में बात कर रहे हैं। जिप फाइल बनाने की प्रक्रिया में जो कुछ भी डुप्लिकेट हो रहा है, उसके कारण इसे अतिरेक नहीं कहा जाता है। शब्द से पता चलता है कि संपीड़न की यह विधि कैसे काम करती है।
समझाने के लिए, यहाँ एक उदाहरण है। मान लीजिए कि मेरे पास एक दस्तावेज है जिसमें वाक्यांश है:
It is what it is because that's what it is
अगर मैं इस वाक्यांश को अतिरेक के माध्यम से कम करना चाहता हूं, तो मैं सबसे पहले एक शब्दकोष बनाऊंगा जिसमें सभी शब्दों को दोहराया गया हो, जैसे
1it
2is
3what
और फिर मैं इस वाक्य को फिर से लिखूंगा
12312becausethats312
अगर मैं इसे फिर से कंप्रेस करना चाहता हूं तो मैं निम्नलिखित को अपने शब्दकोश में जोड़ सकता हूं:
312x
12y
ताकि यह बन जाए
yxbecausethatsx
जैसा कि आप देख सकते हैं, अधिक अतिरेक की जाँच आप अधिक से अधिक संपीड़न के माध्यम से जाते हैं। लेकिन आप भ्रष्टाचार की संभावना को भी बढ़ा रहे हैं। इसका कारण यह है कि जैसे-जैसे शब्दकोश बढ़ता है, यह क्षति के लिए अधिक प्रवण होता जाता है और यदि शब्दकोश का कोई भाग क्षतिग्रस्त हो जाता है तो शेष भाग को पढ़ा नहीं जा सकता है।