वास्तव में, यह तथ्य कि फाइलें पहले से ही संपीड़ित हैं, महत्वपूर्ण समस्या नहीं है। यह यह है: सामान्य रूप से संपीड़न केवल तभी काम कर सकता है जब डेटा में किसी प्रकार की अतिरेक हो । यह हमेशा असंपीड़ित फ़ाइलों के लिए व्यावहारिक रूप से मामला है - हालांकि, यह जरूरी नहीं है कि अतिरेक क्या है। सामान्य-उद्देश्य संपीड़न एल्गोरिदम ज्यादातर पाठ फ़ाइलों में स्पष्ट प्रकार की चीज़ को लक्षित करते हैं: कई शब्द न केवल एक बार बल्कि समान रूप में बहुत बार बदलते हैं, शायद शब्दों के वाक्यांशों को जोड़ा जा सकता है, आदि आदि। एल्गोरिदम में काफी अच्छे हैं ASCII- एन्कोडेड फोन नंबर से चीनी कविता पर द्विआधारी मशीन कोड की सूची में किसी भी चीज़ के लिए इसे सामान्य बनाना, लेकिन वे संभवतः किसी भी तरह के डेटा के लिए काम नहीं कर सकते । विशेष रूप से, मीडिया फाइलें वैचारिक रूप से होती हैंएनालॉग डेटा , एक शोर डिजिटल प्रतिनिधित्व में। इसका मतलब है, वास्तव में किसी भी तरह की टेक्स्टफाइल-रिड्यून्सी बिल्कुल भी नहीं है: कुछ मकसद आवर्ती हो सकते हैं, लेकिन हमेशा सेंसर शोर के थोड़े अलग विन्यास के साथ। यही कारण है कि सभी संपीड़ित छवि / एवी प्रारूप अपने पहले एन्कोडिंग कदम के रूप में कुछ चतुराई से चुने गए परिवर्तन का उपयोग करते हैं, आमतौर पर डीसीटी या तरंगिकाओं पर आधारित होते हैं । इन परिवर्तनों को मोटे तौर पर अलग-अलग स्थानों में चित्र-भागों और शोर-भागों को स्थानांतरित किया जाता है, इसलिए उन्हें अच्छी तरह से अलग किया जा सकता है और हानिपूर्ण संपीड़न के साथ आप केवल वही जानकारी रखते हैं जो आपको लगता है कि सबसे "महत्वपूर्ण" है, जिसमें शोर शामिल नहीं है, जबकि " अच्छी जानकारी "अतिरेक है। (यह वास्तव में यह कैसे काम करता है, लेकिन नहीं है।)
यदि सामान्य प्रयोजन के कंप्रेशर्स ने इन परिवर्तनों का उपयोग किया है, तो प्रभाव इसके विपरीत होगा: अधिकांश डिजिटल जानकारी वास्तव में किसी प्रकार के शोर के रूप में मिसकॉलिफ़ाइड होंगी, क्योंकि इसमें एनालॉग सिग्नल में आपको "चिकनी" संरचना का अभाव है। और हानिपूर्ण वीडियो संपीड़न के बाद स्पष्ट रूप से न तो एनालॉग चिकनाई या डिजिटल पुनरावृत्ति अब मिल सकती है (यदि यह थे, तो कोडेक्स एक और bzip-मंच या स्वयं कुछ का उपयोग करेंगे!)