अवलोकन
संक्षिप्त उत्तर यह है कि उनके पास vanishing moments
किसी दिए गए support
(यानी फिल्टर गुणांक की संख्या) की अधिकतम संख्या है । यह "अतिवादी" संपत्ति है जो सामान्य रूप से ड्यूबचीज़ तरंगों को अलग करती है । धीरे-धीरे बोलना, अधिक लुप्त होने वाले क्षणों का अर्थ है बेहतर संपीड़न, और छोटे समर्थन का अर्थ है कम संगणना। वास्तव में, लुप्त हो रहे क्षणों और फिल्टर आकार के बीच का व्यापार इतना महत्वपूर्ण है कि यह उस तरह से हावी है जिस तरह से तरंगों का नाम दिया जाता है। उदाहरण के लिए, आप अक्सर या D4
तो संदर्भित तरंग को देखेंगे । गुणांकों की संख्या दर्शाता है, औरD4
db2
4
2
लुप्त होने वाले क्षणों की संख्या को संदर्भित करता है। दोनों एक ही गणितीय वस्तु को संदर्भित करते हैं। नीचे, मैं इस बारे में अधिक विस्तार से बताऊंगा कि कौन से क्षण हैं (और हम उन्हें गायब क्यों करना चाहते हैं), लेकिन अभी के लिए, बस यह समझें कि यह इस बात से संबंधित है कि हम सिग्नल की अधिकांश जानकारी को एक छोटे से "गुना" कैसे कर सकते हैं मूल्यों की संख्या। हानिपूर्ण संपीड़न उन मूल्यों को रखने और दूसरों को दूर फेंकने से प्राप्त होता है।
अब, आपने देखा होगा कि CDF 9/7
, जिसका उपयोग किया जाता है JPEG 2000
, एक के बजाय नाम में दो नंबर होते हैं। वास्तव में, यह भी कहा जाता है bior 4.4
। ऐसा इसलिए है क्योंकि यह "मानक" असतत तरंग नहीं है। वास्तव में, यह तकनीकी रूप से सिग्नल में ऊर्जा को संरक्षित भी नहीं करता है, और यह वह संपत्ति है जिसकी वजह से लोग पहली बार DWT को लेकर इतने उत्साहित हुए हैं! संख्या, 9/7
और 4.4
, अभी भी क्रमशः समर्थन और लुप्त होने वाले क्षणों को संदर्भित करते हैं, लेकिन अब गुणांक के दो सेट हैं जो तरंगिका को परिभाषित करते हैं। तकनीकी शब्द यह है कि होने के बजाय orthogonal
, वे हैं biorthogonal
। गणितीय रूप से इसका बहुत गहरा अर्थ होने के बजाय, मैं '
जेपीईजी 2000
सीडीएफ 9/7 तरंगिका के आसपास के डिजाइन निर्णयों की अधिक विस्तृत चर्चा निम्न पेपर में मिल सकती है:
Usevitch, ब्रायन ई। आधुनिक हानिपूर्ण वेवलेट छवि संपीड़न पर एक ट्यूटोरियल: जेपीईजी 2000 की नींव ।
मैं यहाँ मुख्य बिंदुओं की समीक्षा करूँगा।
अक्सर, ऑर्थोगोनल Daubechies wavelets वास्तव में संकेत का प्रतिनिधित्व करने के लिए आवश्यक मूल्यों की संख्या बढ़ाने में परिणाम कर सकते हैं। प्रभाव कहा जाता है coefficient expansion
। यदि हम हानिपूर्ण संपीडन कर रहे हैं, तो इससे कोई फर्क नहीं पड़ सकता है (क्योंकि हम किसी भी तरह अंत में मूल्यों को फेंक रहे हैं), लेकिन यह निश्चित रूप से संपीड़न के संदर्भ में उल्टा लगता है। समस्या को हल करने का एक तरीका इनपुट सिग्नल को समय-समय पर इलाज करना है।
बस इनपुट का समय-समय पर परिणाम के रूप में किनारों पर असंतोष होता है, जो संपीड़ित करने के लिए कठिन होता है, और केवल परिवर्तन की कलाकृतियों हैं। उदाहरण के लिए, निम्नलिखित आवधिक विस्तार में 3 से 0 तक की छलांग पर विचार करें: । उस समस्या को हल करने के लिए, हम संकेत के एक सममित आवधिक विस्तार का उपयोग कर सकते हैं, इस प्रकार है: । किनारों पर छलांग लगाना एक कारण है कि जेपीईजी में डीएफटी के बजाय डिस्क्रीट कोसाइन ट्रांसफॉर्म (डीसीटी) का उपयोग किया जाता है। कोसाइन के साथ एक सिग्नल का प्रतिनिधित्व करना इनपुट सिग्नल के "फ्रंट टू बैक लूपिंग" के रूप में निहित है, इसलिए हम वेवलेट चाहते हैं जिनके पास समान समरूपता है।[0,1,2,3]→[...0,1,2,3,0,1,2,3,...][0,1,2,3]→[...,0,1,2,3,3,2,1,0,0,1...]
दुर्भाग्य से, एकमात्र ओर्थोगोनल तरंगिका जिसमें आवश्यक विशेषताएं हैं, हर (या डी 2, डीबी 1) तरंगिका है, जो केवल एक लुप्त होने वाले क्षण के रूप में है। ओह। यह हमें बायोरथोगोनल तरंगों की ओर ले जाता है, जो वास्तव में निरर्थक प्रतिनिधित्व हैं, और इसलिए ऊर्जा को संरक्षित नहीं करते हैं। सीडीएफ 9/7 तरंगों का उपयोग व्यवहार में किया जाता है क्योंकि वे ऊर्जा संरक्षण के बहुत करीब आने के लिए डिज़ाइन किए गए थे । उन्होंने अभ्यास में भी अच्छी परीक्षा दी है।
विभिन्न समस्याओं को हल करने के अन्य तरीके हैं (संक्षेप में कागज में उल्लिखित), लेकिन ये शामिल कारकों के व्यापक स्ट्रोक हैं।
लुप्त हो रहे क्षण
तो क्या क्षण हैं, और हम उनकी परवाह क्यों करते हैं? चिकनी संकेतों को बहुपद के रूप में अच्छी तरह से समझा जा सकता है, अर्थात फार्म के कार्य:
a+bx+cx2+dx3+...
एक फ़ंक्शन के क्षण (यानी सिग्नल) एक माप है कि यह एक्स की दी गई शक्ति के समान कैसे है। गणितीय रूप से, यह फ़ंक्शन और x की शक्ति के बीच एक आंतरिक उत्पाद के रूप में व्यक्त किया जाता है । एक लुप्त हो रहे क्षण का अर्थ है कि आंतरिक उत्पाद शून्य है, और इसलिए फ़ंक्शन x की उस शक्ति को "सदृश" नहीं करता है, जो निम्नानुसार है (निरंतर मामले के लिए):
∫xnf(x)dx=0
अब प्रत्येक असतत, ऑर्थोगोनल वेवलेट में दो एफआईआर फिल्टर जुड़े होते हैं, जिनका उपयोग डीडब्ल्यूटी में किया जाता है । एक एक lowpass (या स्केलिंग) फ़िल्टर , और दूसरा एक highpass (या तरंगिका) फ़िल्टरψϕψ। यह शब्दावली कुछ हद तक बदलती है, लेकिन यह वही है जो मैं यहाँ उपयोग करूँगा। डीडब्ल्यूटी के प्रत्येक चरण में, हाईपास फिल्टर का उपयोग विस्तार की एक परत को "छील" करने के लिए किया जाता है, और लोवर फिल्टर उस विस्तार के बिना संकेत के एक सुचारू संस्करण की पैदावार करता है। यदि हाईपास फ़िल्टर में गायब होने वाले क्षण हैं, तो उन क्षणों (यानी कम क्रम की बहुपद विशेषताएं) को विस्तार संकेत के बजाय पूरक स्मूथ सिग्नल में भर दिया जाएगा। हानिपूर्ण संपीड़न के मामले में, उम्मीद है कि विस्तार संकेत में इसकी अधिक जानकारी नहीं होगी, और इसलिए हम इसे दूर फेंक सकते हैं।
यहाँ Haar (D2) तरंगिका का उपयोग करके एक सरल उदाहरण दिया गया है। आमतौर पर इसमें का स्केलिंग कारक शामिल होता है, लेकिन मैं इसे अवधारणा को स्पष्ट करने के लिए यहां छोड़ रहा हूं। दो फिल्टर इस प्रकार हैं:
φ=[1,1]1/2–√
ϕ=[1,1]ψ=[1,−1]
हाईपास फ़िल्टर शून्य के क्षण के लिए गायब हो जाता है, अर्थात , इसलिए इसका एक गायब होने वाला क्षण है। इसे देखने के लिए, इस निरंतर संकेत पर विचार करें: । अब सहज रूप से, यह स्पष्ट होना चाहिए कि वहां कोई जानकारी नहीं है (या किसी भी स्थिर संकेत में)। हम एक ही बात का वर्णन "चार जुड़वाँ" करके कर सकते हैं। DWT हमें स्पष्ट रूप से उस अंतर्ज्ञान का वर्णन करने का एक तरीका देता है। यहाँ वही है जो DWT के एकल पास के दौरान Haar तरंगिका का उपयोग करता है:x0=1[2,2,2,2]
[2,2,2,2]→ϕψ{[2+2,2+2]=[4,4][2−2,2−2]=[0,0]
और दूसरे पास पर क्या होता है, जो सिर्फ स्मूथ सिग्नल पर संचालित होता है:
[4,4]→ϕψ{[4+4]=[8][4−4]=[0]
ध्यान दें कि कैसे निरंतर सिग्नल पूरी तरह से विस्तार पास के लिए अदृश्य है (जो सभी 0 से बाहर आते हैं)। यह भी ध्यान दें कि चार मूल्यों को एकल मान में कैसे घटाया गया है । अब अगर हम मूल सिग्नल को प्रसारित करना चाहते हैं, तो हम सिर्फ भेज सकते हैं , और उलटा DWT मूल संकेत को फिर से बना सकता है, यह मानकर कि सभी विवरण गुणांक शून्य हैं। उच्च-क्रम के गायब होने वाले क्षणों के तरंगों को संकेतों के साथ समान परिणाम की अनुमति मिलती है जो लाइनों, परबोलों, क्यूबिक्स, आदि द्वारा अच्छी तरह से अनुमानित होती हैं।2 8288
आगे की पढाई
मैं उपर्युक्त उपचार को सुलभ रखने के लिए बहुत से विवरणों पर गौर कर रहा हूं। निम्नलिखित कागज में बहुत गहरा विश्लेषण है:
एम। अनसर, और टी। ब्लू, जेपीईजी २२० वेलेट फिल्टर के गणितीय गुण , आईईईई ट्रांस। छवि प्रोक।, वॉल्यूम। 12, नहीं। 9, सितंबर 2003, पृष्ठ 1080-1090।
पाद लेख
उपरोक्त कागज से पता चलता है कि JPEG2000 तरंगिका को Daubechies 9/7 कहा जाता है, और CDF 9 वेवलेट से अलग है।
हमने JPEG2000 Daubechies के 9/7 स्केलिंग फ़िल्टर के सटीक रूप को प्राप्त किया है ... ये फ़िल्टर [10] के समान बहुपद के गुणन के परिणामस्वरूप होते हैं । मुख्य अंतर यह है कि 9/7 फिल्टर सममित हैं। इसके अलावा, कोहेन-ड्यूबचीज़-फियोव्यू [11] के बायोरथोगोनल स्पाइन के विपरीत, बहुपद के अनियमित भाग को दोनों पक्षों में विभाजित किया गया है, और यथासंभव समान रूप से।Daubechies8
[११] ए। कोहेन, आई। ड्युबचीज़, और जेसी फ़ेव्यू, "कॉम्पैक्ट रूप से समर्थित तरंगिकाओं के बायोरथोगोनल आधार," कॉम। शुद्ध सेब। गणित।, खंड। 45, नं। 5, पीपी। 485–560, 1992।
JPEG2000 मानक ( पीडीएफ लिंक ) का प्रारूप जिसे मैंने ब्राउज किया है, आधिकारिक फिल्टर Daubechies 9/7 को भी कॉल करता है। यह इस पत्र को संदर्भित करता है:
एम। एंटोनिनी, एम। बारलाउड, पी। मैथ्यू, और आई। ड्यूबचीज़, "वेवलेट ट्रांसफ़ॉर्म का उपयोग करके छवि कोडिंग," आईईईई ट्रांस। छवि प्रोक। 1, पीपी 205-220, अप्रैल 1992।
मैंने उन स्रोतों में से किसी को भी नहीं पढ़ा है, इसलिए मैं यह सुनिश्चित करने के लिए नहीं कह सकता कि विकिपीडिया JPEG2000 तरंगिका CDF 9/7 क्यों कहता है। ऐसा लगता है कि दोनों के बीच अंतर हो सकता है, लेकिन लोग आधिकारिक JPEG2000 तरंगिका CDF 9/7 को वैसे भी कहते हैं (क्योंकि यह एक ही आधार पर आधारित है?)। नाम के बावजूद, Usevitch द्वारा कागज मानक में उपयोग किए जाने वाले का वर्णन करता है।