क्या गुण छवि तरंग में दूसरों की तुलना में कुछ बेहतर तरंगों "बेहतर" बनाते हैं?


39

मैं खुद को तरंग रूपांतरण विधि का उपयोग करके छवि संपीड़न के बारे में अधिक सिखाने की कोशिश कर रहा हूं। मेरा सवाल है: यह कुछ तरंगों के बारे में क्या है जो छवियों को संपीड़ित करते समय उन्हें बेहतर बनाता है? क्या उन्हें गणना करना आसान है? क्या वे चिकनी छवियों का उत्पादन करते हैं? आदि...

उदाहरण: जेपीईजी 2000 कोहेन-ड्यूबचीज़-फ़्यूव्यू 9/7 वेवलेट का उपयोग करता है ... यह एक क्यों है?


जहां तक ​​मुझे पता है कि ड्यूबचीज़ वेवलेट सुगम आधार प्रदान करता है, इसलिए अत्यधिक संपीड़ित छवियां "धुंधला" होती हैं। उदाहरण के लिए, हार वेवलेट, अवरुद्ध कलाकृतियों का उत्पादन करेगा। चूँकि आपने JPEG 2000 का उल्लेख किया है, मैं ध्यान देना चाहूंगा कि गैर-शून्य वेवलेट गुणांक की कोडिंग योजना का भी डिकोडेड इमेज (EZW, SPIHT, ...) पर प्रभाव पड़ता है।
Libor

आपके प्रश्न का उत्तर दिया गया है। उपयोगी लोगों के लिए वोट करने में संकोच न करें और सबसे उपयुक्त स्वीकार करें
लौरेंट

जवाबों:


26

अवलोकन

संक्षिप्त उत्तर यह है कि उनके पास vanishing momentsकिसी दिए गए support(यानी फिल्टर गुणांक की संख्या) की अधिकतम संख्या है । यह "अतिवादी" संपत्ति है जो सामान्य रूप से ड्यूबचीज़ तरंगों को अलग करती है । धीरे-धीरे बोलना, अधिक लुप्त होने वाले क्षणों का अर्थ है बेहतर संपीड़न, और छोटे समर्थन का अर्थ है कम संगणना। वास्तव में, लुप्त हो रहे क्षणों और फिल्टर आकार के बीच का व्यापार इतना महत्वपूर्ण है कि यह उस तरह से हावी है जिस तरह से तरंगों का नाम दिया जाता है। उदाहरण के लिए, आप अक्सर या D4तो संदर्भित तरंग को देखेंगे । गुणांकों की संख्या दर्शाता है, औरD4db242लुप्त होने वाले क्षणों की संख्या को संदर्भित करता है। दोनों एक ही गणितीय वस्तु को संदर्भित करते हैं। नीचे, मैं इस बारे में अधिक विस्तार से बताऊंगा कि कौन से क्षण हैं (और हम उन्हें गायब क्यों करना चाहते हैं), लेकिन अभी के लिए, बस यह समझें कि यह इस बात से संबंधित है कि हम सिग्नल की अधिकांश जानकारी को एक छोटे से "गुना" कैसे कर सकते हैं मूल्यों की संख्या। हानिपूर्ण संपीड़न उन मूल्यों को रखने और दूसरों को दूर फेंकने से प्राप्त होता है।

अब, आपने देखा होगा कि CDF 9/7, जिसका उपयोग किया जाता है JPEG 2000, एक के बजाय नाम में दो नंबर होते हैं। वास्तव में, यह भी कहा जाता है bior 4.4। ऐसा इसलिए है क्योंकि यह "मानक" असतत तरंग नहीं है। वास्तव में, यह तकनीकी रूप से सिग्नल में ऊर्जा को संरक्षित भी नहीं करता है, और यह वह संपत्ति है जिसकी वजह से लोग पहली बार DWT को लेकर इतने उत्साहित हुए हैं! संख्या, 9/7और 4.4, अभी भी क्रमशः समर्थन और लुप्त होने वाले क्षणों को संदर्भित करते हैं, लेकिन अब गुणांक के दो सेट हैं जो तरंगिका को परिभाषित करते हैं। तकनीकी शब्द यह है कि होने के बजाय orthogonal, वे हैं biorthogonal। गणितीय रूप से इसका बहुत गहरा अर्थ होने के बजाय, मैं '

जेपीईजी 2000

सीडीएफ 9/7 तरंगिका के आसपास के डिजाइन निर्णयों की अधिक विस्तृत चर्चा निम्न पेपर में मिल सकती है:

Usevitch, ब्रायन ई। आधुनिक हानिपूर्ण वेवलेट छवि संपीड़न पर एक ट्यूटोरियल: जेपीईजी 2000 की नींव

मैं यहाँ मुख्य बिंदुओं की समीक्षा करूँगा।

  1. अक्सर, ऑर्थोगोनल Daubechies wavelets वास्तव में संकेत का प्रतिनिधित्व करने के लिए आवश्यक मूल्यों की संख्या बढ़ाने में परिणाम कर सकते हैं। प्रभाव कहा जाता है coefficient expansion। यदि हम हानिपूर्ण संपीडन कर रहे हैं, तो इससे कोई फर्क नहीं पड़ सकता है (क्योंकि हम किसी भी तरह अंत में मूल्यों को फेंक रहे हैं), लेकिन यह निश्चित रूप से संपीड़न के संदर्भ में उल्टा लगता है। समस्या को हल करने का एक तरीका इनपुट सिग्नल को समय-समय पर इलाज करना है।

  2. बस इनपुट का समय-समय पर परिणाम के रूप में किनारों पर असंतोष होता है, जो संपीड़ित करने के लिए कठिन होता है, और केवल परिवर्तन की कलाकृतियों हैं। उदाहरण के लिए, निम्नलिखित आवधिक विस्तार में 3 से 0 तक की छलांग पर विचार करें: । उस समस्या को हल करने के लिए, हम संकेत के एक सममित आवधिक विस्तार का उपयोग कर सकते हैं, इस प्रकार है: । किनारों पर छलांग लगाना एक कारण है कि जेपीईजी में डीएफटी के बजाय डिस्क्रीट कोसाइन ट्रांसफॉर्म (डीसीटी) का उपयोग किया जाता है। कोसाइन के साथ एक सिग्नल का प्रतिनिधित्व करना इनपुट सिग्नल के "फ्रंट टू बैक लूपिंग" के रूप में निहित है, इसलिए हम वेवलेट चाहते हैं जिनके पास समान समरूपता है।[0,1,2,3][...0,1,2,3,0,1,2,3,...][0,1,2,3][...,0,1,2,3,3,2,1,0,0,1...]

  3. दुर्भाग्य से, एकमात्र ओर्थोगोनल तरंगिका जिसमें आवश्यक विशेषताएं हैं, हर (या डी 2, डीबी 1) तरंगिका है, जो केवल एक लुप्त होने वाले क्षण के रूप में है। ओह। यह हमें बायोरथोगोनल तरंगों की ओर ले जाता है, जो वास्तव में निरर्थक प्रतिनिधित्व हैं, और इसलिए ऊर्जा को संरक्षित नहीं करते हैं। सीडीएफ 9/7 तरंगों का उपयोग व्यवहार में किया जाता है क्योंकि वे ऊर्जा संरक्षण के बहुत करीब आने के लिए डिज़ाइन किए गए थे । उन्होंने अभ्यास में भी अच्छी परीक्षा दी है।

विभिन्न समस्याओं को हल करने के अन्य तरीके हैं (संक्षेप में कागज में उल्लिखित), लेकिन ये शामिल कारकों के व्यापक स्ट्रोक हैं।

लुप्त हो रहे क्षण

तो क्या क्षण हैं, और हम उनकी परवाह क्यों करते हैं? चिकनी संकेतों को बहुपद के रूप में अच्छी तरह से समझा जा सकता है, अर्थात फार्म के कार्य:

a+bx+cx2+dx3+...

एक फ़ंक्शन के क्षण (यानी सिग्नल) एक माप है कि यह एक्स की दी गई शक्ति के समान कैसे है। गणितीय रूप से, यह फ़ंक्शन और x की शक्ति के बीच एक आंतरिक उत्पाद के रूप में व्यक्त किया जाता है । एक लुप्त हो रहे क्षण का अर्थ है कि आंतरिक उत्पाद शून्य है, और इसलिए फ़ंक्शन x की उस शक्ति को "सदृश" नहीं करता है, जो निम्नानुसार है (निरंतर मामले के लिए):

xnf(x)dx=0

अब प्रत्येक असतत, ऑर्थोगोनल वेवलेट में दो एफआईआर फिल्टर जुड़े होते हैं, जिनका उपयोग डीडब्ल्यूटी में किया जाता है । एक एक lowpass (या स्केलिंग) फ़िल्टर , और दूसरा एक highpass (या तरंगिका) फ़िल्टरψϕψ। यह शब्दावली कुछ हद तक बदलती है, लेकिन यह वही है जो मैं यहाँ उपयोग करूँगा। डीडब्ल्यूटी के प्रत्येक चरण में, हाईपास फिल्टर का उपयोग विस्तार की एक परत को "छील" करने के लिए किया जाता है, और लोवर फिल्टर उस विस्तार के बिना संकेत के एक सुचारू संस्करण की पैदावार करता है। यदि हाईपास फ़िल्टर में गायब होने वाले क्षण हैं, तो उन क्षणों (यानी कम क्रम की बहुपद विशेषताएं) को विस्तार संकेत के बजाय पूरक स्मूथ सिग्नल में भर दिया जाएगा। हानिपूर्ण संपीड़न के मामले में, उम्मीद है कि विस्तार संकेत में इसकी अधिक जानकारी नहीं होगी, और इसलिए हम इसे दूर फेंक सकते हैं।

यहाँ Haar (D2) तरंगिका का उपयोग करके एक सरल उदाहरण दिया गया है। आमतौर पर इसमें का स्केलिंग कारक शामिल होता है, लेकिन मैं इसे अवधारणा को स्पष्ट करने के लिए यहां छोड़ रहा हूं। दो फिल्टर इस प्रकार हैं: φ=[1,1]1/2

ϕ=[1,1]ψ=[1,1]

हाईपास फ़िल्टर शून्य के क्षण के लिए गायब हो जाता है, अर्थात , इसलिए इसका एक गायब होने वाला क्षण है। इसे देखने के लिए, इस निरंतर संकेत पर विचार करें: । अब सहज रूप से, यह स्पष्ट होना चाहिए कि वहां कोई जानकारी नहीं है (या किसी भी स्थिर संकेत में)। हम एक ही बात का वर्णन "चार जुड़वाँ" करके कर सकते हैं। DWT हमें स्पष्ट रूप से उस अंतर्ज्ञान का वर्णन करने का एक तरीका देता है। यहाँ वही है जो DWT के एकल पास के दौरान Haar तरंगिका का उपयोग करता है:x0=1[2,2,2,2]

[2,2,2,2]ψϕ{[2+2,2+2]=[4,4][22,22]=[0,0]

और दूसरे पास पर क्या होता है, जो सिर्फ स्मूथ सिग्नल पर संचालित होता है:

[4,4]ψϕ{[4+4]=[8][44]=[0]

ध्यान दें कि कैसे निरंतर सिग्नल पूरी तरह से विस्तार पास के लिए अदृश्य है (जो सभी 0 से बाहर आते हैं)। यह भी ध्यान दें कि चार मूल्यों को एकल मान में कैसे घटाया गया है । अब अगर हम मूल सिग्नल को प्रसारित करना चाहते हैं, तो हम सिर्फ भेज सकते हैं , और उलटा DWT मूल संकेत को फिर से बना सकता है, यह मानकर कि सभी विवरण गुणांक शून्य हैं। उच्च-क्रम के गायब होने वाले क्षणों के तरंगों को संकेतों के साथ समान परिणाम की अनुमति मिलती है जो लाइनों, परबोलों, क्यूबिक्स, आदि द्वारा अच्छी तरह से अनुमानित होती हैं।2 8288

आगे की पढाई

मैं उपर्युक्त उपचार को सुलभ रखने के लिए बहुत से विवरणों पर गौर कर रहा हूं। निम्नलिखित कागज में बहुत गहरा विश्लेषण है:

एम। अनसर, और टी। ब्लू, जेपीईजी २२० वेलेट फिल्टर के गणितीय गुण , आईईईई ट्रांस। छवि प्रोक।, वॉल्यूम। 12, नहीं। 9, सितंबर 2003, पृष्ठ 1080-1090।

पाद लेख

उपरोक्त कागज से पता चलता है कि JPEG2000 तरंगिका को Daubechies 9/7 कहा जाता है, और CDF 9 वेवलेट से अलग है।

हमने JPEG2000 Daubechies के 9/7 स्केलिंग फ़िल्टर के सटीक रूप को प्राप्त किया है ... ये फ़िल्टर [10] के समान बहुपद के गुणन के परिणामस्वरूप होते हैं । मुख्य अंतर यह है कि 9/7 फिल्टर सममित हैं। इसके अलावा, कोहेन-ड्यूबचीज़-फियोव्यू [11] के बायोरथोगोनल स्पाइन के विपरीत, बहुपद के अनियमित भाग को दोनों पक्षों में विभाजित किया गया है, और यथासंभव समान रूप से।Daubechies8

[११] ए। कोहेन, आई। ड्युबचीज़, और जेसी फ़ेव्यू, "कॉम्पैक्ट रूप से समर्थित तरंगिकाओं के बायोरथोगोनल आधार," कॉम। शुद्ध सेब। गणित।, खंड। 45, नं। 5, पीपी। 485–560, 1992।

JPEG2000 मानक ( पीडीएफ लिंक ) का प्रारूप जिसे मैंने ब्राउज किया है, आधिकारिक फिल्टर Daubechies 9/7 को भी कॉल करता है। यह इस पत्र को संदर्भित करता है:

एम। एंटोनिनी, एम। बारलाउड, पी। मैथ्यू, और आई। ड्यूबचीज़, "वेवलेट ट्रांसफ़ॉर्म का उपयोग करके छवि कोडिंग," आईईईई ट्रांस। छवि प्रोक। 1, पीपी 205-220, अप्रैल 1992।

मैंने उन स्रोतों में से किसी को भी नहीं पढ़ा है, इसलिए मैं यह सुनिश्चित करने के लिए नहीं कह सकता कि विकिपीडिया JPEG2000 तरंगिका CDF 9/7 क्यों कहता है। ऐसा लगता है कि दोनों के बीच अंतर हो सकता है, लेकिन लोग आधिकारिक JPEG2000 तरंगिका CDF 9/7 को वैसे भी कहते हैं (क्योंकि यह एक ही आधार पर आधारित है?)। नाम के बावजूद, Usevitch द्वारा कागज मानक में उपयोग किए जाने वाले का वर्णन करता है।


@ डिटैजिस्ट शानदार जवाब! इसके अलावा, एक और कारण जो 9/7 पहले स्थान पर मौजूद था, क्योंकि यह पुनर्निर्माण बहुपद का कारक बनने के लिए एक वैकल्पिक तरीका था, इस बाधा के साथ कि फिल्टर सममित हो । इस तरह, चरण प्रतिक्रिया रैखिक बनी हुई है। (इसके विपरीत, एक डब 4 तरंगिका, जबकि एक प्राथमिकी, असममित है और एक संसाधित सिग्नल में गैर-रैखिक चरण को प्रेरित करती है)। जेपीईजी में 9/7 का उपयोग किया गया था क्योंकि छवियों में गैर-रैखिक विकृतियों पर रैखिक को पसंद करने के लिए व्यक्तिपरक झुकाव के कारण।
17

1
अच्छा लेख। विकिपीडिया लेख की जानकारी उद्धृत स्रोतों से मेल खाती है, अनिवार्य रूप से Daubechies "10 व्याख्यान", इसलिए यह JPEG2000 के संबंध में पुराना हो सकता है। एक सुधार: बायोरथोगोनल निरर्थक नहीं है। Biorthogonality की स्थिति बिल्कुल उलटा फिल्टर बैंकों को लगाती है। निरर्थक परिवर्तन फ्रेमलेट के साथ शुरू होते हैं।
डॉ। लुत्ज़ लेहमन

10

सिग्नल ट्रांसफ़ॉर्म की भलाई का मूल्यांकन दो अलग-अलग मैट्रिक्स पर किया जाता है: संपीड़न, और हानिपूर्ण संपीड़न, गुणवत्ता के मामले में। संपीड़न को ऊर्जा संघनन द्वारा परिभाषित किया गया है लेकिन गुणवत्ता कठिन है।

पारंपरिक रूप से गुणवत्ता को माध्य वर्ग त्रुटि या औसत प्रति पिक्सेल एसएनआर द्वारा मापा जाता है। हालांकि, मानव एमएसई या एसएनआर के साथ संकेतों का मूल्यांकन नहीं करते हैं। मनुष्य संरचित शोर के प्रति बहुत संवेदनशील है जहां MSE नहीं होता है। मानव-जैसी गुणवत्ता वाले मीट्रिक वितरित करने वाले एल्गोरिदम का विकास करना अनुसंधान का एक सक्रिय क्षेत्र है। बोविक का स्ट्रक्चरल सिमेरैलिटी (SSIM) इंडेक्स शुरू करने के लिए एक अच्छी जगह है।


6

एक बहुत ही कम जवाब के रूप में - कोई भी परिवर्तन अन्य परिवर्तनों की तुलना में बेहतर होता है, जब उसे "ऊर्जा संघनन संपत्ति" के रूप में जाना जाता है, जिसे नीचे दिया गया है:

"जब केवल गुणांक के एक छोटे से अंश में बड़े परिमाण होते हैं जैसे कि केवल कुछ सह-कुशल रखना और दूसरों को त्यागना या मात्रा देना फिर भी पुन: निर्माण पूर्ण होने की अनुमति देता है"। इस तरह की संपत्ति एकात्मक परिवर्तनों की सजावट क्षमता से संबंधित है। "

कम ऊर्जा संघनन संपत्ति के साथ परिवर्तन वह है जिसे सबसे कम संख्या में प्रतीकों की आवश्यकता होगी और इसलिए कम बिट्स।

उच्चतम ऊर्जा संघनन संपत्ति के साथ परिवर्तन DCT है।

Dipan।


1
DCT में केवल अज्ञात सिग्नल कक्षाओं के लिए सबसे अधिक ऊर्जा संघनन है। यदि आप अपने सिग्नल डोमेन को चिह्नित कर सकते हैं, तो आप बेहतर कर सकते हैं।
totowtwo

मैं @totowtwo से सहमत हूँ। मेरा कहना है कि "एनर्जी कॉम्पेक्टनेस प्रॉपर्टी" है जो एक निश्चित रूप से परिवर्तन करती है जो कि इसे कोडेक इंजन के लिए बेहतर बनाती है।
दीपन मेहता

5

प्राकृतिक छवियों में विभिन्न छवि विशेषताएं होती हैं, हम मोटे तौर पर उन्हें चिकनी या धीमी गति से भिन्न विशेषताओं, बनावट और किनारों में वर्गीकृत कर सकते हैं। एक अच्छी संपीड़न विधि वह है जो एक छवि को एक डोमेन में ट्रांसफॉर्म करती है जहां सिग्नल की सभी ऊर्जा को केवल कुछ गुणांकों में संरक्षित किया जाता है।

फूरियर रूपांतरण साइन और कोजाइन का उपयोग करके एक छवि को अनुमानित करने की कोशिश करता है। अब साइन और कोजाइन सुगम संकेतों को काफी संक्षिप्त रूप से अनुमानित कर सकते हैं, लेकिन असंयम को अंजाम देने के लिए कुख्यात हैं। यदि आप गिब्स घटना से परिचित हैं, तो आपको पता चल जाएगा कि समय में असंतोष को दूर करने की कलाकृतियों से बचने के लिए बड़ी संख्या में फूरियर गुणांक की आवश्यकता है। हालांकि, गुणांक की संख्या जितनी कम होगी, उतना ही बेहतर संपीड़न होगा। इसलिए, गुणांक की संख्या और संपीड़न विधि की क्षति के बीच एक अंतर्निहित व्यापार है, जिसे हम आमतौर पर दर-विरूपण व्यापार के रूप में संदर्भित करते हैं।

जब jpeg की तुलना में बेहतर कंप्रेशन स्कीम की खोज की जाती है, जो फूरियर ट्रांसफॉर्म का उपयोग करती है, तो हमें एक ही विरूपण के लिए फूरियर ट्रांसफॉर्म की तुलना में कम गुणांकों के साथ अनुमानित बदलाव की आवश्यकता होगी। तरंगों को दर्ज करें जो बेहतर सन्निकटन प्रदान करता है और इसलिए कलाकृतियों जैसे गिब्स घटना के बिना बिंदु विलक्षणताओं का बेहतर संपीड़न। छवियां कभी भी अभ्यास में पूरी तरह से चिकनी नहीं होती हैं और इसलिए वेवलेट विविध छवि सुविधाओं के लिए फूरियर की तुलना में अधिक बहुमुखी हैं। यदि हम फूरियर और वेवलेट दोनों का उपयोग करके किनारों वाली छवि के सर्वश्रेष्ठ k- टर्म सन्निकटन की तुलना करते थे, तो त्रुटियों को और रूप में क्षय होगा। कश्मीर - 1k2/3k1, क्रमशः। समान शर्तों के लिए, तरंगों के लिए त्रुटि तेजी से कम हो जाती है। इसका मतलब यह है कि तरंगों में बेहतर ऊर्जा संघनन होता है जब छवियां पूरी तरह से चिकनी नहीं होती हैं (धीरे-धीरे बदलती हैं) और इसमें विलक्षणताएं होती हैं।

हालाँकि, हमारे पास अभी तक एक भी आधार या परिवर्तन नहीं है जो चिकनी विशेषताओं, बिंदु विलक्षणताओं, किनारों और बनावट को अनुमानित कर सके।


4

डीसीटी में बहुत सारे सामान्य संकेतों के लिए बहुत अच्छा ऊर्जा संघनन है, और यह भी काफी अच्छी तरह से मेष करता है कि कैसे विवर्तन (इमेजिंग में अंतर्निहित शारीरिक प्रक्रिया) काम करता है, क्योंकि विवर्तन को फूरियर कर्नेल के रूप में दर्शाया जा सकता है। ये इसे बहुत सारे फायदे देते हैं।

समस्या यह है कि डीसीटी गुणांकों को आवश्यक रूप से पूरे परिवर्तन क्षेत्र पर मुखर किया गया है। इसके लिए आवश्यक है कि कई छोटे परिवर्तन क्षेत्र (ब्लॉक) बनाए जाएं ताकि एक क्षेत्र में ऊर्जा दूसरे में परिवर्तित होने पर फैल न जाए। यह दोनों कॉम्पैक्ट ऊर्जा में परिवर्तन की क्षमता को प्रतिबंधित करता है, और कई ब्लॉक सीमाओं पर कलाकृतियों का भी परिचय देता है।

मैंने तरंगों के साथ बहुत कुछ नहीं किया है इसलिए मैं गलत हो सकता हूं, लेकिन वे अधिक जटिल हैं, अलग-अलग क्षेत्र / आवृत्ति ट्रेडऑफ़ का प्रतिनिधित्व करने वाले विभिन्न गुणांक के साथ। यह कम कलाकृतियों के साथ बड़े ब्लॉक आकार की अनुमति देता है। अभ्यास में कोई यकीन नहीं है कि वास्तव में हालांकि कितना अंतर है।


0

बेहतर तरंगों के बारे में बात करते समय, हमें विचार करना चाहिए कि उनके पीछे एक ही एनकोडर है: एक परिवर्तन का प्रदर्शन भारी मात्रा में परिशोधन और एन्कोडिंग के साथ जुड़ा हुआ है। प्रदर्शन आमतौर पर है: एक ही गुणवत्ता के लिए बेहतर संपीड़न, या एक ही संपीड़न के लिए बेहतर गुणवत्ता। संपीड़न एक आसान उपाय है, गुणवत्ता नहीं है। लेकिन मान लीजिए हमारे पास एक है।

अब, एक वेवलेट (एनकोडर के साथ) एक संपीड़न अनुपात (कम कहना) में बेहतर हो सकता है, और दूसरे पर बदतर (उच्च कहना)। केवल सामान्य रूप से थोड़ा, लेकिन इस पर निर्भर करते हुए कि आप उच्च ( ) या निम्न ( ) को संपीड़ित करेंगे , आप भिन्न तरंगिकाएँ चुन सकते हैं।× 4×124×4

अंत में, यह उन छवियों के वर्ग पर निर्भर करता है जिन्हें आप संपीड़ित करना चाहते हैं: सभी उद्देश्य, या ध्यान केंद्रित, जैसे कि चिकित्सा छवियों, या भूकंपीय डेटा संपीड़न के साथ, प्रतिबंधित, विशिष्ट प्रकार के डेटा? यहां फिर से, तरंगिकाएं अलग हो सकती हैं।

अब, छवियों के मुख्य रूपात्मक घटक क्या हैं और वेवले उनसे कैसे निपटते हैं:

  • धीमी प्रवृत्तियां, विकसित होने वाली पृष्ठभूमि: लुप्त होते क्षण, जो कि तरंगिका उप-क्षेत्रों में बहुपद से छुटकारा दिलाते हैं,
  • धक्कों: स्केलिंग कार्यों के साथ ठीक है,
  • किनारों: तरंगिकाओं के व्युत्पन्न पहलू द्वारा पकड़ा गया,
  • बनावट: तरंगों के आकर्षक पहलू द्वारा पकड़े गए दोलन,
  • बाकी, क्या शोर है, अनमॉडेल्ड: ओर्थोगोनलिटी (या बहुत करीब) द्वारा प्रबंधित।

इसलिए विश्लेषण पक्ष में, सर्वश्रेष्ठ तरंगें अच्छी तरह से उपरोक्त विशेषताओं को विश्व स्तर पर एक कॉम्पैक्ट करने के लिए अच्छी हैं। संश्लेषण की ओर, सबसे अच्छा तरंगिका संपीड़न प्रभाव को कम करती है, उदाहरण के लिए, मात्रा का ठहराव, सुखद पहलू देने के लिए। विश्लेषण / संश्लेषण पर आवश्यक गुण थोड़ा अलग हैं, यही कारण है कि बायोरथोगोनल वेवलेट्स अच्छे हैं: आप अलग-अलग विश्लेषण (लुप्त होने वाले क्षण) / संश्लेषण (चिकनाई) गुण, जो आप ऑर्थोगोनल वाले नहीं कर सकते हैं, और फ़िल्टर लंबाई में वृद्धि को उत्तेजित करते हैं। कम्प्यूटेशनल प्रदर्शन के लिए काफी हानिकारक है। अतिरिक्त, बायोरथोगोनल तरंगिका सममित हो सकती है, किनारों के लिए अच्छा है।

अंत में, क्या आप कुछ दोषरहित संपीड़न चाहते हैं? फिर आपको "पूर्णांक"-समान तरंगों (या बिनलेट्स) की आवश्यकता होती है।

और ऊपर के सभी कम्प्यूटेशनल मुद्दों के साथ मिश्रित होते हैं: वियोज्य तरंगिकाएं, बहुत लंबे समय तक नहीं। और जेपीईजी समिति में मानकीकरण की प्रक्रिया।

अंत में, 5/3 दोषरहित, काफी कम के लिए काफी अच्छा है। 9/7 में से कुछ अच्छे भी हैं। 13/7 तरंग से बेहतर है ? वास्तव में नहीं, और यहां तक ​​कि अगर, PSNR में है, तो छवि गुणवत्ता के लिए सबसे अच्छा नहीं है।

इसलिए पारंपरिक तरंगें पारंपरिक चित्रों और लेखकों के साथ व्यक्तिगत संवाद के लिए सबसे बेहतर तरंग हैं

एम। अनसर, और टी। ब्लू, जेपीईजी २२० वेलेट फिल्टर के गणितीय गुण , आईईईई ट्रांस। छवि प्रोक।, वॉल्यूम। 12, नहीं। 9, सितंबर 2003, पृष्ठ 1080-1090।

मुझे विश्वास है कि 9/7 का "सर्वश्रेष्ठ" पहलू न तो पूरी तरह से समझाया गया है, न ही आश्वासन दिया गया है।

क्योंकि आप अन्य फिल्टर बैंकों (मल्टी-बैंड या हेंड) के साथ समझदारी से अधिक लाभ उठा सकते हैं । शायद एक उपन्यास मानक को सही ठहराने के लिए पर्याप्त नहीं है।M

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.