गॉसियन फिल्टर का उपयोग इमेज प्रोसेसिंग में कम पास फिल्टर के रूप में क्यों किया जाता है?


30

1 डी सिग्नल प्रोसेसिंग में, कई प्रकार के कम पास फिल्टर का उपयोग किया जाता है। गाऊसी फिल्टर लगभग कभी भी उपयोग नहीं किए जाते हैं, हालांकि।

वे छवि प्रसंस्करण अनुप्रयोगों में इतने लोकप्रिय क्यों हैं? क्या ये फ़िल्टर किसी भी मानदंड को अनुकूलित करने का परिणाम हैं या छवि 'बैंडविड्थ' आमतौर पर अच्छी तरह से परिभाषित नहीं होने के कारण केवल तदर्थ समाधान हैं।

जवाबों:


28

इमेज प्रोसेसिंग एप्लिकेशन ऑडियो प्रोसेसिंग एप्लिकेशन से अलग हैं, क्योंकि उनमें से कई आंख के लिए ट्यून किए गए हैं। गाऊसी मास्क लगभग पूरी तरह से ऑप्टिकल ब्लर का अनुकरण करते हैं (देखें भी फैले हुए फ़ंक्शंस )। कलात्मक उत्पादन में उन्मुख किसी भी इमेज प्रोसेसिंग एप्लिकेशन में, गौसियन फिल्टर का उपयोग डिफ़ॉल्ट रूप से धुंधला होने के लिए किया जाता है।

गाऊसी फिल्टर की एक और महत्वपूर्ण मात्रात्मक संपत्ति यह है कि वे हर जगह गैर-नकारात्मक हैं । यह महत्वपूर्ण है क्योंकि सबसे -1 डी संकेतों 0 के बारे में अलग-अलग है ( ) और तो सकारात्मक या नकारात्मक मान हो सकते हैं। छवियाँ अर्थ में अलग है कि एक छवि के सभी मानों गैर नकारात्मक (कर रहे हैं एक्स आर + )। एक गाऊसी कर्नेल (फिल्टर) के साथ वार्तालाप एक गैर-नकारात्मक परिणाम की गारंटी देता है, इसलिए ऐसे फ़ंक्शन गैर-नकारात्मक मानों को अन्य गैर-नकारात्मक मानों ( f : R +R + ) के लिए मैप करते हैं । इसलिए परिणाम हमेशा एक और मान्य छवि है।एक्सआरएक्सआर+:आर+आर+

सामान्य तौर पर, इमेज प्रोसेसिंग में फ्रीक्वेंसी रिजेक्शन उतना महत्वपूर्ण नहीं है जितना 1 डी सिग्नल में। उदाहरण के लिए, मॉडुलन योजनाओं में आपके फिल्टर को विभिन्न वाहक आवृत्तियों पर प्रसारित अन्य चैनलों को अस्वीकार करने के लिए बहुत सटीक होने की आवश्यकता होती है। मैं छवि प्रसंस्करण समस्याओं के लिए विवश के रूप में कुछ भी नहीं सोच सकता।


21

गॉसियन फ़िल्टर का उपयोग छवि प्रसंस्करण में किया जाता है क्योंकि उनके पास एक संपत्ति है जो समय डोमेन में उनका समर्थन है, आवृत्ति डोमेन में उनके समर्थन के बराबर है। यह गाऊसी के अपने फूरियर ट्रांसफॉर्म होने के बारे में आता है।

इस के आशय क्या हैं? खैर, यदि फ़िल्टर का समर्थन या तो डोमेन में समान है, तो इसका मतलब है कि दोनों समर्थन का अनुपात 1. है। जैसा कि यह पता चला है, इसका मतलब है कि गाऊसी फिल्टर में 'न्यूनतम समय-बैंडविड्थ उत्पाद' है।

तो आप क्या कह सकते हैं? खैर, इमेज प्रोसेसिंग में, सफेद शोर को दूर करने के लिए एक बहुत ही महत्वपूर्ण कार्य है, सभी जबकि मुख्य किनारों को बनाए रखना है। यह एक विरोधाभासी कार्य हो सकता है - सफेद शोर सभी आवृत्तियों पर समान रूप से मौजूद है, जबकि उच्च आवृत्ति सीमा में किनारों का अस्तित्व है। (स्थानिक संकेतों में अचानक परिवर्तन)। फ़िल्टरिंग के माध्यम से पारंपरिक शोर हटाने में, एक सिग्नल कम पास फ़िल्टर्ड होता है, जिसका अर्थ है कि आपके सिग्नल में उच्च आवृत्ति घटक पूरी तरह से हटा दिए गए हैं।

लेकिन अगर छवियों में उच्च आवृत्ति वाले घटकों के रूप में किनारों होते हैं, तो पारंपरिक एलपीएफिंग भी उन्हें हटा देगा, और नेत्रहीन, यह खुद को किनारों के रूप में प्रकट करता है जो कि अधिक 'धब्बा' बन जाता है।

फिर कैसे, शोर को दूर करने के लिए, लेकिन उच्च आवृत्ति किनारों को भी संरक्षित करें? गाऊसी कर्नेल दर्ज करें। चूंकि एक गाऊसी का फूरियर ट्रांसफॉर्म भी एक गाऊसी है, इसलिए गौसियन फिल्टर में कुछ पास बैंड आवृत्ति पर तेज कटऑफ नहीं होता है जिसके आगे सभी उच्च आवृत्तियों को हटा दिया जाता है। इसके बजाय, इसकी एक सुंदर और प्राकृतिक पूंछ है जो आवृत्ति बढ़ने के साथ कभी कम हो जाती है। इसका मतलब यह है कि यह एक कम पास फिल्टर के रूप में कार्य करेगा, लेकिन उच्च आवृत्ति घटकों में यह भी अनुमति देता है कि इसकी पूंछ कितनी जल्दी तय होती है। (दूसरी ओर, एलपीएफ में एक उच्च समय बैंडविड्थ उत्पाद होगा, क्योंकि एफ-डोमेन में इसका समर्थन लगभग उतना बड़ा नहीं है जितना कि गॉसियंस का)।

यह तब दोनों दुनिया के सर्वश्रेष्ठ को प्राप्त करने की अनुमति देता है - शोर हटाने, प्लस किनारे संरक्षण।


2
मुझे यकीन नहीं है कि आप दोनों समर्थन की सीधे तुलना कर सकते हैं क्योंकि एक को समय / लंबाई में मापा जाता है और दूसरे को Hz / रेडियन में। उनकी आकृति विज्ञान समान है, लेकिन सार्वभौमिक स्केलिंग संपत्ति अभी भी रखती है।
फोनन जूल

न्यूनतम समय-बैंडविड्थ उत्पाद की याद दिलाने के लिए धन्यवाद। हालाँकि, जैसा कि फोनन ने उल्लेख किया है, स्थानिक (~ समय) डोमेन समर्थन को कम करने से बैंडविड्थ में वृद्धि होती है। ऐसा कोई तरीका नहीं है कि आप एक साधारण गाऊसी फिल्टर के साथ शोर दमन और किनारों को संरक्षित कर सकते हैं। यही कारण है कि पेरोना और मलिक ने अनिसोट्रोपिक फ़िल्टरिंग विकसित किया।
nimrodm

@Phonon जैसा कि मैंने देखा है, समर्थन केवल यह है कि कितने गैर-शून्य प्रविष्टियाँ डोमेन में फ़ंक्शन का वर्णन करती हैं - मुझे विश्वास है कि वे समान हैं। (इसलिए, 1 का अनुपात)। कहा जा रहा है, समय-बैंडविड्थ उत्पाद को समय और आवृत्ति में फ़ंक्शन के विचरण के उत्पाद के रूप में मापा जाता है। लेखकों से इसका सामान्यीकरण कैसे अलग है, मैंने इसे 1/2 या 1/4 के बराबर देखा है।
स्पेसी

1
@nimrodm "स्थानिक (~ समय) डोमेन समर्थन को कम करने से आवश्यक रूप से बैंडविड्थ बढ़ जाती है।", हाँ, यह प्रवृत्ति है , समय-आवृत्ति व्युत्क्रम संबंध से उपजी है। (यह वह जगह है जहाँ समय-आवृत्ति अनिश्चितता आती है)। हालाँकि, गाऊसी फ़ंक्शन एक वर्ग का है जो इस उत्पाद को पूरी तरह से कम करता है। समय और आवृत्ति के बीच व्युत्क्रम संबंध को देखते हुए, ऐसा करने का कोई तरीका नहीं है जब तक कि दोनों डोमेन में समान समर्थन न हो।
स्पेसी

@nimrodm अनिसोट्रोपिक विसरण में, मैंने जो गुठली देखी है, वह अभी भी गाऊसी है, यद्यपि सहसंयोजक मैट्रिक के साथ जो छवि के ढाल पर निर्भर हैं। (इसकी एक गैर-रेखीय विधि भी है, वीएस गॉसियन स्मूथिंग जो रैखिक है)। लेकिन, इसके गुणों के कारण गॉसियन का उपयोग किया जाता है।
स्पेसी

11

आपके पास पहले से ही अच्छे उत्तर हैं, लेकिन मैं अभी 2 डी गाऊसी फिल्टर की एक और उपयोगी संपत्ति जोड़ूंगा, जो कि वे अलग करने योग्य हैं , अर्थात 2 डी फिल्टर को 2 डी फिल्टर में विघटित किया जा सकता है। यह बड़े कर्नेल आकारों के लिए एक महत्वपूर्ण प्रदर्शन विचार हो सकता है, क्योंकि एक MxN वियोज्य फ़िल्टर को M+Nबहु-जोड़ के साथ लागू किया जा सकता है जबकि एक गैर-वियोज्य MxN फ़िल्टर को M*Nबहु-जोड़ की आवश्यकता होती है ।


2
यह एक अच्छा तर्क है। एक 2 डी गाऊसी फ़िल्टर रेडियल सममित और अभी भी अलग करने योग्य है इसलिए कार्यान्वयन जटिलता बहुत कम हो गई है।
13

1
एक संदर्भ के रूप में, द साइंटिस्ट एंड इंजीनियर गाइड टू डीएसपी अध्याय 24 में इस संपत्ति का एक उत्कृष्ट विवरण प्रदान करता है ।
कालेब रिस्तेर

6

इमेजमैगिक मैनुअल में इस बात का एक बड़ा विवरण है कि साइनस फ़ंक्शन को फ़िल्टर करने के कारण "रिंगिंग" प्रभाव होता है जबकि गॉसियन नहीं होते हैं। ( http://www.imagemagick.org/Usage/fourier/#blurring और http://www.imagemagick.org/Usage/fourier/#circle_spectrum )। जब आपकी छवि में किनारों (असंतोष) होते हैं (जो अधिकांश छवियां करते हैं) तो पूरी तरह से सभी उच्च आवृत्तियों को काटकर आप स्थानिक डोमेन में तरंगों के साथ छोड़ देते हैं। जब आप एक आयाम में एक sinc फ़ंक्शन के साथ वर्ग तरंगों को फ़िल्टर करते हैं तो आपको रिंगिंग भी मिलती है।


2

वहाँ पहले से ही सुंदर जवाब दिया गया है, लेकिन मैं नमक के अपने अनाज को जोड़ दूंगा, ओटी एक अलग परिप्रेक्ष्य:

सबसे अमूर्त स्तर पर फ़िल्टरिंग को कुछ कच्चे डेटा के लिए कुछ पूर्व ज्ञान को लागू करने के रूप में माना जा सकता है। इसका अर्थ है कि कुछ फ़िल्टरिंग एल्गोरिदम को लागू करना, उदाहरण के लिए, शोर अनुपात के संकेत में एक इष्टतम खोजने के लिए इसे लागू करना है।

छवि के लिए, एक शास्त्रीय पूर्व स्थिति के संबंध में मूल्यों (जैसे तीव्रता) की चिकनाई है (यह @Phonon द्वारा उल्लिखित बिंदु प्रसार फ़ंक्शन के रूप में देखा जा सकता है)। यह अक्सर एक गाऊसी के रूप में तैयार किया जाता है क्योंकि यह एक ज्ञात चिकनाई त्रिज्या (जिसे केंद्रीय सीमा प्रमेय कहा जाता है ) के साथ विभिन्न वस्तुओं का मिश्रण करते समय आपको प्राप्त होने वाला आकार होता है । यह ज्यादातर तब उपयोगी होता है जब आप किसी छवि के डेरिवेटिव बनाने की इच्छा रखते हैं: कच्चे सिग्नल (जो एक शोर आउटपुट उत्पन्न करेगा) पर अंतर करने के बजाय, आपको ऐसा करना चाहिए कि स्मूद इमेज पर। यह गैबर फिल्टर जैसे वेवलेट-जैसे ऑपरेटर को लागू करने के बराबर है ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.