गाऊसी ब्लर - मानक विचलन, त्रिज्या और कर्नेल आकार


19

मैंने जीएलएसएल में एक गाऊसी ब्लर टुकड़ा शैडर लागू किया है। मैं इसके पीछे की मुख्य अवधारणाओं को समझता हूं: कनवल्शन, एक्स और वाई को रैखिकता का उपयोग करते हुए, त्रिज्या बढ़ाने के लिए कई पास ...

मेरे पास अभी भी कुछ सवाल हैं:

  • सिग्मा और त्रिज्या के बीच क्या संबंध है?

    मैंने पढ़ा है कि सिग्मा त्रिज्या के बराबर है, मैं यह नहीं देखता कि पिक्सों में सिग्मा कैसे व्यक्त की जाती है। या "त्रिज्या" सिर्फ सिग्मा के लिए एक नाम है, पिक्सल से संबंधित नहीं है?

  • मैं सिग्मा का चयन कैसे करूँ?

    मैंने सिग्मा को बढ़ाने के लिए कई पासों का उपयोग करने पर विचार करते हुए, मैं किसी भी दिए गए पास को प्राप्त करने के लिए एक अच्छा सिग्मा कैसे चुनूं? यदि परिणामस्वरूप सिग्मा वर्ग के वर्गों के योग के वर्गमूल के बराबर है और सिग्मा त्रिज्या के बराबर है, तो किसी भी वांछित त्रिज्या को प्राप्त करने का आसान तरीका क्या है?

  • कर्नेल के लिए अच्छा आकार क्या है, और यह सिग्मा से कैसे संबंधित है?

    मैंने देखा है कि अधिकांश कार्यान्वयन 5x5 कर्नेल का उपयोग करते हैं। यह शायद सभ्य गुणवत्ता के साथ तेजी से कार्यान्वयन के लिए एक अच्छा विकल्प है, लेकिन क्या एक और कर्नेल आकार चुनने का एक और कारण है? सिग्मा कर्नेल आकार से कैसे संबंधित है? क्या मुझे सबसे अच्छा सिग्मा ढूंढना चाहिए ताकि मेरी गिरी के बाहर गुणांक नगण्य हो और बस सामान्य हो जाए?

जवाबों:


21

सिग्मा और त्रिज्या के बीच क्या संबंध है? मैंने पढ़ा है कि सिग्मा त्रिज्या के बराबर है, मैं यह नहीं देखता कि पिक्सों में सिग्मा कैसे व्यक्त की जाती है। या "त्रिज्या" सिर्फ सिग्मा के लिए एक नाम है, पिक्सल से संबंधित नहीं है?

यहां खेलने के लिए तीन चीजें हैं। विचरण, ( σ2 ), त्रिज्या, और पिक्सेल की संख्या। चूंकि यह एक 2-आयामी गाऊसी समारोह है, यह सहप्रसरण मैट्रिक्स की बात करने के लिए समझ में आता है Σ बजाय। हालांकि, जैसा कि यह हो सकता है, उन तीन अवधारणाओं को कमजोर रूप से संबंधित है।

सबसे पहले, समीकरण द्वारा 2-डी गॉसियन दिया जाता है:

जी(z)=1(2π)2|Σ|-12(z-μ)टीΣ-1 (z-μ)

जहाँ एक कॉलम वेक्टर है जिसमें और आपकी छवि में समन्वयित होते हैं। तो, , और एक कॉलम वेक्टर है जो आपके फ़ंक्शन के माध्य को कोडित करता है, और दिशाओं में ।zएक्सyz=[एक्सy]μएक्सyμ=[μएक्सμy]

उदाहरण:

अब, हम कहते हैं कि हम सहसंयोजक मैट्रिक्स , और । मैं पिक्सल की संख्या भी 100 x 100 कर दूंगा । इसके अलावा, मेरा 'ग्रिड', जहां मैं इस पीडीएफ का मूल्यांकन करता हूं , x और y दोनों में - 10 से 10 तक जा रहा है । इसका मतलब है कि मेरे पास 10 का ग्रिड रिज़ॉल्यूशन है - ( - 10 )Σ=[1001]μ=[00]100100-1010एक्सy। लेकिन यह पूरी तरह से मनमाना है। उन सेटिंग्स के साथ, मुझे बाईं ओर संभाव्यता घनत्व फ़ंक्शन छवि मिलेगी। अब, यदि मैं 'विचरण' (वास्तव में, सहसंयोजक) को बदल देता हूँ, जैसे किΣ=[ ]और बाकी सब कुछ वैसा ही रखते हैं, तो मुझे दाईं ओर छवि मिलती है।10-(-10)100=0.2Σ=[9009]

यहां छवि विवरण दर्ज करें

दोनों के लिए पिक्सेल की संख्या अभी भी समान है, x 100 , लेकिन हमने विचरण को बदल दिया। बजाय मान लीजिए कि हमें एक ही प्रयोग करते हैं, लेकिन का उपयोग 20 x 20 के बजाय पिक्सल है, लेकिन मैं अभी भी से भाग गया - 10 करने के लिए 10 । फिर, मेरे ग्रिड का रिज़ॉल्यूशन 10 है - ( - 10 )1001002020-1010। यदि मैं पहले की तरह ही संजीवनी का उपयोग करता हूं, तो मुझे यह मिलता है:10-(-10)20=1

यहां छवि विवरण दर्ज करें

ये हैं कि आपको उन चरों के बीच के परस्पर क्रिया को कैसे समझना चाहिए। यदि आप कोड चाहते हैं, तो मैं यहां भी पोस्ट कर सकता हूं।

मैं सिग्मा का चयन कैसे करूँ?

आपके गाऊसी फ़िल्टर के विचरण / कोवरियन-मैट्रिक्स का विकल्प अत्यंत ही अनुप्रयोग पर निर्भर है। कोई सही जवाब नहीं है। यह पूछने जैसा है कि किसी फ़िल्टर के लिए बैंडविड्थ को क्या चुनना चाहिए। फिर से, यह आपके आवेदन पर निर्भर करता है। आमतौर पर, आप एक गाऊसी फिल्टर का चयन करना चाहते हैं जैसे कि आप अपनी छवि में उच्च आवृत्ति घटकों की काफी मात्रा में नल लगा रहे हैं। एक चीज जिसे आप एक अच्छा उपाय प्राप्त करने के लिए कर सकते हैं, वह है आपकी छवि के 2D DFT की गणना करना, और अपनी 2D गौसियन छवि के साथ इसके सह-प्रभावकों को ओवरले करना। यह आपको बताएगा कि सह-प्रभावकारिता पर भारी जुर्माना लगाया जा रहा है।

उदाहरण के लिए, यदि आपकी गाऊसी छवि में एक कोविरेंस इतना विस्तृत है कि यह आपकी छवि के कई उच्च आवृत्ति गुणांकों को घेर रहा है, तो आपको इसके सहसंयोजक तत्वों को छोटा करने की आवश्यकता है।


1
यदि वे क्रमिक कॉलॉर्मैप का उपयोग करते हैं तो वे चित्र बेहतर होंगे। जेट सबसे खराब है।

@endolith "बेहतर" आवेदन पर निर्भर करता है। जब दृश्य विपरीत भेदभाव की आवश्यकता होती है तो मैं जेट का उपयोग नहीं करता हूं। (गर्म बेहतर है)। हालांकि, संदेश गाऊसी के आकार के भीतर है, इसलिए जेट के साथ कोई नुकसान नहीं हुआ है। इस लिखाई के लिए धन्यवाद।
तारिणी ज़ियाई

2
यह एक अच्छी तरह से सोचा और वास्तव में अच्छी तरह से कल्पना जवाब है! उदाहरण के लिए, ऊपरी-बाईं छवि लें। यह स्पष्ट है कि विचरण और कर्नेल आकार का संयोजन बेकार होगा, क्योंकि यह एक 100x100 कर्नेल है जहां केवल केंद्र 30x30 (~ 9%) गैर-शून्य है।
एडम स्मिथ

5

पैरामीटर सिग्मा एक निरंतर दृष्टिकोण से गाऊसी धब्बा को परिभाषित करने के लिए पर्याप्त है। हालांकि अभ्यास में, चित्र और दृढ़ संकल्प गुठली असतत हैं। निरंतर गॉसियन कर्नेल का एक इष्टतम असतत सन्निकटन कैसे चुनें?

एक बड़ा त्रिज्या का उपयोग करते समय असतत सन्निकटन निरंतर गाऊसी कर्नेल के करीब होगा। लेकिन यह जोड़ा अभिकलन अवधि की लागत पर आ सकता है।

आदर्श रूप से, कोई सिग्मा के लिए एक मूल्य का चयन करेगा, फिर एक त्रिज्या की गणना करेगा, जो ईमानदारी से संबंधित गॉसियन कर्नेल का प्रतिनिधित्व करने की अनुमति देता है। किसी दिए गए सन्निकटन त्रुटि के लिए, बड़ा सिग्मा है, बड़ा त्रिज्या होना चाहिए।

दिलचस्प है, यह सही होने के लिए बहुत जटिल हो सकता है। गॉसियन मैट्रिक्स का निर्माण करते समय, निरंतर कर्नेल के नमूने के लिए सबसे अच्छा समाधान है या क्या बेहतर सन्निकटन हैं? ट्रंकेशन के लिए गणना करने के लिए गणना किए गए असतत कर्नेल को कैसे सामान्य किया जाए? आदि।

एक संदर्भ के रूप में, मैथेमेटिका में फ़ंक्शन गॉसियनमैट्रिक्स एक गाऊसी असतत मैट्रिक्स की गणना करने के कई तरीके पेश करता है, जैसे असतत बेसेल सन्निकटन का उपयोग करना। डिफ़ॉल्ट रूप से, त्रिज्या = 2 * सिग्मा, जिसका अर्थ है कि सिग्मा = 1 के साथ, मैट्रिक्स 5x5 होगा।


यह काफी पुराना सवाल है। लेकिन एक मैट्रिक्स में 2 * सिग्मा परिणाम का त्रिज्या 9x9 नहीं होगा?
Delusional Logic

@DelusionalLogic sigma = 1, त्रिज्या = 2 के साथ, इसलिए मैट्रिक्स का आकार 4 होगा, लेकिन विषम आकार की आवश्यकता होगी इसलिए आकार 5x5। कम से कम यह है कि मैं इसे कैसे
समझूँ

यदि त्रिज्या 2 है, तो पड़ोस केंद्र पिक्सेल को 2 पिक्सेल से बाईं ओर, 2 से दाईं ओर फैलाता है, यह केवल वह सम्मेलन है जो गणितज्ञ उपयोग करता है।
मथायस ओडिसियो

2

ऐसा लगता है कि की पंक्तियों पास्कल त्रिभुज एक गाऊसी काफी अच्छी तरह से अनुमान लगाने और पूर्णांक मूल्यों जिसका योग 2 के एक शक्ति (हम इन मूल्यों को स्टोर कर सकते हैं है होने के व्यावहारिक लाभ है बिल्कुल के रूप में पूर्णांकों, निश्चित बिंदु मूल्यों, या तैरता)। उदाहरण के लिए, मान लें कि हम 7x7 गाऊसी कर्नेल का निर्माण करना चाहते हैं जो हम पास्कल के त्रिकोण की 7 वीं पंक्ति का उपयोग कर सकते हैं:

यहां छवि विवरण दर्ज करें

ध्यान दें कि इस फिल्टर का कोनों पर न्यूनतम प्रभाव है जबकि शेष पूर्णांक मूल्यवान है। आप इसी मानक विचलन सिग्मा को निर्धारित करने के लिए मध्य मान 20/64 का उपयोग कर सकते हैं जो इस मामले में अनुमानित गौसियन के लिए 64 / (20 * sqrt (2 * pi)) = 1.276 है। आप यह देखने के लिए गॉसियन को ग्राफ़ कर सकते हैं कि यह एक उत्कृष्ट फिट है।

एक गाऊसी कर्नेल के लिए एक उचित मानक विचलन निर्धारित करने के लिए एक अच्छा प्रारंभिक बिंदु पास्कल ट्रायंगल (उर्फ द्विपद गुणांक ) से आता है - उपरोक्त निर्माण उपयोग के लिए इसी (एन + 1) x (एन + १) फिल्टर के लिए

यहां छवि विवरण दर्ज करें

वोल्फ्राम अल्फा का गाऊसीमैट्रिक्स [3] सिर्फ r / 2 = 1.5 का उपयोग करता है। अजीब तरह से, गौसियनमैट्रिक्स [{3,1.276}] में उतने ही 2 डी फिल्टर का उत्पादन नहीं होता है और 3 और 3 के बीच x, y के लिए निम्नलिखित नहीं है:

यहां छवि विवरण दर्ज करें

मुझे यकीन नहीं है कि क्यों नहीं? मेरा 2D फ़िल्टर एक उत्कृष्ट फिट है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.