कनवल्शन ऑपरेशन, सीधे शब्दों में कहें, दो मेट्रिसेस के तत्व-वार उत्पाद का संयोजन है। इसलिए जब तक ये दोनों मेट्रिक्स आयामों में सहमत होते हैं, तब तक कोई समस्या नहीं होनी चाहिए, और इसलिए मैं आपकी क्वेरी के पीछे की प्रेरणा को समझ सकता हूं।
A.1। हालाँकि, फ़िल्टर या कर्नेल के संदर्भ में आशय स्रोत डेटा मैट्रिक्स (संपूर्ण छवि) को एनकोड करना है। अधिक विशेष रूप से, हम एंकर / स्रोत पिक्सल के पड़ोस में पिक्सेल को एन्कोड करने की कोशिश कर रहे हैं। नीचे दिए गए चित्र पर एक नज़र डालें:
आमतौर पर, हम स्रोत छवि के प्रत्येक पिक्सेल को एंकर / स्रोत पिक्सेल मानते हैं, लेकिन हम ऐसा करने के लिए विवश नहीं हैं। वास्तव में, एक स्ट्राइड को शामिल करना असामान्य नहीं है, जहां हम लंगर / स्रोत पिक्सल को विशिष्ट संख्या में पिक्सेल द्वारा अलग किया जाता है।
ठीक है, तो स्रोत पिक्सेल क्या है? यह एंकर पॉइंट है जिस पर कर्नेल केंद्रित है और हम एंकर / स्रोत पिक्सेल सहित सभी पड़ोसी पिक्सेल को एन्कोडिंग कर रहे हैं। चूंकि, कर्नेल सममित रूप से आकार का है (कर्नेल मानों में सममित नहीं है), एंकर पिक्सेल के सभी पक्षों (4- कनेक्टिविटी) पर पिक्सेल की समान संख्या (एन) हैं। इसलिए, पिक्सेल की यह संख्या जो भी हो सकती है, हमारे सममित आकार के कर्नेल के प्रत्येक पक्ष की लंबाई 2 * n + 1 (एंकर पिक्सेल का प्रत्येक पक्ष) है, और इसलिए फ़िल्टर / कर्नेल हमेशा विषम आकार के होते हैं।
क्या होगा अगर हमने 'परंपरा' को तोड़ने का फैसला किया और असममित गुठली का इस्तेमाल किया? आपको त्रुटियों का सामना करना पड़ेगा, और इसलिए हम ऐसा नहीं करते हैं। हम पिक्सेल को सबसे छोटी इकाई मानते हैं, अर्थात यहाँ कोई उप-पिक्सेल अवधारणा नहीं है।
A.2 सीमा समस्या को विभिन्न दृष्टिकोणों का उपयोग करके निपटाया जाता है: कुछ इसे अनदेखा करते हैं, कुछ शून्य पैड, कुछ दर्पण इसे प्रतिबिंबित करते हैं। यदि आप एक व्युत्क्रम ऑपरेशन की गणना नहीं कर रहे हैं, यानी विघटन, और मूल छवि के सही पुनर्निर्माण में कोई दिलचस्पी नहीं है, तो आप सीमा की समस्या के कारण जानकारी के नुकसान या इंजेक्शन के नुकसान के बारे में परवाह नहीं करते हैं। आमतौर पर, पूलिंग ऑपरेशन (औसत पूलिंग या अधिकतम पूलिंग) आपकी सीमा कलाकृतियों को वैसे भी हटा देगा। इसलिए, अपने 'इनपुट क्षेत्र' के भाग को अनदेखा करने के लिए स्वतंत्र महसूस करें, आपका पूलिंग ऑपरेशन आपके लिए ऐसा करेगा।
-
सजा का ज़ेन:
पुराने स्कूल सिग्नल प्रोसेसिंग डोमेन में, जब इनपुट सिग्नल को दोषी ठहराया गया था या फ़िल्टर के माध्यम से पारित किया गया था, तो ए-प्राथमिकता का न्याय करने का कोई तरीका नहीं था जो कि दोषी / फ़िल्टर किए गए प्रतिक्रिया के घटक प्रासंगिक / सूचनात्मक थे और जो नहीं थे। नतीजतन, उद्देश्य इन परिवर्तनों में संकेत घटकों (यह सब) को संरक्षित करना था।
ये संकेत घटक सूचना हैं। कुछ घटक दूसरों की तुलना में अधिक जानकारीपूर्ण हैं। इसका एकमात्र कारण यह है कि हम उच्च-स्तरीय जानकारी निकालने में रुचि रखते हैं; कुछ शब्दार्थ वर्गों के प्रति प्रासंगिक जानकारी। तदनुसार, वे संकेत घटक जो हमें विशेष रूप से रुचि रखने वाली जानकारी प्रदान नहीं करते हैं, उन्हें बाहर निकाला जा सकता है। इसलिए, कनवल्शन / फ़िल्टरिंग के बारे में पुराने स्कूल के डॉगमास के विपरीत, हम पूल / प्रून को कन्वेक्शन रिस्पॉन्स के लिए स्वतंत्र हैं जैसा कि हम महसूस करते हैं। जिस तरह से हम ऐसा महसूस कर रहे हैं वह सभी डेटा घटकों को सख्ती से हटाने के लिए है जो हमारे सांख्यिकीय मॉडल को बेहतर बनाने में योगदान नहीं दे रहे हैं।