उस सूत्र का अर्थ वास्तव में काफी सरल है। कल्पना कीजिए कि आप एक ही आकार के दो छोटे क्षेत्रों को लेते हैं, नीला एक और लाल एक:
विंडो फ़ंक्शन लाल आयत के बाहर 0 के बराबर है (सादगी के लिए, हम मान सकते हैं कि विंडो लाल आयत के भीतर स्थिर है)। इसलिए विंडो फ़ंक्शन का चयन करता है कि आप किस पिक्सेल को देखना चाहते हैं और प्रत्येक पिक्सेल को सापेक्ष भार प्रदान करते हैं। (सबसे आम गॉसियन विंडो है, क्योंकि यह घूर्णी रूप से सममित है, जो खिड़की के केंद्र के पास पिक्सल की गणना और जोर देने के लिए कुशल है।) नीले आयत को (यू, वी) द्वारा स्थानांतरित किया जाता है।
आगे आप लाल और नीले रंग में अंकित छवि भागों के बीच वर्गीय अंतर की राशि की गणना करते हैं, अर्थात आप पिक्सेल द्वारा उन्हें पिक्सेल घटाते हैं, अंतर को वर्ग करते हैं और परिणाम को जोड़ते हैं (सरलता के लिए, उस क्षेत्र में खिड़की = 1 जो हम देख रहे हैं। पर)। यह आपको हर संभव (यू, वी) -> ई (यू, वी) के लिए एक नंबर देता है।
आइए देखें कि क्या होता है यदि हम यू / वी के विभिन्न मूल्यों के लिए गणना करते हैं:
पहले v = 0 रखें:
यह कोई आश्चर्य की बात नहीं होनी चाहिए: छवि भागों के बीच का अंतर सबसे कम है जब उनके बीच ऑफसेट (यू, वी) 0. है जैसा कि आप दोनों पैच के बीच की दूरी बढ़ाते हैं, वर्ग अंतर का योग भी बढ़ता है।
यू रखते हुए = 0:
प्लॉट समान दिखता है, लेकिन जब आप किनारे की दिशा में नीले आयत को स्थानांतरित करते हैं, तो दो छवि भागों के बीच वर्ग अंतर का योग बहुत छोटा होता है।
E (u, v) का पूरा प्लॉट इस तरह दिखता है:
साजिश एक "घाटी" की तरह दिखती है: यदि आप घाटी की दिशा में छवि को स्थानांतरित करते हैं तो केवल एक छोटा सा अंतर है। ऐसा इसलिए है क्योंकि इस छवि पैच में एक प्रमुख (ऊर्ध्वाधर) अभिविन्यास है।
हम एक अलग छवि पैच के लिए ऐसा ही कर सकते हैं:
यहाँ, E (u, v) का प्लॉट अलग दिखता है:
कोई फर्क नहीं पड़ता कि आप पैच को किस तरह से स्थानांतरित करते हैं, यह हमेशा अलग दिखता है।
तो फ़ंक्शन E (u, v) का आकार हमें छवि पैच के बारे में कुछ बताता है
- यदि E (u, v) हर जगह 0 के पास है, तो जिस छवि पैच को आप देख रहे हैं, उसमें कोई बनावट नहीं है
- यदि ई (यू, वी) "घाटी के आकार का" है, तो पैच में एक प्रमुख अभिविन्यास होता है (यह एक किनारे या बनावट हो सकता है)
- यदि ई (यू, वी) "शंकु के आकार का" है, तो पैच में बनावट है, लेकिन कोई प्रमुख अभिविन्यास नहीं है। इस तरह के पैच एक कोने-डिटेक्टर की तलाश में है।
कई संदर्भ कहते हैं कि यह वह परिमाण है जिसके द्वारा विंडो 'w' स्थानांतरित हो गई ... तो विंडो को कितना स्थानांतरित किया गया? एक पिक्सेल ... दो पिक्सेल?
आम तौर पर, आप ई (यू, वी) की गणना बिल्कुल नहीं करते हैं। आप केवल (u, v) = (0,0) के पड़ोस में इसके आकार में रुचि रखते हैं। तो आप बस (0,0) के पास ई (यू, वी) के टेलर विस्तार चाहते हैं, जो पूरी तरह से इसके "आकार" का वर्णन करता है।
क्या विंडो द्वारा कवर पिक्सेल पदों पर योग है?
गणितीय रूप से बोलना, सभी पिक्सेल्स पर योग की सीमा देना अधिक सुरुचिपूर्ण है। व्यावहारिक रूप से समन पिक्सल का कोई मतलब नहीं है जहां खिड़की 0 है।