हैरिस कोने बिंदु का पता लगाने का गणित


23

यह हैरिस कोने का पता लगाने के लिए गणितीय अभिव्यक्ति है:

यह हैरिस कोने का पता लगाने के लिए गणितीय अभिव्यक्ति है ...

लेकिन मुझे निम्नलिखित संदेह हैं:

  1. और का भौतिक महत्व क्या है ? कई संदर्भ कहते हैं कि यह परिमाण है जिसके द्वारा खिड़की है स्थानांतरित कर दिया। तो विंडो को कितना शिफ्ट किया गया है? एक पिक्सेल या दो पिक्सेल?यूvw
  2. क्या विंडो द्वारा कवर पिक्सेल पदों पर योग है?
  3. बस , मान लेना एकल पर पिक्सेल की तीव्रता है या केंद्र साथ विंडो के अंदर तीव्रता का योग है ?w(एक्स,y)=1मैं(एक्स,y)(एक्स,y)(एक्स,y)
  4. विकी के अनुसार वे कहते हैं कि छवि 2D है, जिसे I द्वारा निरूपित किया गया है और फिर क्षेत्र पर एक छवि पैच पर विचार करने के लिए कहता है , फिर संकेतन का उपयोग करता है(एक्स,y)मैं(एक्स,y)

मैं इसे गणितीय स्पष्टीकरण को समझने के लिए भ्रमित कर रहा हूं। किसी को एक विचार है?


2
हैरिस कॉर्नर डिटेक्टर पर इस व्याख्यान की जाँच करें। यह बहुत स्पष्ट है: youtube.com/watch?v=P35WsRDnTsU&t=41m12s

मैंने अपने व्यक्तिगत ब्लॉग में एक पोस्ट लिखी है जो ऊपर दिए गए व्याख्यान पर आधारित है। matlabcorner.wordpress.com/2012/11/17/…
एंड्री रुबेश्टिन

जवाबों:


31

उस सूत्र का अर्थ वास्तव में काफी सरल है। कल्पना कीजिए कि आप एक ही आकार के दो छोटे क्षेत्रों को लेते हैं, नीला एक और लाल एक:

यहाँ छवि विवरण दर्ज करें

विंडो फ़ंक्शन लाल आयत के बाहर 0 के बराबर है (सादगी के लिए, हम मान सकते हैं कि विंडो लाल आयत के भीतर स्थिर है)। इसलिए विंडो फ़ंक्शन का चयन करता है कि आप किस पिक्सेल को देखना चाहते हैं और प्रत्येक पिक्सेल को सापेक्ष भार प्रदान करते हैं। (सबसे आम गॉसियन विंडो है, क्योंकि यह घूर्णी रूप से सममित है, जो खिड़की के केंद्र के पास पिक्सल की गणना और जोर देने के लिए कुशल है।) नीले आयत को (यू, वी) द्वारा स्थानांतरित किया जाता है।

आगे आप लाल और नीले रंग में अंकित छवि भागों के बीच वर्गीय अंतर की राशि की गणना करते हैं, अर्थात आप पिक्सेल द्वारा उन्हें पिक्सेल घटाते हैं, अंतर को वर्ग करते हैं और परिणाम को जोड़ते हैं (सरलता के लिए, उस क्षेत्र में खिड़की = 1 जो हम देख रहे हैं। पर)। यह आपको हर संभव (यू, वी) -> ई (यू, वी) के लिए एक नंबर देता है।

आइए देखें कि क्या होता है यदि हम यू / वी के विभिन्न मूल्यों के लिए गणना करते हैं:

पहले v = 0 रखें:

यहाँ छवि विवरण दर्ज करें

यह कोई आश्चर्य की बात नहीं होनी चाहिए: छवि भागों के बीच का अंतर सबसे कम है जब उनके बीच ऑफसेट (यू, वी) 0. है जैसा कि आप दोनों पैच के बीच की दूरी बढ़ाते हैं, वर्ग अंतर का योग भी बढ़ता है।

यू रखते हुए = 0:

यहाँ छवि विवरण दर्ज करें

प्लॉट समान दिखता है, लेकिन जब आप किनारे की दिशा में नीले आयत को स्थानांतरित करते हैं, तो दो छवि भागों के बीच वर्ग अंतर का योग बहुत छोटा होता है।

E (u, v) का पूरा प्लॉट इस तरह दिखता है:

यहाँ छवि विवरण दर्ज करें

साजिश एक "घाटी" की तरह दिखती है: यदि आप घाटी की दिशा में छवि को स्थानांतरित करते हैं तो केवल एक छोटा सा अंतर है। ऐसा इसलिए है क्योंकि इस छवि पैच में एक प्रमुख (ऊर्ध्वाधर) अभिविन्यास है।

हम एक अलग छवि पैच के लिए ऐसा ही कर सकते हैं:

यहाँ छवि विवरण दर्ज करें

यहाँ, E (u, v) का प्लॉट अलग दिखता है:

यहाँ छवि विवरण दर्ज करें

कोई फर्क नहीं पड़ता कि आप पैच को किस तरह से स्थानांतरित करते हैं, यह हमेशा अलग दिखता है।

तो फ़ंक्शन E (u, v) का आकार हमें छवि पैच के बारे में कुछ बताता है

  • यदि E (u, v) हर जगह 0 के पास है, तो जिस छवि पैच को आप देख रहे हैं, उसमें कोई बनावट नहीं है
  • यदि ई (यू, वी) "घाटी के आकार का" है, तो पैच में एक प्रमुख अभिविन्यास होता है (यह एक किनारे या बनावट हो सकता है)
  • यदि ई (यू, वी) "शंकु के आकार का" है, तो पैच में बनावट है, लेकिन कोई प्रमुख अभिविन्यास नहीं है। इस तरह के पैच एक कोने-डिटेक्टर की तलाश में है।

कई संदर्भ कहते हैं कि यह वह परिमाण है जिसके द्वारा विंडो 'w' स्थानांतरित हो गई ... तो विंडो को कितना स्थानांतरित किया गया? एक पिक्सेल ... दो पिक्सेल?

आम तौर पर, आप ई (यू, वी) की गणना बिल्कुल नहीं करते हैं। आप केवल (u, v) = (0,0) के पड़ोस में इसके आकार में रुचि रखते हैं। तो आप बस (0,0) के पास ई (यू, वी) के टेलर विस्तार चाहते हैं, जो पूरी तरह से इसके "आकार" का वर्णन करता है।

क्या विंडो द्वारा कवर पिक्सेल पदों पर योग है?

गणितीय रूप से बोलना, सभी पिक्सेल्स पर योग की सीमा देना अधिक सुरुचिपूर्ण है। व्यावहारिक रूप से समन पिक्सल का कोई मतलब नहीं है जहां खिड़की 0 है।


एक टन Nikie .... Thanx
rotating_image

2
मुझे पता था कि आपको यहाँ एक उत्कृष्ट उत्तर मिलेगा, @rotating_image
karlphillip


1
एक लाख अपवित्र!
फोनन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.