स्केल और रोटेशन अपरिवर्तनीय विशेषता वर्णनकर्ता


16

क्या आप फ़ीचर डिटेक्शन में उपयोग के लिए कुछ पैमाने और घूर्णी अपरिवर्तनीय फ़ीचर डिस्क्रिप्टर सूचीबद्ध कर सकते हैं।

आवेदन कारों और मनुष्यों का पता लगाने के लिए है, जो एक यूएवी द्वारा कब्जा कर लिया गया है, एक बहु-वर्गीय क्लासिफायरफ़ायर का उपयोग कर रहा है।

अब तक मैं सिफ्ट और एमएसईआर (जो कि कम आयी है) को देख रहा हूं। मैंने LESH को भी देखा है, LESH स्थानीय ऊर्जा मॉडल पर आधारित है, लेकिन इस तरह से गणना की जाती है जो घूर्णी रूप से अनियंत्रित नहीं होती है, मैं स्थानीय ऊर्जा का उपयोग करने के लिए, एक घूर्णी रूप से अपरिवर्तनीय बनाने के लिए सोचने की कोशिश कर रहा हूं फीचर डिस्क्रिप्टर, मैंने यहां पढ़ा कि SIFT / SURF के लिए कुछ मुफ्त विकल्प क्या हैं जो वाणिज्यिक अनुप्रयोगों में उपयोग किए जा सकते हैं? , कि "यदि आप रुचि बिंदु के लिए अभिविन्यास प्रदान करते हैं और तदनुसार छवि पैच को घुमाते हैं, तो आपको मुफ्त में रोटेशनल इनविर्सेंस मिलता है", लेकिन यह नहीं जानते कि क्या यह भी रिलीवर है या मैं इसे अपनी समस्या पर कैसे लागू कर सकता हूं, कोई मदद होगी सराहना की, धन्यवाद


OpenCV लाइब्रेरी से ORB (ओरिएंटेड फास्ट एंड रोटेटेड BRIEF) का उपयोग करें।
हर्षवर्धन

जवाबों:


9

जहाँ तक SIFT / SURF जाने के विकल्प हैं, आपके द्वारा जुड़ा प्रश्न बहुत अच्छा उत्तर प्रदान करता है।

दो और प्रश्न थे जिन्हें मैं पढ़ सकता था:

  • "मैं एक उपयोगी (जैसे रोटेशन इनवेरिएंट) सुविधा डिस्क्रिप्टर कैसे बना सकता हूं"?
  • "जुड़े हुए प्रश्न के विवरण के बारे में, वह कैसे मुक्त घूर्णी आक्रमण को पूरा करता है?"

भवन की विशेषता वर्णनकर्ता

यह एक मान्य शोध विषय है। अच्छा फीचर डिस्क्रिप्टर ऐसी चीज नहीं है जिसे कोई भी दोपहर में बना सकता है। लोग लेखों को प्रकाशित करते हैं जब वे वांछित गुणों के साथ वर्णनकर्ता को सफलतापूर्वक मॉडल करते हैं। यह एक कारण है कि वर्तमान में केवल कुछ ही अत्याधुनिक डिस्क्रिप्टर का उपयोग किया जाता है, और वह यह भी है कि मैं आपको क्या करने की सलाह देता हूं: एक ऐसा फीचर डिस्क्रिप्टर खोजें जो आपकी आवश्यकताओं के लिए अच्छा हो

"मुक्त करने के लिए" घूर्णी आक्रमण को प्राप्त करना

0|black->gray->white||white->gray->black|-9090

इस तरह आप हमेशा एक ही प्रमुख अभिविन्यास (घुमाए गए पैच) के साथ एक छवि पैच पर वर्णनकर्ता की गणना करेंगे, और इस प्रकार आप घूर्णी चालन प्राप्त करेंगे।


4

मुक्त करने के लिए घूर्णी इनवेरियन प्राप्त करने का एक और तरीका है, ऐसी वस्तुओं का चयन करना जो घूर्णी रूप से अक्रियाशील हों। उदाहरण के लिए, एक वृत्त या वलय घूमने के लिए अपरिवर्तनीय है।

फ़ीचर एक्सट्रैक्टर : रन एज डिटेक्शन। NxNपिक्सेल के प्रत्येक पड़ोस के लिए , किनारे की दिशा और परिमाण 2D हिस्टोग्राम की गणना करें। उन सभी बिंदुओं को खोजें जिनमें उच्च परिमाण है, और उच्च कोणीय प्रसार है । उन सभी बिंदुओं को निकालें जिनमें रेडियल समरूपता नहीं है।

फ़ीचर डिस्क्रिप्टर : प्रत्येक वृत्ताकार वस्तु का केंद्र ज्ञात करें। चूँकि वस्तु गोलाकार है, इसका कोई प्रमुख ढाल कोण नहीं है। सभी कोण समान हैं। इस प्रकार, एक रेडियल प्रोफाइल (ध्रुवीय निर्देशांक में पिक्सेल मूल्य का योग) एक कोण अपरिवर्तनीय विवरणक है।


वैसे, यह एक कारण है कि फिडुशियल को विद्युत सर्किट बोर्डों पर हलकों के रूप में निर्मित किया जाता है:

यहाँ छवि विवरण दर्ज करें


हम के बारे में Keypoint (फीचर) बात कर रहे हैं वर्णनकर्ता । यदि हम सुविधाओं (ब्याज बिंदु) के बारे में बात कर रहे थे , तो परिपत्र पैच का पता लगाना उपयोगी हो सकता है - वे प्रत्येक विवरणक के साथ संयोजन में घूर्णी अक्रियाशील हैं। लेकिन एक परिपत्र पैच पर गणना करने वाला एक डिस्क्रिप्टर नहीं है - काले रंग में क्षैतिज व्यास के साथ एक सफेद सर्कल, और एक ऊर्ध्वाधर के साथ बहुत अलग डिस्क्रिप्टर का उत्पादन होगा यदि घूर्णी रूप से अपरिवर्तनीय विधि का उपयोग नहीं किया जाता है
पेनेलोप

@ हेनेलोपे, क्यों नहीं? निम्नलिखित डिस्क्रिप्टर पर विचार करें - पैच का एक थंबनेल, और आप इसे अन्य विवरणों के साथ सामान्यीकृत क्रॉस-सहसंबंध के साथ तुलना करते हैं। आप इस तरह से अन्य वस्तुओं के साथ गलती नहीं कर सकते।
एंड्री रूबश्टिन

क्षमा करें, मुझे समझ नहीं आ रहा है कि "पैच का थंबनेल" क्या आप समझा सकते हैं? और विवरणक: सामान्यीकृत corss-correlation of you पैच वही है जो इसे घूर्णी रूप से अक्रियाशील बनाता है, इस तथ्य से नहीं कि आपका पैच रिंग या सर्कल था।
पेनेलोप

@ लेपेलोपे, मुझे अब लगता है कि मैं पर्याप्त स्पष्ट नहीं था। मैं कल इसका विस्तार करने की कोशिश करूंगा। आपकी टिप्पणी के लिए धन्यवाद।
एंड्री रुबेश्टिन

इसके लिए आगे देख रहे हैं :)
पेनेलोप

1

मैं KAZE / AKAZE में देखना चाहता हूं, जो महत्वपूर्ण गति के साथ समान रूप से अच्छा प्रदर्शन करता है। विकृति के मामलों को भी सहन किया जाता है। OpenCV ने हाल ही में GSoC 2014 के माध्यम से एक कार्यान्वयन प्राप्त किया है। आप इसे यहां पा सकते हैं ।


1

यदि आप लॉग-ध्रुवीय निर्देशांक (रुचि के बिंदु में मूल के साथ) के लिए एक सुविधा बिंदु के आसपास एक स्थानीय पैच को रीमैप करते हैं, तो स्केल परिवर्तन लॉग-रेडियल अक्ष के साथ अनुवाद के अनुरूप होते हैं, जबकि घुमाव अनुवाद के अनुरूप होते हैं (रैप-अराउंड के साथ) कोणीय अक्ष के साथ। यदि आप दो आयामी फूरियर रूपांतरण की गणना करते हैं, तो रेडियल और कोणीय दिशाओं में अनुवाद आवृत्ति डोमेन में चरण शिफ्ट बन जाते हैं। यदि आप फिर फूरियर रूपांतरण के निरपेक्ष मान की गणना करते हैं, तो चरण पूरी तरह से गायब हो जाता है, और मूल छवि पैच के पैमाने पर परिवर्तन और घुमाव ध्यान नहीं देते हैं। तो लॉग-इन-पूल निर्देशांक में छवि के 2 डी फूरियर रूपांतरण का पूर्ण मूल्य आपका फीचर डिस्क्रिप्टर होगा।

ठीक है, कम से कम सिद्धांत में। व्यवहार में, आपको अपने पैच के रेडियल विस्तार को सीमित करने की आवश्यकता है। इसका मतलब यह है कि आपको फूरियर ट्रांसफॉर्म (जो वास्तव में फूरियर श्रृंखला है) की गणना करने से पहले अपने डेटा का एक बड़ा हिस्सा काट देना होगा, इसलिए लॉग-ध्रुवीय निर्देशांक में लॉग-रेडियल दिशा के साथ एक अनुवाद वास्तव में सिर्फ एक के अनुरूप नहीं है फ़्रीक्वेंसी डोमेन में अब चरण परिवर्तन नहीं होता है, इसलिए यह विधि पूरी तरह से पैमाना नहीं है। मुझे संदेह है कि अगर आप कुछ विंडो फ़ंक्शन का उपयोग करते हैं - बिना किसी छूट के - लॉग-रेडियस के समन्वय पर और इसे रंग की तीव्रता के साथ गुणा किया जाता है, तो यह समस्या कुछ हद तक कम हो जाएगी।

हालाँकि, सुविधा विवरणक यह अभी भी पूरी तरह से घूर्णन-अपरिवर्तनीय होना चाहिए।

संदर्भ: स्केल चयन के बिना स्केल इनवेरियन


0

आप FAST और BRISK की जांच भी कर सकते हैं ।


जहां तक ​​मैंने खोजा है, FAST केवल एक डिटेक्टर है जिसका उपयोग कई अलग-अलग डिस्क्रिप्टर संयोजनों के साथ किया जाता है। और, FAST और BRISK पहले से ही उस प्रश्न का उल्लेख है जो ओपी ने खुद को लिंक किया है, इसलिए मुझे लगता है कि उसे इन विधियों के अस्तित्व के बारे में पहले से ही जानकारी है।
पेनेलोप
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.