फ़ीचर डिटेक्शन से पहले इमेज प्रोसेसिंग


9

मैंने हैरिस कोनों पर आधारित एक फीचर डिटेक्टर लागू किया है । यह ज्यादातर बार ठीक काम करता है, लेकिन ऐसे मामले हैं जहां यह खराब प्रदर्शन करता है। मुझे इसे व्यक्तिगत रूप से कॉन्फ़िगर किए बिना कई अलग-अलग छवियों पर काम करने की आवश्यकता है।

समस्या डिटेक्टर थ्रेशोल्ड मान के साथ है। यदि बहुत कम सेट किया जाता है, तो डिटेक्टर कई बार आग लग जाता है जिसके परिणामस्वरूप बड़ी संख्या में विशेषताएं होती हैं। यदि बहुत अधिक सेट किया जाता है, तो बहुत कम विशेषताएं हैं।

मैंने एएनएमएस ( एडेप्टिव नॉन- मैक्सिमल सप्रेशन) द्वारा आंशिक रूप से इसे हल किया है ताकि उन्हें डिस्क्रिप्टर वैक्टर सौंपने से पहले सुविधाओं की संख्या कम हो सके।

हालाँकि, इस तरह की छवियाँ समस्या हैं:

यहाँ छवि विवरण दर्ज करें

उनके पास कम कंट्रास्ट है और मैं सभी इमेज के लिए थ्रेशोल्ड को बहुत कम "सेट" नहीं कर सकता। यह इन छवियों पर काम करने के लिए डिटेक्टर का कारण होगा, लेकिन अन्य छवियों में हजारों विशेषताएं शामिल होंगी, जो एएनएमएस के साथ फ़िल्टर करने में धीमी होंगी और इससे समग्र प्रदर्शन को नुकसान होगा।

मैं फीचर डिटेक्शन से पहले इमेज को एडजस्ट करने के बारे में सोच रहा था। शायद हिस्टोग्राम बराबरी का काम करेगा। यह एक मान्य ऑपरेशन हो सकता है क्योंकि कंट्रास्ट के वैश्विक परिवर्तन का फीचर डिस्क्रिप्टर पर कोई प्रभाव नहीं पड़ता है (वे चमक और कंट्रास्ट में बदलाव के लिए अपरिवर्तनीय हैं)।

शायद अनुकूली दहलीज या कुछ अनुमान के साथ काम करना बेहतर होगा।

कोई अन्य सुझाव?


@ सिहमस गुंग्रेन: ओह। मैंने अब तक मिले जवाबों को स्वीकार कर लिया है क्योंकि मुझे संतोषजनक पर्याप्त समाधान मिल गए हैं, लेकिन अभी भी बेहतर या अधिक विस्तृत उत्तरों की प्रतीक्षा है।
लिबोर

@ लिबर आपके नए प्रश्नों के लिए अच्छा है क्योंकि मौजूदा मामले में आपके प्रश्नों को हल करने के लिए यह अधिक आकर्षक हो सकता है।
सेहुम्स गुंग्रेन

@ लिबोर क्या आपने हिस्टोग्राम मिलान को हिस्टोग्राम की तरह गाऊसी चुनने पर विचार किया है जिसका मतलब लगभग 128 है?
सेहुम्स गुंग्रेन 17

@ SeyhmusGüngören हां मैं इस बारे में सोच रहा था। मैं शायद कुछ अन्य विचारों के साथ कोशिश करूंगा।
लिबोर

@ लिब्रो क्या आप यह कह सकते हैं कि आप कैसे पता की गई सुविधाओं का उपयोग करने की योजना बना रहे हैं? मेरे केवल विचार सामग्री आधारित छवि पुनर्प्राप्ति या मिलान (जैसे होमोग्राफी अनुमान के लिए) हैं, लेकिन चूंकि केवल एक चीज जो मैंने कभी उनके साथ की है वह गलत हो सकती है :) यदि, दूसरी ओर, तो वही है जिसका आप उपयोग करने की योजना बना रहे हैं उनके लिए, मैं योगदान करने में सक्षम हो सकता हूं।
पेनेलोप

जवाबों:


1

एक संभावना होगी कि आप एक साधारण एज डिटेक्शन (जैसे लैपल्स) करें, और हैरिस कोनों के लिए सीमा के आधार पर परिणाम की औसत तीव्रता का उपयोग करें। जब आपके पास कम कंट्रास्ट होता है, तो आपको कम किनारे मिलेंगे और कम तीव्रता के साथ, उच्च कंट्रास्ट के साथ आपको अधिक किनारे मिलेंगे और उच्च तीव्रता के साथ।

आप इस समस्या से जूझने वाले एकमात्र व्यक्ति नहीं हैं। यदि आपके पास पेपर डेटाबेस तक पहुँच है, तो यह दिलचस्प हो सकता है:

यह (ऑटो) अनुकूली हैरिस कोने का पता लगाने के लिए और अधिक खोज के लायक हो सकता है।


यह एक विरोधाभास नहीं है। डिटेक्टर के दो चरण हैं: 1) सुविधाओं का पता लगाएं, 2) सुविधाओं का वर्णन करें। हिस्टोग्राम बराबरी का चरण 1 पर प्रभाव होना चाहिए (अधिक विशेषताओं का पता लगाया गया है), मंच 2 पर नहीं। मुझे पता लगाने के लिए मध्यम मात्रा की सुविधाओं की आवश्यकता है, इसलिए उन्हें बहुत अधिक फ़िल्टर करने की आवश्यकता नहीं है।
लिबोर

ठीक है, मैंने यह सोचा था, लेकिन यह आपके प्रश्न से पूरी तरह से स्पष्ट नहीं था। मैं फीचर डिटेक्टर के लिए इनपुट के रूप में किनारे की छवि का उपयोग करने का मतलब नहीं है, लेकिन आपके स्वयं के माप के रूप में कि दहलीज के लिए मूल्य क्या होना चाहिए।
गीर्टेन

धन्यवाद, यह एक दिलचस्प विचार है। हैरिस कॉर्नर डिटेक्टर प्रत्येक बिंदु पर कोने के माप का निर्माण करने के लिए व्युत्पन्न छवियों (डीएक्स, डाई, डीएक्सआई) का उपयोग करता है। चूंकि यह पहले से ही बढ़त के उपायों पर आधारित है, इसलिए अब मैं कोने के प्रतिक्रिया समारोह के हिस्टोग्राम और उस हिस्टोग्राम के कंप्यूटिंग सीमा के बारे में सोच रहा हूं। आपने मुझे प्रेरित किया, धन्यवाद :)
Libor

मुझे खुशी है कि मैं आपको प्रेरित कर सकता हूं;) एक कागज जोड़ा जो सहायक हो सकता है।
गीर्टेन

2

क्या आपको वास्तव में हैरिस कोनों का उपयोग करना है? बेहतर गुणों के साथ हैरिस कोनों के बाद कई विशेषताएं विकसित हुई हैं। इस लेख में एक अच्छा अवलोकन पाया जा सकता है:

उस लेख के साथ-साथ मेरे व्यक्तिगत अनुभव के आधार पर, मैं या तो MSER (Maximally Stable Extermal Region) पर स्विच करने का सुझाव दूंगा , या यहां तक ​​कि उन्हें DoG (गौसियंस का अंतर) के साथ जोड़ दूंगा - पहली बार SIFT पाइपलाइन के एक भाग के रूप में प्रस्तुत की गई सुविधाएँ।

यदि समस्या वास्तव में कम विपरीत है , तो एमएसईआर सुविधाओं को वास्तव में आपको खुश करना चाहिए: वे प्रकाश में परिवर्तन के लिए (काफी) अपरिवर्तनीय हैं। संक्षेप में, वे विभिन्न थ्रेशोल्ड बायनेरिज़ेशन की एक श्रृंखला के माध्यम से स्थिर छवि से जुड़े क्षेत्र हैं।

फीचर निष्कर्षण प्रक्रिया वर्णनकर्ताओं की गणना से स्वतंत्र है, इसलिए आपकी प्रक्रिया में फीचर निष्कर्षण के नए तरीकों को एकीकृत करना बहुत कठिन नहीं होना चाहिए।

इसके अलावा, मैंने हैरिस के कोनों के विस्तार के रूप में मल्टीस्केल हैरिस कोनों के बारे में (लेकिन वास्तव में कभी काम नहीं किया है) के बारे में सुना है । मैं उनके बारे में ज्यादा नहीं जानता और व्यक्तिगत रूप से इस विषय पर किसी भी पढ़ने की सामग्री की सिफारिश नहीं कर सकता, इसलिए मैं लेख खोज और आपके लिए सबसे दिलचस्प सामग्री चुन रहा हूं।


इसके अलावा, मैं सुझाव दे सकता हूं कि आपके द्वारा पोस्ट की गई छवि में कम विपरीत के अलावा अन्य समस्याएं हो सकती हैं । मेरे व्यक्तिगत अनुभव में, वनस्पति जैसे झाड़ियों या संभवतः आपके पास क्षेत्र, साथ ही प्यारे चुलबुले बादल "जेनेरिक सुविधाओं" का उत्पादन करते हैं - ऐसी विशेषताएं जो समान रूप से समान (या असमान) वर्णन करने वालों को अन्य सुविधाओं के समान हैं।

व्यावहारिक रूप से, इसका मतलब यह है कि जब अलग-अलग दृष्टिकोण से दो छवियों पर फीचर मिलान करते हैं, तो इस प्रकार की सतहों से निकाले गए फीचर्स का गलत तरीके से मिलान किया जाता है। मैंने एक मास्टर थीसिस किया है कि जब मैं इस समस्या के पार आया तो दो छवियों के बीच एक होमोग्राफी परिवर्तन की गणना करने के लिए उपयोग किए जाने वाले फ़ीचर निष्कर्षण में उपयोग किए जाने वाले फीचर एक्सट्रैक्शन के साथ एक बड़े हिस्से का सौदा करता है। मुझे उस समय इस समस्या का वर्णन करने वाला कोई अन्य लेख नहीं मिला, लेकिन मेरी थीसिस आपके समग्र दृष्टिकोण के लिए सहायक हो सकती है।

अंत में, जैसा कि आपने सेट किया है, थ्रेसहोल्ड और तकनीकें जो कि ज्यादातर छवियों पर ठीक काम करती हैं, इस तरह की छवियों में बहुत कम विशेषताएं हैं, क्योंकि इसके ज्यादातर सजातीय क्षेत्र हैं। इस तरह की छवियां फ़ीचर मैचिंग (जो कि इमेज स्टिचिंग तक बढ़ाई जा सकती हैं), कंटेंट बेस्ड इमेज रिट्रीवल में समस्याएँ पेश करती हैं, और मैं ट्रैकिंग के साथ-साथ इसी तरह के एप्लिकेशन भी मानती हूँ। वर्तमान में कोई भी विधि उन पर बहुत अच्छी तरह से काम नहीं करती है।

इस तरह की छवियों के साथ-साथ ठेठ मामलों पर काम करने वाले तरीकों का पता लगाया जा रहा है और वर्तमान में शोध किया जा रहा है, जैसे कि एक दृष्टिकोण मैंने इस उत्तर में संक्षेप में वर्णित काम करना शुरू कर दिया है


विस्तृत उत्तर के लिए धन्यवाद, मैं कुछ खाली समय होने पर कागजात के माध्यम से जाऊंगा। मैं दो समस्याओं का सामना कर रहे एक फीचर डिटेक्टर को लागू कर रहा था: कार्यान्वयन और पेटेंट मुद्दों की जटिलता। मेरा आवेदन एक व्यावसायिक छवि संरेखण और सिलाई पुस्तकालय है और इसलिए मेरे पास कार्यान्वयन के लिए सीमित संसाधन और समय है और SIFT याURURF के लिए भुगतान नहीं कर सकता है। मैं शायद या तो एमएसईआर या अन्य उन्नत डिटेक्टर / डिस्क्रिप्टर पर स्विच करूंगा, लेकिन अभी तक हैरिस कोने खराब रोशनी के साथ छवियों के अपवाद के साथ अच्छी तरह से काम करते हैं।
लीबोर

@ लिबर इसकी सुंदरता है: आपको स्विच करने की आवश्यकता नहीं है। आप अपनी मौजूदा पहचान-> वर्णन पाइपलाइन में नई सुविधाएँ जोड़ सकते हैं । कोई फर्क नहीं पड़ता कि सुविधाओं को कैसे निकाला जाता है, आप हमेशा एक ही रणनीति के साथ उनके विवरणों की गणना कर सकते हैं। मेरे द्वारा लिखे गए सभी सामानों में, शायद पहले लेख में पता लगाने / विवरण के लिए विभिन्न विकल्पों की तुलना करने का उल्लेख किया गया है जो सबसे उपयोगी साबित हो सकता है।
पेनेलोप

मैंने बड़े डिस्क्रिप्टर इकट्ठा किए और फिर पीसीए का इस्तेमाल डिस्क्रिप्टर की गति और भेदभावपूर्ण शक्ति में सुधार के लिए किया। पीसीए, हालांकि, बड़े डेटासेट के लिए काफी महंगा है। इस कार्य ने मुझे वर्णनकर्ताओं के जेनेरिक एन्हांसमेंट के कारण आकर्षित किया। अब तक मैं सभी का उपयोग "फ़ीचर स्पेस आउटलाइयर रिजेक्शन" है, जो केवल 1-nn / 2-nn दूरी के आधार पर फ़ीचर मैचों पर थ्रेसहोल्ड है। इसका वर्णन डी। लोवे ने अपने पत्रों में किया है और इसमें एक बहुत अच्छी भेदभावकारी शक्ति है क्योंकि यह उच्च-मंद स्थानों में दूरियों की शेल संपत्ति का शोषण करता है।
लिबोर

डिटेक्टरों के रूप में, बड़े दृष्टिकोण में परिवर्तन और पैमाने पर आक्रमण एक समस्या नहीं है, जैसा कि छवि मोज़ाइकिंग (पैनोरमा, सूक्ष्मदर्शी) के साथ होता है, ज़ूम आमतौर पर अपरिवर्तित रखा जाता है और मिलान छवियों के साथ चक्कर या प्रक्षेप्य विकृति काफी छोटी होती है। मुख्य समस्या वास्तव में बहुत कम है या बहुत सी विशेषताओं का पता लगाया गया है और खराब वर्णनकर्ता हैं।
लिबोर

मैं व्यक्तिगत रूप से डिस्क्रिप्टर पसंद के बारे में ज्यादा नहीं जानता, मैंने सिफ्ट के साथ ही काम किया है। लेकिन आपके द्वारा प्रदान किए गए लिंक ने उल्लेख किया है कि वे DAISY वर्णनकर्ताओं के समान हैं, जिन्हें मुझे याद है कि उनका मूल्यांकन बहुत अच्छा है। अधिक फ़ीचर एक्सट्रैक्टर्स को संयोजित करके आपको और अधिक सुविधाएँ प्रदान करनी चाहिए, और पैमाने पर प्रतिलाभ केवल एक प्लस हो सकता है, भले ही आपको इसकी आवश्यकता न हो। मैंने कुछ कार्यों का उल्लेख करते हुए पढ़ा कि कई फीचर एक्सट्रैक्टर्स के साथ काम करने से भेदभावपूर्ण शक्तियां बढ़ जाती हैं (यदि आप चाहें तो मैं लिंक देख सकता हूं)।
पेनलोप
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.