छवि पंजीकरण द्वारा पंजीकरण


15

छवि पंजीकरण एल्गोरिदम आमतौर पर SIFT (स्केल-इनवायरेंट फ़ीचर ट्रांसफ़ॉर्म) जैसे बिंदु सुविधाओं पर आधारित होते हैं।

मैंने लाइन विशेषताओं के कुछ संदर्भ देखे, लेकिन मैं सोच रहा था कि क्या अंक के बजाय छवि खंडों का मिलान करना संभव होगा । उदाहरण के लिए, दिए गए स्रोत और रूपांतरित छवि:

यहाँ छवि विवरण दर्ज करें

मैं प्रत्येक पर एज डिटेक्शन, ब्लरिंग और वाटरशेड ट्रांसफॉर्म कर सकता हूं:

यहाँ छवि विवरण दर्ज करें

अफसोस, अलग-अलग सेगमेंट से मेल खाने के लिए प्रत्येक छवि पर विभाजन बहुत अलग निकला।

मैंने आकृतियों और आकार के विवरणों के मिलान पर कुछ कागजात देखे जो ट्रांसफ़ॉर्म करने के लिए अपरिवर्तनीय हैं, इसलिए यह क्षेत्र बहुत अच्छा लगता है ...

क्या किसी भी विभाजन के तरीके छवि को बेहतर बनाने (या यहां तक ​​कि अनुमानित) विकृति के लिए अधिक मजबूत हैं?


1
मेरा सामान्य ज्ञान मुझे बताता है कि छोटे क्षेत्र वैश्विक परिवर्तनों के लिए अधिक मजबूत हैं। इस प्रकार, विभाजन में बहुत सारे छोटे खंड होने चाहिए। इसके अलावा, कुछ विशेष आकृतियाँ कुछ परिवर्तनों के लिए अपरिवर्तनीय हैं, (जैसे वृत्त से घूर्णन तक)
एंड्री रूबेशिन

MSER (अधिकतम रूप से स्थिर चरम क्षेत्र) क्षेत्र हैं, अंक नहीं। और वे परिवर्तन को प्रभावित करने के लिए अपरिवर्तनीय हैं। लेकिन यह एक विभाजन पद्धति नहीं है, सख्ती से बोल रहा हूं।
निकी एस्टनर

@ मिक्की यदि आप अपनी टिप्पणी उत्तर के रूप में देते हैं, तो मैं इसे स्वीकार करूंगा। मुझे विभाजन में दिलचस्पी थी क्योंकि क्षेत्र की विशेषताओं में छवि परिवर्तन के बारे में कुछ जानकारी होती है और संभवतः इसका उपयोग छवियों के बीच परिवर्तन का अनुमान लगाने के लिए किया जा सकता है। मैं निश्चित रूप से MSER के बारे में पेपर का अध्ययन करूंगा।
लिबोर

मैं वर्तमान में घटक पेड़ों का उपयोग कर सीबीआईआर पर काम कर रहा हूं। छवि का घटक ट्री प्रतिनिधित्व छवि के विकृति (यहां तक ​​कि अनुमानित) पर इतना निर्भर नहीं करेगा, विभिन्न स्तर तुलना और संचालन को विस्तार के एक अलग स्तर तक ले जाने की अनुमति देगा, और कम बनावट वाली छवियों पर वर्तमान तकनीकों की तुलना में बेहतर काम करना चाहिए। । यह अभी के लिए केवल एक शोध विषय है, बस शुरू हो गया है, लेकिन उम्मीद है कि दृष्टिकोण में कुछ है, अन्यथा मुझे ऐसा करने के लिए अनुदान नहीं दिया जाएगा। लेकिन, अगर किसी और ने इन लाइनों के साथ कुछ किया, तो उपयोगी हो सकता है।
पेनलोप

@penelope CBIR पर किए गए ये काम इमेज मोज़ाइजिंग (मेरी विशिष्ट रुचि) के लिए भी उपयोगी हो सकते हैं जहाँ हमारे पास समान विशेषताओं वाली छवियां हैं। वर्तमान लोकप्रिय दृष्टिकोण बिंदु विवरणकों (जैसे SIFT) पर उच्च आयामी खोज है, जिससे छवियों के बीच झूठे मेल हो सकते हैं जबकि "क्षेत्रों" या "घटकों" के बजाय अंक इन पर भेदभाव करने में सक्षम हो सकते हैं। क्या आपके पास चित्रों के घटक ट्री प्रतिनिधित्व के बारे में कागजात का कोई संदर्भ है? बहुत धन्यवाद।
लिबर

जवाबों:


4

एमएसईआर (मैक्सिमली स्टेबल एक्सट्रीम रीजन) क्षेत्र हैं, अंक नहीं। और वे परिवर्तन को प्रभावित करने के लिए अपरिवर्तनीय हैं। लेकिन यह एक विभाजन पद्धति नहीं है, सख्ती से बोल रहा हूं

अनौपचारिक रूप से कहें तो, विचार यह है कि विभिन्न थ्रेसहोल्ड में ब्लब्स ढूंढे जाएं, फिर उन ब्लब्स का चयन करें, जिनकी सीमा में थ्रेसहोल्ड की सीमा में आकार / क्षेत्र में कम से कम बदलाव हो। ये क्षेत्र बड़ी संख्या में ग्रेस्केल और ज्यामितीय परिवर्तनों के लिए स्थिर होने चाहिए।


4

मैं वर्तमान में घटक पेड़ों का उपयोग कर सीबीआईआर पर काम कर रहा हूं , जो एक अपेक्षाकृत नया विचार होना चाहिए। छवियों का वर्णन करने के लिए घटक पेड़ का उपयोग करने के कुछ अपेक्षित लाभ होंगे:

  • एक छवि का घटक ट्री प्रतिनिधित्व छवि को विकृति (यहां तक ​​कि अनुमानित) पर इतना निर्भर नहीं करेगा
  • पेड़ के विभिन्न स्तरों की जांच करने से तुलना और संचालन के विभिन्न स्तर तक विस्तार हो सकेगा
  • भेदभाव और विवरण कम-बनावट वाली छवियों पर वर्तमान तकनीकों से बेहतर काम करना चाहिए।

जैसा कि मैंने अभी इस विषय से संबंधित अनुसंधान शुरू किया है, मेरे पास अपने लक्ष्यों का केवल एक अस्पष्ट विचार है: घटक ट्री के साथ छवि का प्रतिनिधित्व करें और फिर उक्त घटक पेड़ों की तुलना करें, या तो सीधे वेक्टर प्रतिनिधित्व प्राप्त करके। मैं शायद कुछ हफ्तों (या महीनों) में बहुत अधिक कहने में सक्षम हो जाऊंगा, लेकिन अभी के लिए मैं केवल घटक पेड़ों के परिचय के रूप में मेरे लिए अनुशंसित पत्रों की सूची पेश कर सकता हूं (मैंने उन्हें अभी तक नहीं पढ़ा है):

मैं शायद उत्तर को अपडेट कर सकता हूं जैसे कि मुझे कुछ प्रासंगिक लगता है।

इसके अलावा, यदि आपका लक्ष्य एक तरह से, केवल बिंदुओं के बजाय अधिक सटीक रूप से छवि क्षेत्रों से मेल खाता है , क्योंकि क्षेत्र अधिक भेदभावपूर्ण हो सकते हैं, जे। सिविक और ए। ज़िसरमैन में एक अच्छा सुझाव था : "वीडियो Google: एक पाठ पुनर्प्राप्ति वीडियो में मिलान करने के लिए दृष्टिकोण "

मैं स्थानिक संगति से निपटने वाले अनुभाग का उल्लेख कर रहा हूं , जहां फीचर बिंदुओं के बीच मैचों का एक समूह केवल तभी स्वीकार किया जाता है, जब फीचर बिंदु दोनों छवियों में एक समान स्थानिक विन्यास रखते हैं। इस प्रकार, मिलान न केवल निकाले गए फीचर (DoG, MSER, ...) या डिस्क्रिप्टर (SIFT) के प्रकार पर निर्भर है, बल्कि यह एक फीचर बिंदु के व्यापक परिवेश को भी देखता है, जिससे यह (कम से कम) क्षेत्र पर निर्भर।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.