मैं वर्तमान में घटक पेड़ों का उपयोग कर सीबीआईआर पर काम कर रहा हूं , जो एक अपेक्षाकृत नया विचार होना चाहिए। छवियों का वर्णन करने के लिए घटक पेड़ का उपयोग करने के कुछ अपेक्षित लाभ होंगे:
- एक छवि का घटक ट्री प्रतिनिधित्व छवि को विकृति (यहां तक कि अनुमानित) पर इतना निर्भर नहीं करेगा
- पेड़ के विभिन्न स्तरों की जांच करने से तुलना और संचालन के विभिन्न स्तर तक विस्तार हो सकेगा
- भेदभाव और विवरण कम-बनावट वाली छवियों पर वर्तमान तकनीकों से बेहतर काम करना चाहिए।
जैसा कि मैंने अभी इस विषय से संबंधित अनुसंधान शुरू किया है, मेरे पास अपने लक्ष्यों का केवल एक अस्पष्ट विचार है: घटक ट्री के साथ छवि का प्रतिनिधित्व करें और फिर उक्त घटक पेड़ों की तुलना करें, या तो सीधे वेक्टर प्रतिनिधित्व प्राप्त करके। मैं शायद कुछ हफ्तों (या महीनों) में बहुत अधिक कहने में सक्षम हो जाऊंगा, लेकिन अभी के लिए मैं केवल घटक पेड़ों के परिचय के रूप में मेरे लिए अनुशंसित पत्रों की सूची पेश कर सकता हूं (मैंने उन्हें अभी तक नहीं पढ़ा है):
मैं शायद उत्तर को अपडेट कर सकता हूं जैसे कि मुझे कुछ प्रासंगिक लगता है।
इसके अलावा, यदि आपका लक्ष्य एक तरह से, केवल बिंदुओं के बजाय अधिक सटीक रूप से छवि क्षेत्रों से मेल खाता है , क्योंकि क्षेत्र अधिक भेदभावपूर्ण हो सकते हैं, जे। सिविक और ए। ज़िसरमैन में एक अच्छा सुझाव था : "वीडियो Google: एक पाठ पुनर्प्राप्ति वीडियो में मिलान करने के लिए दृष्टिकोण " ।
मैं स्थानिक संगति से निपटने वाले अनुभाग का उल्लेख कर रहा हूं , जहां फीचर बिंदुओं के बीच मैचों का एक समूह केवल तभी स्वीकार किया जाता है, जब फीचर बिंदु दोनों छवियों में एक समान स्थानिक विन्यास रखते हैं। इस प्रकार, मिलान न केवल निकाले गए फीचर (DoG, MSER, ...) या डिस्क्रिप्टर (SIFT) के प्रकार पर निर्भर है, बल्कि यह एक फीचर बिंदु के व्यापक परिवेश को भी देखता है, जिससे यह (कम से कम) क्षेत्र पर निर्भर।