एक छवि से सुविधाओं को निकालने के लिए एक अच्छा तरीका है झारना?


13

मैं एक छवि से सुविधाओं को निकालने की कोशिश कर रहा हूं, लेकिन मैं उन बिंदुओं को प्राप्त करने में विफल रहा हूं जिन्हें मैं निकालना चाहता हूं, और इसलिए मेरी छवि टेम्पलेट के साथ मेल करने में विफल रहती है।

क्या मेरी छवि को SIFT लागू करने से पहले मुझे कोई भी चौकियों से गुजरना होगा ताकि मुझे अच्छे परिणाम मिलें? उदाहरण के लिए टेम्पलेट छवि है;
यहाँ छवि विवरण दर्ज करें

लक्षित छवि; यहाँ छवि विवरण दर्ज करें


1
इस तरह की छवि पर निर्भर करता है और आप किसके लिए सुविधाओं का उपयोग करना चाहते हैं। अधिक जानकारी के लिए कृपया।

जवाबों:


14

जब आप एक छवि का मिलान करते समय क्या करना चाहते हैं, तो एक तस्वीर का उपयोग करके अपने टेम्पलेट के खिलाफ चल रहा है और फिर अपने दृश्य में उस व्यवस्था में उन sift सुविधाओं की तलाश करें।

अंगूठे का नियम: तुलना करना पसंद है।

Sift (टेम्पलेट) Sift (छवि) में निहित

आप Sift को "उन विशेषताओं को निकालने के लिए ट्यून नहीं कर सकते हैं जिन्हें आप चाहते हैं" Sift * उन विशेषताओं को खोजने के लिए अपरिवर्तनीय उपायों का उपयोग करता है जो यह मानते हैं कि वे सबसे अधिक मुख्य हैं। (* क्रिस ए)

यदि आप चाहते हैं कि यह आपके खाके से विशेष सुविधाओं को खोजे तो उन विशेषताओं के छोटे खाके बनाएं और उन्हें खोजें।

केवल एक सलाह। मुझे ठीक से पता नहीं है कि आप किस प्रकार के टेम्पलेट को किस प्रकार के दृश्य या छवि में फिट करने का प्रयास कर रहे हैं।


7
+1, मैं सहमत हूं। एक चीज़ के अलावा। SIFT उन विशेषताओं को नहीं खोजता है जो सबसे अधिक आक्रामक हैं। यह उन विशेषताओं को खोजने के लिए अपरिवर्तनीय उपायों का उपयोग करता है जो यह मानते हैं कि वे सबसे अधिक नमकीन हैं।

7

मुझे यकीन नहीं है कि आप केवल दो छवियों (जैसे सामान्य बिंदुओं को ढूंढना) से मेल खाना चाहते हैं, या आप सीबीआईआर (सामग्री-आधारित छवि पुनर्प्राप्ति) जैसे कुछ का प्रयास करना चाहते हैं - सभी को खोजने के लिए टेम्पलेट छवि के साथ एक डेटाबेस खोजना वस्तु)।

मैं वर्तमान में सीबीआईआर अनुसंधान कर रहा हूं, इसलिए मैं वर्तमान तरीकों के साथ बहुत अद्यतित हूं। यहाँ और यहाँ मेरे उत्तरों की कड़ियाँ हैं, जो स्टैकओवरफ़्लो से आपकी जैसी समस्याओं के लिए हैं, आपको एक नज़र डालनी चाहिए।

अब, थोड़ा सा SIFT के बारे में बात करने के लिए। जब पहली बार लोव द्वारा पेश किया गया था , तो SIFT शब्द ने फीचर डिटेक्शन की प्रक्रिया और उन पहचाने गए ब्याज बिंदुओं पर गणना की गई फीचर डिस्क्रिप्टर दोनों पर लागू किया । इस दिन तक, SIFT वर्णनकर्ता अविश्वसनीय रूप से भयानक साबित हुए हैं। विवरणकर्ताओं के पास कुछ शांत गुण हैं जिनका @Totero ने पहले ही उल्लेख किया है।

दूसरी ओर SIFT डिटेक्शन मेथड , जिसे आजकल ज्यादा से ज्यादा DoG (गॉसियंस का अंतर) कहा जाता है, अत्याधुनिक नहीं है। यह अभी भी व्यापक रूप से उपयोग किया जाता है, लेकिन सुविधा का पता लगाने की प्रक्रिया के लिए, आज अधिक विधियां हैं, जिनमें से कुछ बेहतर हैं या अच्छी तरह से अपरिवर्तनीय कुंजीप्वाइंट DoG प्रक्रिया के अर्क के प्रकारों के पूरक हैं।

अधिकांश वर्तमान कागजात (लिंक किए गए स्टैक्वेरफ्लो सवालों के लिंक को देखें) में एक और अच्छा अभ्यास है: वे कई प्रकार के तरीकों का पता लगाते हैं, और फिर अनियंत्रित वेक्टर प्रतिनिधित्वों की गणना करने के लिए SIFT विवरणों (जो अभी भी वर्णनकर्ता के रूप में रॉक करते हैं) का उपयोग करते हैं। मैं वर्तमान में DoG के संयोजन के साथ काम कर रहा हूं (वे छवियों के कोने-प्रकार वाले भागों पर ध्यान केंद्रित करते हैं) और MSER क्षेत्र (वे कई पैमानों के माध्यम से बूँद-जैसे प्रतिष्ठित बिंदुओं पर ध्यान केंद्रित करते हैं)। यदि आप इस संयोजन को अपने विशेष छवि डेटाबेस पर संतोषजनक नहीं पाते हैं, तो आप और भी अधिक प्रकार के फ़ीचर डिटेक्टरों को आज़मा सकते हैं।

इसके अलावा, यदि आप रुचि रखते हैं, तो यहां एक पेपर है जो विभिन्न डिटेक्शन और डिस्क्रिप्टर संयोजनों की प्राथमिकताओं का मूल्यांकन करता है। मैंने इसे नहीं पढ़ा है क्योंकि DoG & MSER + SIFT मेरे लिए ठीक काम करता है, लेकिन मैंने इसे स्किम कर लिया है और पेपर काफी अच्छा है।

PS: यदि आप IEEEXplore डेटाबेस I से जुड़े हैं, तो आपके पास Google विद्वान का उपयोग नहीं है।


बस एक छोटा सा स्पष्टीकरण: DoG का अर्थ है गौसियन का अंतर (दो गाऊसी फ़िल्टर प्रतिक्रियाओं के बीच का अंतर)
Libor

2

पिछली प्रतिक्रियाओं पर निर्माण:

(1) आप इनबिल्ट डिटेक्टर के बजाय घने नमूने के साथ SIFT (या इस स्थानीय-पैच डिस्क्रिप्टर का एक और बेहतर संस्करण) का उपयोग कर सकते हैं। आप प्रदर्शन और कम्प्यूटेशनल लागत की अपनी आवश्यकताओं के अनुरूप स्थानीय पैच का आकार और नमूना घनत्व चुन सकते हैं।

(2) SIFT वाइड बेसलाइन स्टीरियो मैचिंग के लिए एक एफिन इनवेरियन डिस्क्रिप्टर है। इसका मतलब यह है कि जब आप एक छवि लेते हैं और उसके साथ बदलाव को प्रेरित करने के लिए SIFT अच्छी तरह से काम करता है, जिसमें परिवर्तन के साथ लक्ष्य छवि के साथ 'टेम्पलेट' मौजूद होना चाहिए।

सुझाव: (ए) छवि का पता लगाने की संभावनाओं को बेहतर बनाने के लिए टेम्पलेट छवियों का एक डेटाबेस बनाएं (यदि संभव हो तो)।

(b) यदि आप अपने कार्य के लिए CBIR दृष्टिकोण अपनाना चुनते हैं तो आप BoW मॉडल को बेसलाइन के रूप में उपयोग कर सकते हैं।

(c) अपनी टेम्प्लेट छवि को केवल संबंधित भाग में क्रॉप करें और एक अत्यधिक घने SIFT का उपयोग करें। http://www.vlfeat.org/overview/dsift.html

(४) बाद में आप चाहें तो उत्परिवर्ती-स्केल डिस्क्रिप्टर जैसे PHOG (पिरामिड हिस्टोग्राम के ग्रैडिएंट्स) इत्यादि आज़माना चाह सकते हैं, जिससे परिणाम बेहतर हो सकें। http://www.vlfeat.org/overview/dsift.html#tut.dsift.phow

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.