गुणात्मक रूप से छवि पैच की तुलना करने के लिए अच्छा मीट्रिक


11

मैं एक छवि में छोटे वर्ग पैच को "मैच" करने की कोशिश कर रहा हूं। पहली नज़र में, यह एक "समानता" उपाय प्राप्त करने के लिए केवल इन दो में से एक यूक्लिडियन शैली की तुलना करने के लिए उचित लगता है। यह कई मामलों में ठीक काम करता है (इस मीट्रिक के अनुसार "सर्वश्रेष्ठ" पैच (सबसे कम मूल्य) क्वेरी पैच की तरह दिखता है)। हालांकि, ऐसे कई मामले हैं जिनमें यह बहुत खराब मैच का निर्माण करता है। उदाहरण के लिए, ये दो पैच जोड़े लें:

एक ईंट की दीवार के दो पैच, स्कोर 134 (यह औसत निरपेक्ष पिक्सेल अंतर के घटकों का योग है):

स्रोत पैच टारगेट पैच

ईंट की दीवार का एक पैच, घास का एक पैच, स्कोर 123!

https://i.stack.imgur.com/d7lBZ.png https://i.stack.imgur.com/d2TBE.png

एक मानव के लिए, "स्पष्ट रूप से" घास ईंट से मेल नहीं खाती है, लेकिन यह मीट्रिक अन्यथा कहती है। समस्या सिर्फ स्थानीय सांख्यिकीय भिन्नता में है।

अगर मैं हिस्टोग्राम तुलना की तरह कुछ का उपयोग करता हूं, तो मैं पूरी तरह से सभी स्थानिक जानकारी खो देता हूं - जैसे कि यदि एक पैच ऊपर की तरफ घास है और तल पर ईंट है, तो यह नीचे की तरफ घास के साथ एक पैच से मेल खाएगा और शीर्ष पर (फिर से) , एक और "स्पष्ट रूप से गलत" मैच)।

क्या कोई मीट्रिक है जो किसी तरह इन दोनों विचारों को एक उचित मूल्य में जोड़ती है जो उपरोक्त जोड़ी 1 के लिए "समान" का मूल्यांकन करेगा, लेकिन मेरे पैच और इसके ऊर्ध्वाधर दर्पण के उदाहरण के लिए भी समान नहीं है?

किसी भी सुझाव की सराहना की है!


1
घटकों का योग लेते समय आप रंग स्थान में सभी "स्थानिक" जानकारी को ढीला कर देते हैं .. घटकों को अलग-अलग करें, उदाहरण के लिए दो वैक्टर पर यूक्लिडियन दूरी की गणना करें?
जियर्टेन

जवाबों:


2

आवश्यक विचार यह है: रंग की जानकारी में कुछ भी गलत नहीं है- यह सिर्फ अपर्याप्त है। तो सबसे अच्छी बात यह है कि कई फीचर सेट को मिलाएं।

इस अस्पष्टता को हल करने के लिए आप कई सुविधाएँ आज़मा सकते हैं। जहाँ तक सुविधा सेट का संबंध है, आप निम्नलिखित का उपयोग कर सकते हैं:

  1. रंग ( MPEG7 के प्रमुख रंग जैसा कुछ ) या रंग इतिहास
  2. बनावट (या तो फ़िल्टर बैंक प्रतिक्रिया के रूप में) या
  3. एज हिस्टोग्राम

प्राथमिक तुलना के रूप में, मैं सबसे पहले शुद्ध ईंट पैच बनाम शुद्ध घास पैच के बीच अंतर करना चाहूंगा। इसके लिए, रंग निश्चित रूप से सबसे संभावित तत्व है।

अधिक मजबूत वर्गीकरण बनाने के लिए सुविधाओं का संयोजन

मैं एक प्रमुख रंग (केवल एक का उपयोग नहीं करता है) या कुंजी रंग का उपयोग करता हूं और क्लस्टर बनाता हूं। देखें कि क्लस्टर प्रमुख कहां झूठ बोलते हैं;

यदि क्लस्टर प्रमुख दोनों अपेक्षित क्षेत्रों में हैं, तो आमतौर पर वर्ग का पता लगाना आसान होता है, यदि वे ग्रे क्षेत्र में आते हैं, तो कक्षा वहां होती है। यदि यह ग्रे क्षेत्र में पड़ता है, तो एक और विशेषता की आवश्यकता होती है।

सैमवे, आप स्वतंत्र रूप से बनावट मैट्रिक्स का उपयोग करके वर्गीकृत कर सकते हैं और फिर दोनों स्कोर को जोड़कर यह सुनिश्चित कर सकते हैं कि परिणाम समझ में आता है।

स्थानिक समस्याओं से निपटना

विशेष रूप से जब आपको पता चलता है कि पैच में इसके कुछ हिस्से हो सकते हैं जो आधी ईंटें और आधी घास हैं। मुझे लगता है कि आपको किसी अतिरिक्त सुविधा या विभिन्न मैट्रिक की आवश्यकता नहीं है। यह दो तरह से संभाला जा सकता है।

1. विभिन्न वर्गों के रूप में कई सदस्यता पैच रखें। उदाहरण के लिए, अलग से birck-onlyवर्ग और grass-onlyवर्ग, आप भी हो सकता है half-brick-half-grass-verticalऔर half-brick-half-grass-horizontalकुल चार वर्गों के रूप में। यह आसानी से वर्गीकृत किया जा सकता है जिस क्लस्टरिंग विधि का उपयोग हमने पहले चर्चा की थी।

2. मल्टी स्केल वर्गीकरण जोड़ें उदाहरण के लिए, पैच को एक ग्रे क्षेत्र में दिया गया है, आप पैच को दो भागों में विभाजित कर सकते हैं अर्थात बाएं बनाम दाएं। उसी तरह से आप शीर्ष बनाम नीचे भी विभाजित कर सकते हैं। अब आप इस "आधे भाग" के लिए समान वर्गीकरण लागू कर सकते हैं। आदर्श रूप से उपरोक्त सूचीबद्ध सुविधा आपको पूर्ण भाग के बीच एक विशेषता समानता की तुलना करने के लिए इसे स्केलेबल बनाने की अनुमति देनी चाहिए (उदाहरण के लिए प्रमुख रंग आकार के समान हो सकता है) या यो को इसका आकार बदलना पड़ सकता है।

अधिक कक्षाएं जोड़ना (भाग 1 में) या अधिक स्तर (भाग 2 में) सीधे आगे होगा; ऊपरी सीमा दो कारकों द्वारा आएगी - या तो कोई अतिरिक्त विभाजन अब वर्गीकरण में कोई मूल्य नहीं जोड़ेगा या यह कि अत्यधिक शोर वर्गीकरण में प्रभावी ढंग से अस्पष्टता का परिचय देगा। यह वह जगह है जहां आप रुकते हैं।


2

आरंभ करने के लिए, 2 चित्र और 3 माप किसी भी प्रकार के सांख्यिकीय मॉडल का पता लगाने के लिए पर्याप्त नहीं हैं, जिसका उपयोग इष्टतम तुलना मीट्रिक को परिभाषित करने के लिए किया जा सकता है।

मुझे लगता है कि आप तरीकों और सुराग के लिए बनावट मान्यता पत्रों पर एक नज़र रखना शुरू कर सकते हैं। यह एक सक्रिय क्षेत्र है।

इसके लायक होने के लिए, मैंने कुछ अवधारणात्मक हैशिंग फ़ंक्शन (डीसीटी और रैंडम प्रोजेक्शन आधारित) परीक्षणों को चलाया और तथाकथित SIFT विवरणक के साथ थोड़ा परीक्षण किया। ये फ़ंक्शन इंटर और इंट्रा क्लास की दूरी को अलग कर सकते हैं, हालांकि 3 छवियों से कुछ भी निष्कर्ष निकालना असंभव है।

जीथब पर कोड ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.