मैं सिर्फ एक आरजीबी हिस्टोग्राम का उपयोग करने से दूर जाने पर विचार करने की सलाह दूंगा।
आपकी छवि का एक बेहतर पाचन प्राप्त किया जा सकता है यदि आप छवि के 2d Haar तरंग को लेते हैं (यह बहुत आसान लगता है, तो इसका बहुत अधिक औसत और कुछ वर्ग जड़ें आपके गुणांक का वजन करती हैं) और बस k को बनाए रखें तरंगिका में भारित गुणांक एक विरल वेक्टर के रूप में, इसे सामान्य करते हैं, और इसके आकार को कम करने के लिए इसे बचाते हैं। आपको कम से कम पहले से अवधारणात्मक भार का उपयोग करके आरजी और बी को पुनर्विक्रय करना चाहिए या मैं YIQ (या योकसीजी, परिमाणीकरण शोर से बचने के लिए) पर स्विच करने की सलाह दूंगा ताकि आप कम महत्व के साथ क्रोमिनेंस जानकारी का नमूना ले सकें।
आप अब इन विरल सामान्यीकृत वैक्टरों में से दो के डॉट उत्पाद का उपयोग समानता के उपाय के रूप में कर सकते हैं। सबसे बड़े डॉट उत्पादों के साथ छवि जोड़े संरचना में बहुत समान हैं। यह आकार बदलने, ह्यू शिफ्टिंग और वॉटरमार्किंग के लिए थोड़ा प्रतिरोधी होने और लागू होने और कॉम्पैक्ट होने के लिए वास्तव में आसान होने का लाभ है।
आप k को बढ़ाकर या घटाकर भंडारण और सटीकता का व्यापार कर सकते हैं।
इस प्रकार की वर्गीकरण समस्या के लिए एकल संख्यात्मक अंक के आधार पर छंटनी अचूक होगी। यदि आप इसके बारे में सोचते हैं तो इसके लिए छवियों को केवल एक अक्ष के साथ 'परिवर्तन' करने में सक्षम होना चाहिए, लेकिन वे नहीं करते हैं। यही कारण है कि आपको सुविधाओं की एक वेक्टर की आवश्यकता है। हैर वेवलेट मामले में इसकी लगभग जहां छवि में सबसे तेज विच्छेदन होता है। आप जोड़ीदार के बीच की दूरी की गणना कर सकते हैं, लेकिन चूंकि आपके पास एक दूरी मीट्रिक है एक रैखिक क्रम में 3 छवियों के एक 'त्रिकोण' को व्यक्त करने का कोई तरीका नहीं है जो सभी समान रूप से दूर हैं। (यानी एक ऐसी छवि के बारे में सोचें जो सभी हरे रंग की हो, एक ऐसी छवि जो सभी लाल हो और एक छवि जो सभी नीले रंग की हो।)
इसका मतलब है कि आपकी समस्या के किसी भी वास्तविक समाधान के लिए आपके पास मौजूद छवियों की संख्या में O (n ^ 2) संचालन की आवश्यकता होगी। हालांकि, अगर यह माप रैखिक करने के लिए संभव हो गया था, तो आपको केवल ओ (एन लॉग एन), या ओ (एन) की आवश्यकता हो सकती है, अगर माप एक रेडिक्स प्रकार के लिए, कहें। उस ने कहा, आपको ओ (एन ^ 2) खर्च करने की आवश्यकता नहीं है क्योंकि अभ्यास के दौरान आपको पूरे सेट के माध्यम से झारने की आवश्यकता नहीं है, आपको बस कुछ सीमा से अधिक सामान thats को खोजने की आवश्यकता है। तो अपने विरल सदिश स्थान को विभाजित करने के लिए कई तकनीकों में से एक को लागू करके आप उन छवियों की 'मुझे खोजने के लिए बहुत तेजी से स्पर्शोन्मुखता प्राप्त कर सकते हैं जो किसी दिए गए दहलीज से अधिक समान हैं' समस्या हर छवि के विरुद्ध हर छवि की तुलना में भोलेपन से तुलना करने से होती है। आप की जरूरत है ... अगर आप के लिए कहा ठीक नहीं है।
किसी भी घटना में, मैंने व्यक्तिगत रूप से अच्छे प्रभाव के लिए कुछ साल पहले इसका इस्तेमाल किया था, जब मैं अलग-अलग बनावट की संख्या को कम करने की कोशिश कर रहा था, लेकिन इस स्थान में बहुत अधिक शोध शोर दिखाई दिया है जो इसकी प्रभावकारिता दिखा रहा है (और इस मामले की तुलना में हिस्टोग्राम वर्गीकरण के एक और अधिक परिष्कृत रूप में):
http://www.cs.princeton.edu/cass/papers/spam_ceas07.pdf
यदि आपको पता लगाने में बेहतर सटीकता की आवश्यकता है, तो संपादन और अधिक मजबूती से निपटने के लिए Haar तरंगिका (या हिस्टोग्राम) के साथ minHash और tf-idf एल्गोरिदम का उपयोग किया जा सकता है:
http://cmp.felk.cvut.cz/~chum/papers/chum_bmvc08.pdf
अंत में, स्टैनफोर्ड के पास इस तरह के दृष्टिकोण के अधिक विदेशी प्रकार के आधार पर एक छवि खोज है, जो तरंगों से अधिक सुविधा निष्कर्षण करने के लिए छवियों के घुमाए गए या स्केल किए गए वर्गों को खोजने के आधार पर है, आदि, लेकिन संभवत: यह आपके काम की मात्रा से परे है। 'करना चाहता हूँ।
http://wang14.ist.psu.edu/cgi-bin/zwang/regionsearch_show.cgi