निकट-डुप्लीकेट छवि जांच [बंद]

Question 1

बंद हो गया । इस प्रश्न पर अधिक ध्यान देने की आवश्यकता है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है।

इस प्रश्न को सुधारना चाहते हैं? प्रश्न को अपडेट करें ताकि यह इस पोस्ट को संपादित करके केवल एक समस्या पर केंद्रित हो ।

2 साल पहले बंद हुआ ।

इस प्रश्न को सुधारें

एक दिए गए चित्रों को एक दूसरे से समानता के आधार पर क्रमबद्ध करने का एक तेज़ तरीका क्या है।

फिलहाल मेरे पास एक प्रणाली है जो दो छवियों के बीच हिस्टोग्राम विश्लेषण करती है, लेकिन यह एक बहुत महंगा ऑपरेशन है और बहुत अधिक लगता है।

वैकल्पिक रूप से मैं एक एल्गोरिथ्म की तलाश कर रहा हूं जो प्रत्येक छवि को एक अंक देगा (उदाहरण के लिए एक पूर्णांक स्कोर, जैसे कि आरजीबी औसत) और मैं बस उस स्कोर को क्रमबद्ध कर सकता हूं। एक दूसरे के बगल में पहचान स्कोर या स्कोर संभव डुप्लिकेट हैं।

0299393
0599483
0499994 <- possible dupe
0499999 <- possible dupe
1002039
4995994
6004994

आरजीबी औसत प्रति छवि बेकार है, क्या कुछ समान है?

Question 2

छवि खोज और समानता के उपायों पर बहुत सारे शोध हुए हैं। यह एक आसान समस्या नहीं है। सामान्य तौर पर, एक एकल intयह निर्धारित करने के लिए पर्याप्त नहीं होगा कि क्या छवियां बहुत समान हैं। आपके पास उच्च झूठी-सकारात्मक दर होगी।

हालाँकि, जब से बहुत अधिक शोध हो चुका है, आप इसमें से कुछ पर नज़र डाल सकते हैं। उदाहरण के लिए, यह पेपर (पीडीएफ) एक कॉम्पैक्ट इमेज फ़िंगरप्रिंटिंग एल्गोरिथ्म देता है जो डुप्लिकेट छवियों को जल्दी और बिना बहुत अधिक डेटा संग्रहीत करने के लिए उपयुक्त है। ऐसा लगता है कि यह सही दृष्टिकोण है यदि आप कुछ मजबूत करना चाहते हैं।

यदि आप कुछ सरल खोज रहे हैं, लेकिन निश्चित रूप से अधिक तदर्थ, इस SO प्रश्न में कुछ अच्छे विचार हैं।

Question 3

मैं सिर्फ एक आरजीबी हिस्टोग्राम का उपयोग करने से दूर जाने पर विचार करने की सलाह दूंगा।

आपकी छवि का एक बेहतर पाचन प्राप्त किया जा सकता है यदि आप छवि के 2d Haar तरंग को लेते हैं (यह बहुत आसान लगता है, तो इसका बहुत अधिक औसत और कुछ वर्ग जड़ें आपके गुणांक का वजन करती हैं) और बस k को बनाए रखें तरंगिका में भारित गुणांक एक विरल वेक्टर के रूप में, इसे सामान्य करते हैं, और इसके आकार को कम करने के लिए इसे बचाते हैं। आपको कम से कम पहले से अवधारणात्मक भार का उपयोग करके आरजी और बी को पुनर्विक्रय करना चाहिए या मैं YIQ (या योकसीजी, परिमाणीकरण शोर से बचने के लिए) पर स्विच करने की सलाह दूंगा ताकि आप कम महत्व के साथ क्रोमिनेंस जानकारी का नमूना ले सकें।

आप अब इन विरल सामान्यीकृत वैक्टरों में से दो के डॉट उत्पाद का उपयोग समानता के उपाय के रूप में कर सकते हैं। सबसे बड़े डॉट उत्पादों के साथ छवि जोड़े संरचना में बहुत समान हैं। यह आकार बदलने, ह्यू शिफ्टिंग और वॉटरमार्किंग के लिए थोड़ा प्रतिरोधी होने और लागू होने और कॉम्पैक्ट होने के लिए वास्तव में आसान होने का लाभ है।

आप k को बढ़ाकर या घटाकर भंडारण और सटीकता का व्यापार कर सकते हैं।

इस प्रकार की वर्गीकरण समस्या के लिए एकल संख्यात्मक अंक के आधार पर छंटनी अचूक होगी। यदि आप इसके बारे में सोचते हैं तो इसके लिए छवियों को केवल एक अक्ष के साथ 'परिवर्तन' करने में सक्षम होना चाहिए, लेकिन वे नहीं करते हैं। यही कारण है कि आपको सुविधाओं की एक वेक्टर की आवश्यकता है। हैर वेवलेट मामले में इसकी लगभग जहां छवि में सबसे तेज विच्छेदन होता है। आप जोड़ीदार के बीच की दूरी की गणना कर सकते हैं, लेकिन चूंकि आपके पास एक दूरी मीट्रिक है एक रैखिक क्रम में 3 छवियों के एक 'त्रिकोण' को व्यक्त करने का कोई तरीका नहीं है जो सभी समान रूप से दूर हैं। (यानी एक ऐसी छवि के बारे में सोचें जो सभी हरे रंग की हो, एक ऐसी छवि जो सभी लाल हो और एक छवि जो सभी नीले रंग की हो।)

इसका मतलब है कि आपकी समस्या के किसी भी वास्तविक समाधान के लिए आपके पास मौजूद छवियों की संख्या में O (n ^ 2) संचालन की आवश्यकता होगी। हालांकि, अगर यह माप रैखिक करने के लिए संभव हो गया था, तो आपको केवल ओ (एन लॉग एन), या ओ (एन) की आवश्यकता हो सकती है, अगर माप एक रेडिक्स प्रकार के लिए, कहें। उस ने कहा, आपको ओ (एन ^ 2) खर्च करने की आवश्यकता नहीं है क्योंकि अभ्यास के दौरान आपको पूरे सेट के माध्यम से झारने की आवश्यकता नहीं है, आपको बस कुछ सीमा से अधिक सामान thats को खोजने की आवश्यकता है। तो अपने विरल सदिश स्थान को विभाजित करने के लिए कई तकनीकों में से एक को लागू करके आप उन छवियों की 'मुझे खोजने के लिए बहुत तेजी से स्पर्शोन्मुखता प्राप्त कर सकते हैं जो किसी दिए गए दहलीज से अधिक समान हैं' समस्या हर छवि के विरुद्ध हर छवि की तुलना में भोलेपन से तुलना करने से होती है। आप की जरूरत है ... अगर आप के लिए कहा ठीक नहीं है।

किसी भी घटना में, मैंने व्यक्तिगत रूप से अच्छे प्रभाव के लिए कुछ साल पहले इसका इस्तेमाल किया था, जब मैं अलग-अलग बनावट की संख्या को कम करने की कोशिश कर रहा था, लेकिन इस स्थान में बहुत अधिक शोध शोर दिखाई दिया है जो इसकी प्रभावकारिता दिखा रहा है (और इस मामले की तुलना में हिस्टोग्राम वर्गीकरण के एक और अधिक परिष्कृत रूप में):

http://www.cs.princeton.edu/cass/papers/spam_ceas07.pdf

यदि आपको पता लगाने में बेहतर सटीकता की आवश्यकता है, तो संपादन और अधिक मजबूती से निपटने के लिए Haar तरंगिका (या हिस्टोग्राम) के साथ minHash और tf-idf एल्गोरिदम का उपयोग किया जा सकता है:

http://cmp.felk.cvut.cz/~chum/papers/chum_bmvc08.pdf

अंत में, स्टैनफोर्ड के पास इस तरह के दृष्टिकोण के अधिक विदेशी प्रकार के आधार पर एक छवि खोज है, जो तरंगों से अधिक सुविधा निष्कर्षण करने के लिए छवियों के घुमाए गए या स्केल किए गए वर्गों को खोजने के आधार पर है, आदि, लेकिन संभवत: यह आपके काम की मात्रा से परे है। 'करना चाहता हूँ।

http://wang14.ist.psu.edu/cgi-bin/zwang/regionsearch_show.cgi

Question 4

मैंने इसके लिए एक बहुत विश्वसनीय एल्गोरिथ्म लागू किया जिसे फास्ट मल्टीसर्जिंग इमेज क्वेरी कहा जाता है । उसके लिए मेरा (प्राचीन, निष्कलंक) कोड यहाँ है ।

क्या फास्ट मल्टीप्लसिंग इमेज क्वेरी करता है, छवि को वाईआईक्यू कलरस्पेस (आरजीबी से मिलान के लिए बेहतर अंतर) के आधार पर 3 टुकड़ों में विभाजित किया गया है। तब छवि अनिवार्य रूप से एक तरंग एल्गोरिथ्म का उपयोग करके संपीड़ित होती है जब तक कि प्रत्येक कलरस्पेस से केवल सबसे प्रमुख विशेषताएं उपलब्ध नहीं होती हैं। इन बिंदुओं को एक डेटा संरचना में संग्रहीत किया जाता है। क्वेरी छवियां उसी प्रक्रिया से गुजरती हैं, और क्वेरी छवि में प्रमुख विशेषताएं संग्रहीत डेटाबेस में उन लोगों से मेल खाती हैं। जितने अधिक मिलान होते हैं, उतनी ही अधिक छवियां समान होती हैं।

एल्गोरिथ्म का उपयोग अक्सर "स्केच द्वारा क्वेरी" कार्यक्षमता के लिए किया जाता है। मेरे सॉफ़्टवेयर ने केवल URL के माध्यम से क्वेरी छवियों को दर्ज करने की अनुमति दी, इसलिए कोई उपयोगकर्ता इंटरफ़ेस नहीं था। हालाँकि, मैंने पाया कि उस चित्र के बड़े संस्करण में थंबनेल मेल करने के लिए असाधारण रूप से अच्छी तरह से काम किया।

मेरे सॉफ़्टवेयर की तुलना में बहुत अधिक प्रभावशाली पुनर्प्राप्ति है जो आपको फ़्लिकर छवियों का उपयोग करके स्रोत के रूप में FMIQ एल्गोरिथ्म की कोशिश करने देता है। बहुत ही शांत! स्केच के माध्यम से या स्रोत छवि का उपयोग करके इसे आज़माएं, और आप देख सकते हैं कि यह कितनी अच्छी तरह काम करता है।

Question 5

एक तस्वीर में कई विशेषताएं होती हैं, इसलिए जब तक आप अपने आप को संकीर्ण नहीं करते हैं, औसत चमक की तरह, आप एक एन-आयामी समस्या वाले स्थान के साथ काम कर रहे हैं।

अगर मैंने आपसे दुनिया के शहरों के लिए एक पूर्णांक आवंटित करने के लिए कहा है, तो मैं बता सकता हूं कि कौन से करीबी लोग हैं, परिणाम महान नहीं होंगे। उदाहरण के लिए, आप अपने एकल पूर्णांक के रूप में समय क्षेत्र चुन सकते हैं और कुछ शहरों के साथ अच्छे परिणाम प्राप्त कर सकते हैं। हालांकि, उत्तरी ध्रुव के पास एक शहर और दक्षिणी ध्रुव के पास एक अन्य शहर भी एक ही समय क्षेत्र में हो सकता है, भले ही वे ग्रह के विपरीत छोर पर हों। अगर मैं आपको दो पूर्णांक का उपयोग करने देता हूं, तो आप अक्षांश और देशांतर के साथ बहुत अच्छे परिणाम प्राप्त कर सकते हैं। समस्या छवि समानता के लिए समान है।

सभी ने कहा, ऐसे एल्गोरिदम हैं जो समान छवियों को एक साथ क्लस्टर करने की कोशिश करते हैं, जो कि प्रभावी रूप से आप क्या पूछ रहे हैं। यह तब होता है जब आप पिकासा के साथ फेस डिटेक्शन करते हैं। इससे पहले कि आप किसी भी चेहरे की पहचान करते हैं, यह समान रूप से एक साथ पकड़ता है ताकि समान चेहरों के सेट के माध्यम से जाना आसान हो और उनमें से अधिकांश को एक ही नाम दिया जाए।

सिद्धांत घटक विश्लेषण नामक एक तकनीक भी है, जो आपको किसी भी छोटी संख्या के आयामों के लिए n-आयामी डेटा को कम करने देती है। तो n फीचर्स वाली तस्वीर को एक फीचर में कम किया जा सकता है। हालाँकि, यह अभी भी छवियों की तुलना करने के लिए सबसे अच्छा तरीका नहीं है।

Question 6

एक सी लाइब्रेरी ("लिबफश" - http://phash.org/ ) है जो एक छवि के "अवधारणात्मक हैश" की गणना करेगा और आपको हैश की तुलना करके समान छवियों का पता लगाने की अनुमति देगा (इसलिए आपको प्रत्येक छवि की तुलना करने की आवश्यकता नहीं है सीधे हर दूसरी छवि के खिलाफ) लेकिन दुर्भाग्य से यह बहुत सटीक नहीं लगता था जब मैंने इसे आज़माया।

Question 7

आपको यह तय करना होगा कि "समान" क्या है। इसके विपरीत? ह्यू?

क्या एक तस्वीर "समान" एक ही तस्वीर उल्टा है?

मुझे यकीन है कि आप 4x4 टुकड़ों में छवियों को तोड़कर और प्रत्येक ग्रिड सेल के लिए औसत रंग प्राप्त करके बहुत सारे "करीबी कॉल" पा सकते हैं। आपकी छवि प्रति सोलह अंकों की होगी। समानता का न्याय करने के लिए, आप छवियों के बीच अंतर के वर्गों का योग करेंगे।

मुझे नहीं लगता कि एक भी हैश समझ में नहीं आता है, जब तक कि यह एकल अवधारणा के खिलाफ नहीं है, जैसे कि ह्यू, या चमक, या इसके विपरीत।

यहाँ आपका विचार है:

0299393
0599483
0499994 <- possible dupe
0499999 <- possible dupe
1002039
4995994
6004994

सबसे पहले, मैं मान रहा हूँ कि ये दशमलव संख्याएँ हैं जो R * (2 ^ 16) + G * (2 ^ 8) + B, या ऐसा ही कुछ हैं। जाहिर है कि यह अच्छा नहीं है क्योंकि लाल का वजन कम होता है।

HSV स्पेस में जाना बेहतर होगा। आप एचएसवी के बिट्स को हैश में फैला सकते हैं , या आप बस एच या एस या वी को व्यक्तिगत रूप से व्यवस्थित कर सकते हैं, या आपके पास प्रति छवि में तीन हैश हो सकते हैं।

एक और चीज़। यदि आप वजन आर, जी, और बी वजन को उच्चतम करते हैं, तो लाल, फिर मानवीय दृश्य संवेदनशीलता से मेल खाने के लिए नीला।

Question 8

वेब सेवाओं के युग में आप http://tineye.com की कोशिश कर सकते हैं

Question 9

प्रश्न इसी तरह की छवियों की पहचान करने का अच्छा तरीका है? अपने प्रश्न के लिए एक समाधान प्रदान करने के लिए लगता है।

Question 10

मैंने माना कि अन्य डुप्लिकेट छवि खोज सॉफ़्टवेयर छवियों पर FFT करता है, और वैक्टर के रूप में विभिन्न आवृत्तियों के मूल्यों को संग्रहीत करता है:

Image1 = (u1, u2, u3, ..., un)
Image2 = (v1, v2, v3, ..., vn)

और फिर आप दो छवियों के वजन वैक्टर के बीच की दूरी की गणना करके समानता के लिए दो छवियों की तुलना कर सकते हैं :

distance = Sqrt(
     (u1-v1)^2 +
     (u2-v2)^2 +
     (u2-v3)^2 +
     ...
     (un-vn)^2);

Question 11

एक समाधान एक बुलबुला प्रकार प्रदर्शन करने के लिए आवश्यक चित्रों के हर जोड़े पर एक आरएमएस / आरएसएस प्रदर्शन करना है। दूसरा, आप प्रत्येक छवि पर एक FFT प्रदर्शन कर सकते हैं और प्रत्येक छवि के लिए एक पूर्णांक प्राप्त करने के लिए कुछ अक्ष औसत कर सकते हैं, जिसे आप क्रमबद्ध करने के लिए एक सूचकांक के रूप में उपयोग करेंगे। आप इस बात पर विचार कर सकते हैं कि मूल के एक आकार (25%, 10%) पर जो भी तुलना करनी है, वह इस बात पर निर्भर करता है कि आप किस छोटे अंतर को अनदेखा करने के लिए चुनते हैं और आपको कितने स्पीडअप की आवश्यकता होती है। मुझे बताएं कि क्या ये समाधान दिलचस्प हैं, और हम चर्चा कर सकते हैं या मैं नमूना कोड प्रदान कर सकता हूं।

Question 12

नक़ल छवि का पता लगाने के लिए अधिकांश आधुनिक दृष्टिकोण दिलचस्प बिंदुओं और ऐसे बिंदुओं के आसपास के क्षेत्र का वर्णन करने वाले विवरणों का उपयोग करते हैं। अक्सर SIFT का उपयोग किया जाता है। तब आप वर्णनकर्ताओं को अलग कर सकते हैं और क्लस्टर का उपयोग दृश्य शब्द शब्दावली के रूप में कर सकते हैं।

इसलिए अगर हम इन छवियों के सभी दृश्य शब्दों के लिए दो छवियों के सामान्य दृश्य शब्दों के अनुपात पर देखते हैं, तो आप छवियों के बीच समानता का अनुमान लगाते हैं। बहुत सारे रोचक लेख हैं। उनमें से एक डुप्लिकेट इमेज डिटेक्शन के पास है: minHash और tf-idf वेटिंग

Question 13

उदाहरण के लिए IMMI एक्सटेंशन और IMMI का उपयोग करके आप छवियों के बीच समानता को मापने के लिए कई अलग-अलग तरीकों की जांच कर सकते हैं: http://spl.utko.feec.vutbr.cz/en/component/content/article/46-image-processing-extension- के लिए-RapidMiner -5

कुछ सीमा को परिभाषित करके और कुछ विधि का चयन करके आप समानता को माप सकते हैं।