निकट-डुप्लीकेट छवि जांच [बंद]


93

एक दिए गए चित्रों को एक दूसरे से समानता के आधार पर क्रमबद्ध करने का एक तेज़ तरीका क्या है।

फिलहाल मेरे पास एक प्रणाली है जो दो छवियों के बीच हिस्टोग्राम विश्लेषण करती है, लेकिन यह एक बहुत महंगा ऑपरेशन है और बहुत अधिक लगता है।

वैकल्पिक रूप से मैं एक एल्गोरिथ्म की तलाश कर रहा हूं जो प्रत्येक छवि को एक अंक देगा (उदाहरण के लिए एक पूर्णांक स्कोर, जैसे कि आरजीबी औसत) और मैं बस उस स्कोर को क्रमबद्ध कर सकता हूं। एक दूसरे के बगल में पहचान स्कोर या स्कोर संभव डुप्लिकेट हैं।

0299393
0599483
0499994 <- possible dupe
0499999 <- possible dupe
1002039
4995994
6004994 

आरजीबी औसत प्रति छवि बेकार है, क्या कुछ समान है?


5
एक महत्वपूर्ण प्रश्न, जो आपने लिखा है और उस संबंधित प्रश्न के कुछ उत्तरों के बारे में सोच रहा है जो कि Naaff ने बताया है, आप अधिक स्पष्ट रूप से परिभाषित करना चाहते हैं कि "समानता" का क्या अर्थ है। क्या एक ऐसी छवि है जो समान है, लेकिन पाँच पिक्सेल ऑफसेट हैं, "समान" हैं? नेत्रहीन हाँ ... लेकिन एक एल्गोरिथ्म के लिए ... शायद नहीं, जब तक आप इसके बारे में नहीं सोचते हैं, और इसके लिए जिम्मेदार हैं। क्या आप कोई और विवरण प्रदान कर सकते हैं? क्या डुप्लिकेट सटीक होगा, या सिर्फ "करीब"? क्या आप स्कैन को देख रहे हैं जहां वे एक मामूली कोण माप से भिन्न हो सकते हैं? तीव्रता के बारे में कैसे? वहाँ एक हैं बहुत चर के यहाँ ...
Beska

'डुप्लिकेट ’कैसे भिन्न होते हैं? उदा। क्या वे अलग-अलग मुद्रा / बदलाव के साथ एक ही स्थान के चित्र होंगे? आप कुछ ऐसा चाहते हैं जो छवियों की संख्या के साथ O (nlog (n)) हो। यदि संभव है तो किस प्रकार, क्या कोई जानता है? ऐसा लगता है कि यह हो सकता है ..
जस्टिन स्कीनर

@ अज्ञात: यदि आप किसी भी मौजूदा उत्तर से संतुष्ट नहीं हैं, तो क्या आप हमें कुछ और मार्गदर्शन दे सकते हैं? हमने आपके प्रश्न का उत्तर देने की पूरी कोशिश की है, लेकिन बिना किसी प्रतिक्रिया के हम कुछ बेहतर करने की संभावना नहीं रखते हैं।
नाफ

यह वर्तमान में कंप्यूटर विज्ञान में महान अनसुलझी समस्याओं में से एक है। गुड लक दोस्त।
जॉन ktejik

जवाबों:


70

छवि खोज और समानता के उपायों पर बहुत सारे शोध हुए हैं। यह एक आसान समस्या नहीं है। सामान्य तौर पर, एक एकल intयह निर्धारित करने के लिए पर्याप्त नहीं होगा कि क्या छवियां बहुत समान हैं। आपके पास उच्च झूठी-सकारात्मक दर होगी।

हालाँकि, जब से बहुत अधिक शोध हो चुका है, आप इसमें से कुछ पर नज़र डाल सकते हैं। उदाहरण के लिए, यह पेपर (पीडीएफ) एक कॉम्पैक्ट इमेज फ़िंगरप्रिंटिंग एल्गोरिथ्म देता है जो डुप्लिकेट छवियों को जल्दी और बिना बहुत अधिक डेटा संग्रहीत करने के लिए उपयुक्त है। ऐसा लगता है कि यह सही दृष्टिकोण है यदि आप कुछ मजबूत करना चाहते हैं।

यदि आप कुछ सरल खोज रहे हैं, लेकिन निश्चित रूप से अधिक तदर्थ, इस SO प्रश्न में कुछ अच्छे विचार हैं।


2
वह कागज 2004 से है, निश्चित नहीं है कि क्या यह अभी भी सबसे अच्छा जवाब है?
एंड्रयू

50

मैं सिर्फ एक आरजीबी हिस्टोग्राम का उपयोग करने से दूर जाने पर विचार करने की सलाह दूंगा।

आपकी छवि का एक बेहतर पाचन प्राप्त किया जा सकता है यदि आप छवि के 2d Haar तरंग को लेते हैं (यह बहुत आसान लगता है, तो इसका बहुत अधिक औसत और कुछ वर्ग जड़ें आपके गुणांक का वजन करती हैं) और बस k को बनाए रखें तरंगिका में भारित गुणांक एक विरल वेक्टर के रूप में, इसे सामान्य करते हैं, और इसके आकार को कम करने के लिए इसे बचाते हैं। आपको कम से कम पहले से अवधारणात्मक भार का उपयोग करके आरजी और बी को पुनर्विक्रय करना चाहिए या मैं YIQ (या योकसीजी, परिमाणीकरण शोर से बचने के लिए) पर स्विच करने की सलाह दूंगा ताकि आप कम महत्व के साथ क्रोमिनेंस जानकारी का नमूना ले सकें।

आप अब इन विरल सामान्यीकृत वैक्टरों में से दो के डॉट उत्पाद का उपयोग समानता के उपाय के रूप में कर सकते हैं। सबसे बड़े डॉट उत्पादों के साथ छवि जोड़े संरचना में बहुत समान हैं। यह आकार बदलने, ह्यू शिफ्टिंग और वॉटरमार्किंग के लिए थोड़ा प्रतिरोधी होने और लागू होने और कॉम्पैक्ट होने के लिए वास्तव में आसान होने का लाभ है।

आप k को बढ़ाकर या घटाकर भंडारण और सटीकता का व्यापार कर सकते हैं।

इस प्रकार की वर्गीकरण समस्या के लिए एकल संख्यात्मक अंक के आधार पर छंटनी अचूक होगी। यदि आप इसके बारे में सोचते हैं तो इसके लिए छवियों को केवल एक अक्ष के साथ 'परिवर्तन' करने में सक्षम होना चाहिए, लेकिन वे नहीं करते हैं। यही कारण है कि आपको सुविधाओं की एक वेक्टर की आवश्यकता है। हैर वेवलेट मामले में इसकी लगभग जहां छवि में सबसे तेज विच्छेदन होता है। आप जोड़ीदार के बीच की दूरी की गणना कर सकते हैं, लेकिन चूंकि आपके पास एक दूरी मीट्रिक है एक रैखिक क्रम में 3 छवियों के एक 'त्रिकोण' को व्यक्त करने का कोई तरीका नहीं है जो सभी समान रूप से दूर हैं। (यानी एक ऐसी छवि के बारे में सोचें जो सभी हरे रंग की हो, एक ऐसी छवि जो सभी लाल हो और एक छवि जो सभी नीले रंग की हो।)

इसका मतलब है कि आपकी समस्या के किसी भी वास्तविक समाधान के लिए आपके पास मौजूद छवियों की संख्या में O (n ^ 2) संचालन की आवश्यकता होगी। हालांकि, अगर यह माप रैखिक करने के लिए संभव हो गया था, तो आपको केवल ओ (एन लॉग एन), या ओ (एन) की आवश्यकता हो सकती है, अगर माप एक रेडिक्स प्रकार के लिए, कहें। उस ने कहा, आपको ओ (एन ^ 2) खर्च करने की आवश्यकता नहीं है क्योंकि अभ्यास के दौरान आपको पूरे सेट के माध्यम से झारने की आवश्यकता नहीं है, आपको बस कुछ सीमा से अधिक सामान thats को खोजने की आवश्यकता है। तो अपने विरल सदिश स्थान को विभाजित करने के लिए कई तकनीकों में से एक को लागू करके आप उन छवियों की 'मुझे खोजने के लिए बहुत तेजी से स्पर्शोन्मुखता प्राप्त कर सकते हैं जो किसी दिए गए दहलीज से अधिक समान हैं' समस्या हर छवि के विरुद्ध हर छवि की तुलना में भोलेपन से तुलना करने से होती है। आप की जरूरत है ... अगर आप के लिए कहा ठीक नहीं है।

किसी भी घटना में, मैंने व्यक्तिगत रूप से अच्छे प्रभाव के लिए कुछ साल पहले इसका इस्तेमाल किया था, जब मैं अलग-अलग बनावट की संख्या को कम करने की कोशिश कर रहा था, लेकिन इस स्थान में बहुत अधिक शोध शोर दिखाई दिया है जो इसकी प्रभावकारिता दिखा रहा है (और इस मामले की तुलना में हिस्टोग्राम वर्गीकरण के एक और अधिक परिष्कृत रूप में):

http://www.cs.princeton.edu/cass/papers/spam_ceas07.pdf

यदि आपको पता लगाने में बेहतर सटीकता की आवश्यकता है, तो संपादन और अधिक मजबूती से निपटने के लिए Haar तरंगिका (या हिस्टोग्राम) के साथ minHash और tf-idf एल्गोरिदम का उपयोग किया जा सकता है:

http://cmp.felk.cvut.cz/~chum/papers/chum_bmvc08.pdf

अंत में, स्टैनफोर्ड के पास इस तरह के दृष्टिकोण के अधिक विदेशी प्रकार के आधार पर एक छवि खोज है, जो तरंगों से अधिक सुविधा निष्कर्षण करने के लिए छवियों के घुमाए गए या स्केल किए गए वर्गों को खोजने के आधार पर है, आदि, लेकिन संभवत: यह आपके काम की मात्रा से परे है। 'करना चाहता हूँ।

http://wang14.ist.psu.edu/cgi-bin/zwang/regionsearch_show.cgi


ऐसा लगता है कि आप अप्रत्यक्ष रूप से केडी-पेड़ों का वर्णन कर रहे हैं और संभावित उम्मीदवारों के लिए स्थान खोजने के लिए पसंद कर रहे हैं। यह ध्यान देने योग्य हो सकता है।
Boojum

1
ठीक है, जिस कारण से मैंने अस्पष्ट अस्पष्टता से परे तकनीकों को निर्दिष्ट नहीं किया, वह यह है कि केडी-ट्री अच्छी तरह से काम करते हैं जब आपके पास अपने स्थान पर अपेक्षाकृत कम संख्या में आयाम होते हैं। यहां आपके पास संभावित ~ 128 या अधिक आयाम हैं जो बहुत कम आबादी वाले हैं। चूंकि वे विरल हैं, इसलिए अधिकांश मूल्य शून्य होंगे, इसलिए kd-style में विभाजन के आयामों में गोल-रॉबिन का जाना वास्तव में लगभग बेकार है। एक ही टोकन से आर-पेड़ टूट जाते हैं, जो आपके सबसे अच्छे दांव के रूप में सबसे अधिक संभावना है: एक्स-ट्री। दुर्भाग्य से, वे भी कई आयामों का सामना करने पर अपने प्रदर्शन की सीमा के पास हैं।
एडवर्ड KMETT

"और बस तरंगिका में k सबसे बड़े भार वाले गुणांक को एक विरल वेक्टर के रूप में बनाए रखते हैं," - प्रति पंक्ति या पूरे तरंगिका के लिए बनाए रखें?
ivan.ukr

"आपको कम से कम पहले से अवधारणात्मक भार का उपयोग करके आरजी और बी को पुनर्विक्रय करना चाहिए या मैं YIQ (या योकसीजी, परिमाणीकरण शोर से बचने के लिए) पर स्विच करने की सलाह दूंगा ताकि आप कम महत्व के साथ क्रोमिनेंस जानकारी का नमूना ले सकें।" - और फिर क्या? केवल वाई के लिए वेवलेट करें या सभी चैनलों के लिए करें? यदि सभी चैनलों के लिए है - कई चैनलों के साथ छवियों की समानता कैसे मापें? प्रत्येक चैनल के डॉट उत्पादों को जोड़ें और इसे समानता के माप के रूप में देखें या कुछ भारित अतिरिक्त होना चाहिए?
ivan.ukr

15

मैंने इसके लिए एक बहुत विश्वसनीय एल्गोरिथ्म लागू किया जिसे फास्ट मल्टीसर्जिंग इमेज क्वेरी कहा जाता है । उसके लिए मेरा (प्राचीन, निष्कलंक) कोड यहाँ है

क्या फास्ट मल्टीप्लसिंग इमेज क्वेरी करता है, छवि को वाईआईक्यू कलरस्पेस (आरजीबी से मिलान के लिए बेहतर अंतर) के आधार पर 3 टुकड़ों में विभाजित किया गया है। तब छवि अनिवार्य रूप से एक तरंग एल्गोरिथ्म का उपयोग करके संपीड़ित होती है जब तक कि प्रत्येक कलरस्पेस से केवल सबसे प्रमुख विशेषताएं उपलब्ध नहीं होती हैं। इन बिंदुओं को एक डेटा संरचना में संग्रहीत किया जाता है। क्वेरी छवियां उसी प्रक्रिया से गुजरती हैं, और क्वेरी छवि में प्रमुख विशेषताएं संग्रहीत डेटाबेस में उन लोगों से मेल खाती हैं। जितने अधिक मिलान होते हैं, उतनी ही अधिक छवियां समान होती हैं।

एल्गोरिथ्म का उपयोग अक्सर "स्केच द्वारा क्वेरी" कार्यक्षमता के लिए किया जाता है। मेरे सॉफ़्टवेयर ने केवल URL के माध्यम से क्वेरी छवियों को दर्ज करने की अनुमति दी, इसलिए कोई उपयोगकर्ता इंटरफ़ेस नहीं था। हालाँकि, मैंने पाया कि उस चित्र के बड़े संस्करण में थंबनेल मेल करने के लिए असाधारण रूप से अच्छी तरह से काम किया।

मेरे सॉफ़्टवेयर की तुलना में बहुत अधिक प्रभावशाली पुनर्प्राप्ति है जो आपको फ़्लिकर छवियों का उपयोग करके स्रोत के रूप में FMIQ एल्गोरिथ्म की कोशिश करने देता है। बहुत ही शांत! स्केच के माध्यम से या स्रोत छवि का उपयोग करके इसे आज़माएं, और आप देख सकते हैं कि यह कितनी अच्छी तरह काम करता है।


क्या यह अभी भी घुमाए गए चित्रों को पहचान सकता है?
एंडोलिथ

मुझे संदेह है कि यह उसके लिए बहुत अच्छा काम करेगा। आप शायद प्रत्येक रोटेशन के लिए छवियों को प्रासंगिक मैचों को अधिकतम करने के लिए सांकेतिक शब्दों में बदलना चाहते हैं।
ल्यूक फ्रेंकल

पुनर्प्राप्ति के लिए लिंक नीचे लगता है - क्या यह कहीं भी संग्रहीत है?
mmigdol

10

एक तस्वीर में कई विशेषताएं होती हैं, इसलिए जब तक आप अपने आप को संकीर्ण नहीं करते हैं, औसत चमक की तरह, आप एक एन-आयामी समस्या वाले स्थान के साथ काम कर रहे हैं।

अगर मैंने आपसे दुनिया के शहरों के लिए एक पूर्णांक आवंटित करने के लिए कहा है, तो मैं बता सकता हूं कि कौन से करीबी लोग हैं, परिणाम महान नहीं होंगे। उदाहरण के लिए, आप अपने एकल पूर्णांक के रूप में समय क्षेत्र चुन सकते हैं और कुछ शहरों के साथ अच्छे परिणाम प्राप्त कर सकते हैं। हालांकि, उत्तरी ध्रुव के पास एक शहर और दक्षिणी ध्रुव के पास एक अन्य शहर भी एक ही समय क्षेत्र में हो सकता है, भले ही वे ग्रह के विपरीत छोर पर हों। अगर मैं आपको दो पूर्णांक का उपयोग करने देता हूं, तो आप अक्षांश और देशांतर के साथ बहुत अच्छे परिणाम प्राप्त कर सकते हैं। समस्या छवि समानता के लिए समान है।

सभी ने कहा, ऐसे एल्गोरिदम हैं जो समान छवियों को एक साथ क्लस्टर करने की कोशिश करते हैं, जो कि प्रभावी रूप से आप क्या पूछ रहे हैं। यह तब होता है जब आप पिकासा के साथ फेस डिटेक्शन करते हैं। इससे पहले कि आप किसी भी चेहरे की पहचान करते हैं, यह समान रूप से एक साथ पकड़ता है ताकि समान चेहरों के सेट के माध्यम से जाना आसान हो और उनमें से अधिकांश को एक ही नाम दिया जाए।

सिद्धांत घटक विश्लेषण नामक एक तकनीक भी है, जो आपको किसी भी छोटी संख्या के आयामों के लिए n-आयामी डेटा को कम करने देती है। तो n फीचर्स वाली तस्वीर को एक फीचर में कम किया जा सकता है। हालाँकि, यह अभी भी छवियों की तुलना करने के लिए सबसे अच्छा तरीका नहीं है।


1
यह एक म्यूट पॉइंट है, लेकिन यदि आप उदाहरण के लिए, किसी भी संख्या के संयोजन का प्रतिनिधित्व करने के लिए एकल पूर्णांक का उपयोग कर सकते हैं, यदि, उदाहरण के लिए, x = 2 और फीचर y = 3 और फीचर z = 5 और फीचर aa = 7, et cetera, फिर एक पूर्णांक के फैक्टराइज्ड रूप में उस आधार को जिस शक्ति से उठाया गया था, वह उस विशिष्ट छवि के लिए विशेषता का मूल्य होगा। फिर से, एक मूट बिंदु क्योंकि संख्या का आकार बेतुका होगा। हालांकि उस आकार को और कम किया जा सकता है ... हम सिर्फ संरचित डेटा के बारे में बात कर रहे हैं।
अरगेल

सच। लेकिन असली बिंदु संख्याओं की व्यवस्था करना है ताकि समान चित्र संख्यात्मक रूप से एक साथ करीब हों। इसके बावजूद कि मैंने ऊपर क्या कहा, यह संभव है। संक्षेप में, आप n- आयामी अंतरिक्ष में छवियों के माध्यम से एक न्यूनतम (या निकट-न्यूनतम) पथ खोजने के लिए ट्रैवलिंग सॉल्यूशन समस्या को हल कर सकते हैं (जहां n छवियों की तुलना करने के लिए आपके द्वारा उपयोग की जाने वाली सुविधाओं की संख्या है)। लेकिन वह महंगा है।
नील

8

एक सी लाइब्रेरी ("लिबफश" - http://phash.org/ ) है जो एक छवि के "अवधारणात्मक हैश" की गणना करेगा और आपको हैश की तुलना करके समान छवियों का पता लगाने की अनुमति देगा (इसलिए आपको प्रत्येक छवि की तुलना करने की आवश्यकता नहीं है सीधे हर दूसरी छवि के खिलाफ) लेकिन दुर्भाग्य से यह बहुत सटीक नहीं लगता था जब मैंने इसे आज़माया।


5

आपको यह तय करना होगा कि "समान" क्या है। इसके विपरीत? ह्यू?

क्या एक तस्वीर "समान" एक ही तस्वीर उल्टा है?

मुझे यकीन है कि आप 4x4 टुकड़ों में छवियों को तोड़कर और प्रत्येक ग्रिड सेल के लिए औसत रंग प्राप्त करके बहुत सारे "करीबी कॉल" पा सकते हैं। आपकी छवि प्रति सोलह अंकों की होगी। समानता का न्याय करने के लिए, आप छवियों के बीच अंतर के वर्गों का योग करेंगे।

मुझे नहीं लगता कि एक भी हैश समझ में नहीं आता है, जब तक कि यह एकल अवधारणा के खिलाफ नहीं है, जैसे कि ह्यू, या चमक, या इसके विपरीत।

यहाँ आपका विचार है:

0299393
0599483
0499994 <- possible dupe
0499999 <- possible dupe
1002039
4995994
6004994

सबसे पहले, मैं मान रहा हूँ कि ये दशमलव संख्याएँ हैं जो R * (2 ^ 16) + G * (2 ^ 8) + B, या ऐसा ही कुछ हैं। जाहिर है कि यह अच्छा नहीं है क्योंकि लाल का वजन कम होता है।

HSV स्पेस में जाना बेहतर होगा। आप एचएसवी के बिट्स को हैश में फैला सकते हैं , या आप बस एच या एस या वी को व्यक्तिगत रूप से व्यवस्थित कर सकते हैं, या आपके पास प्रति छवि में तीन हैश हो सकते हैं।


एक और चीज़। यदि आप वजन आर, जी, और बी वजन को उच्चतम करते हैं, तो लाल, फिर मानवीय दृश्य संवेदनशीलता से मेल खाने के लिए नीला।


5

वेब सेवाओं के युग में आप http://tineye.com की कोशिश कर सकते हैं


3
Tineye के पीछे कोड बिल्कुल वही लगता है जो प्रश्नकर्ता के बाद होता है, लेकिन मुझे नहीं लगता कि वेब-सेवा के रूप में यह बहुत उपयोगी है, क्योंकि इसमें दो छवि देने और पूछने के लिए कोई स्पष्ट (स्पष्ट) तरीका नहीं है "क्या ये समान हैं?" " - दूसरी छवि एक वेब-पेज पर होगी, और tineye द्वारा अनुक्रमित
dbr

1
शायद व्यापार उपयोगकर्ताओं के लिए एपीआई प्रदान कर रहे हैं? उनसे इस बारे में संपर्क किया जाना चाहिए।
zproxy

एक वाणिज्यिक एपीआई है जो बिल्कुल सेवाएं प्रदान करता है ।.tineye.com/ MatchEngine
गजस


1

मैंने माना कि अन्य डुप्लिकेट छवि खोज सॉफ़्टवेयर छवियों पर FFT करता है, और वैक्टर के रूप में विभिन्न आवृत्तियों के मूल्यों को संग्रहीत करता है:

Image1 = (u1, u2, u3, ..., un)
Image2 = (v1, v2, v3, ..., vn)

और फिर आप दो छवियों के वजन वैक्टर के बीच की दूरी की गणना करके समानता के लिए दो छवियों की तुलना कर सकते हैं :

distance = Sqrt(
     (u1-v1)^2 +
     (u2-v2)^2 +
     (u2-v3)^2 +
     ...
     (un-vn)^2);

2
अधिकांश प्राकृतिक छवियों में बहुत समान आवृत्ति सामग्री होती है, इसलिए मुझे संदेह है कि यह एक बहुत अच्छी मीट्रिक होगी।
हैन्स ओवर्न

1

एक समाधान एक बुलबुला प्रकार प्रदर्शन करने के लिए आवश्यक चित्रों के हर जोड़े पर एक आरएमएस / आरएसएस प्रदर्शन करना है। दूसरा, आप प्रत्येक छवि पर एक FFT प्रदर्शन कर सकते हैं और प्रत्येक छवि के लिए एक पूर्णांक प्राप्त करने के लिए कुछ अक्ष औसत कर सकते हैं, जिसे आप क्रमबद्ध करने के लिए एक सूचकांक के रूप में उपयोग करेंगे। आप इस बात पर विचार कर सकते हैं कि मूल के एक आकार (25%, 10%) पर जो भी तुलना करनी है, वह इस बात पर निर्भर करता है कि आप किस छोटे अंतर को अनदेखा करने के लिए चुनते हैं और आपको कितने स्पीडअप की आवश्यकता होती है। मुझे बताएं कि क्या ये समाधान दिलचस्प हैं, और हम चर्चा कर सकते हैं या मैं नमूना कोड प्रदान कर सकता हूं।


FFT आपको केवल रंग जानकारी और स्थिति के बारे में कोई जानकारी प्रदान नहीं करता है। आकार देने से परिणामी छवि पर प्रभाव की परवाह किए बिना किसी भी आकार के नीचे सभी विशेषताओं को अनदेखा किया जाता है। एक ग्रे छवि और एक चेकबोर्ड उस माप के तहत समान हो सकता है। एक तरंग दृष्टिकोण (Daubechies, Haar, आदि) प्रत्येक डेटा बिंदु में स्थिति और रंग जानकारी के अनुपात से व्यापार करके स्थिति और रंग जानकारी दोनों प्रदान करने के लाभ हैं।
एडवर्ड KMETT

2
नहीं, किसी छवि के FFT में मूल की सभी स्थानिक जानकारी होती है। आप एफएफटी से मूल को फिर से संगठित कर सकते हैं। homepages.inf.ed.ac.uk/rbf/HIPR2/fourier.htm एक हिस्टोग्राम, हालाँकि, जो आप के बारे में सोच रहे थे, वह नहीं हो सकता है।
पॉल

1

नक़ल छवि का पता लगाने के लिए अधिकांश आधुनिक दृष्टिकोण दिलचस्प बिंदुओं और ऐसे बिंदुओं के आसपास के क्षेत्र का वर्णन करने वाले विवरणों का उपयोग करते हैं। अक्सर SIFT का उपयोग किया जाता है। तब आप वर्णनकर्ताओं को अलग कर सकते हैं और क्लस्टर का उपयोग दृश्य शब्द शब्दावली के रूप में कर सकते हैं।

इसलिए अगर हम इन छवियों के सभी दृश्य शब्दों के लिए दो छवियों के सामान्य दृश्य शब्दों के अनुपात पर देखते हैं, तो आप छवियों के बीच समानता का अनुमान लगाते हैं। बहुत सारे रोचक लेख हैं। उनमें से एक डुप्लिकेट इमेज डिटेक्शन के पास है: minHash और tf-idf वेटिंग


1

उदाहरण के लिए IMMI एक्सटेंशन और IMMI का उपयोग करके आप छवियों के बीच समानता को मापने के लिए कई अलग-अलग तरीकों की जांच कर सकते हैं: http://spl.utko.feec.vutbr.cz/en/component/content/article/46-image-processing-extension- के लिए-RapidMiner -5

कुछ सीमा को परिभाषित करके और कुछ विधि का चयन करके आप समानता को माप सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.