मैंने एक कंप्यूटर प्रोग्राम लिखा है जो कंप्यूटर की दृष्टि के लिए कुछ मानक तकनीकों (गाऊसी ब्लर, थ्रॉल्डिंग, ह्यू-ट्रांसफॉर्म आदि) का उपयोग करके एक स्थिर छवि (.jpeg, .png, आदि) में सिक्कों का पता लगा सकता है। किसी दिए गए चित्र से उठाए गए सिक्कों के अनुपात का उपयोग करके, मैं अच्छी निश्चितता के साथ स्थापित कर सकता हूं कि कौन से सिक्के हैं। हालांकि, मैं अपने आत्मविश्वास के स्तर में जोड़ना चाहता हूं और यह भी निर्धारित करता हूं कि क्या एक सिक्का जिसे मैं टाइप-ए (रेडियस अनुपात से) के लिए घटाता हूं वह भी सही कॉलो [यू] आर का है। समस्या यह है कि ब्रिटिश सिक्कों के लिए एट अल। (कॉपर, सिल्वर, गोल्ड), संबंधित रंग (कॉपर से गोल्ड तक) बहुत समान हैं।
मेरा एक रूटीन है जो RedGreenBlue (RGB) 'कलर-स्पेस' के संदर्भ में दिए गए सिक्के के माध्य रंग को निकालता है और इस रंग को HueSaturationBrightness (HSB या HSV) 'कलर-स्पेस' में परिवर्तित करता है।
RGB तीन सिक्का रंगों के बीच अंतर करने के प्रयास में काम करने के लिए बहुत अच्छा नहीं है (उदाहरण के लिए संलग्न [मूल] छवि देखें)। मेरे पास विभिन्न सिक्कों के रंगों के लिए निम्न रेंज और विशिष्ट मूल्य हैं:
नोट: यहां विशिष्ट मूल्य वास्तविक छवि के 'पिक्सेल-वार' माध्य का उपयोग करके चुना गया है।
**Copper RGB/HSB:** typicalRGB = (153, 117, 89)/(26, 0.42, 0.60).
**Silver RGB/HSB:** typicalRGB = (174, 176, 180)/(220, 0.03, 0.71).
**Gold RGB/HSB:** typicalRGB = (220, 205, 160)/(45, 0.27, 0.86)
मैंने पहली बार एक दिए गए माया रंग (आरजीबी का उपयोग करके) के बीच 'यूक्लिडियन दूरी' का उपयोग करने की कोशिश की और आरजीबी मानों को वेक्टर के रूप में मानते हुए ऊपर दिए गए प्रत्येक सिक्के प्रकार के लिए विशिष्ट मान; तांबे के लिए हमारे पास होगा:
जहां अंतर का सबसे छोटा मान ( ) हमें बताता है कि दिया गया सिक्का किस प्रकार का है। इस विधि ने खुद को बहुत गलत दिखाया है।
मैंने ऊपर दिए गए प्रकारों के विशिष्ट मूल्यों के साथ सिक्कों के रंग की तुलना करने की भी कोशिश की है। यद्यपि सैद्धांतिक रूप से यह चित्रों की बदलती चमक और संतृप्ति स्तर से निपटने के लिए बहुत बेहतर 'रंग-स्थान' प्रदान करता है, यह भी बहुत सटीक नहीं था।
प्रश्न: रंग के आधार पर (स्थिर छवि से) सिक्कों के प्रकार का निर्धारण करने के लिए सबसे अच्छी विधि क्या है?
आपके समय के लिए अत्यधिक धन्यवाद।
संपादित करें 1
नोट: मैंने नीचे चर्चा किए गए सभी विचारों की कोशिश की है और कुछ भी नहीं के आगे हासिल किया है। प्रकाश की स्थिति में भिन्नता (यहां तक कि एक ही छवि के भीतर) इस समस्या को बहुत कठिन बना देती है और इसे ध्यान में रखा जाना चाहिए।
2 संपादित करें (आउटकम की समर)
आपके जवाबों के लिये धन्यवाद। मेरे स्वयं के अनुसंधान (आपके उत्तर और टिप्पणियों सहित) ने इस बात पर प्रकाश डाला है कि मनमाने ढंग से प्रकाश, मनमाना कैमरा (मोबाइल डिवाइस) के सामान्य मामले में, सिक्का के रंग में उतार-चढ़ाव (यहां तक कि एक ही प्रजाति / प्रकार के लिए) यह समस्या कितनी कठिन है। आदि। मैंने पहली बार त्वचा के रंग की पहचान (अनुसंधान का एक बहुत सक्रिय क्षेत्र) को एक शुरुआती बिंदु के रूप में देखा और अकेले काकेशियन के लिए त्वचा के रंग की मान्यता के साथ अभी भी कई समस्याएं हैं ( वर्तमान तकनीकों की समीक्षा के लिए यह पेपर देखें ), और यह तथ्य कि इस समस्या में तीन अलग-अलग रंग की वस्तुएं हैं, जिनमें से सभी में निरंतर और अलग-अलग गुण हो सकते हैं, कंप्यूटर दृष्टि के इस विषय को वर्गीकृत करने और तदनुसार व्यवहार करने के लिए बहुत कठिन है (वास्तव में आप इस पर एक अच्छा पीएचडी कर सकते हैं। !)।
मैं नीचे DW द्वारा बहुत उपयोगी पोस्ट से Gamut बाधा विधि में देखा । यह पहली नजर में छवि को बदलने के लिए एक पूर्व-प्रसंस्करण कदम के रूप में बहुत ही आशाजनक था और अलग-अलग सिक्का वस्तुओं को उन रंगों के लिए जो प्रकाश की स्थिति से स्वतंत्र हैं। हालांकि, यहां तक कि यह तकनीक पूरी तरह से काम नहीं करती है (और इसमें मैपिंग के लिए छवियों / हिस्टोग्राम्स का एक पुस्तकालय शामिल है - जो मैं इसमें नहीं आना चाहता) और न ही बहुत अधिक जटिल न्यूरल नेटवर्क आर्किटेक्चर के तरीके। वास्तव में यह कागज सार में बताता है कि:
"current machine colour constancy algorithms are not good enough for colour-based
object recognition.".
यह कहना नहीं है कि इस विषय पर बहुत अधिक अप-टू-डेट पेपर नहीं हैं, लेकिन मैं उन्हें नहीं ढूंढ सकता हूं और यह इस समय बहुत सक्रिय शोध क्षेत्र नहीं लगता है।
जवाब AVB द्वारा भी मददगार था और मैं एल में देखा है एक बी * संक्षेप में।
"The nonlinear relations for L*, a*, and b* are intended to mimic the nonlinear
response of the eye. Furthermore, uniform changes of components in the L*a*b* colour
space aim to correspond to uniform changes in perceived colour, so the relative
perceptual differences between any two colours in L*a*b* can be approximated by
treating each colour as a point in a three dimensional space."
मैंने जो कुछ पढ़ा है, उससे मेरे डिवाइस पर निर्भर चित्रों के लिए इस रंग स्थान में परिवर्तन मुश्किल हो जाएगा - लेकिन मैं इस पर विस्तार से (कुछ प्रकार के कार्यान्वयन के साथ) जब मेरे पास थोड़ा और समय होगा।
मैं इस समस्या के ठोस समाधान के लिए अपनी सांस नहीं रोक रहा हूं और एल ए बी * के साथ प्रयास के बाद, मैं सिक्के के रंग की उपेक्षा कर रहा हूं और अपने वर्तमान ज्यामितीय पहचान एल्गोरिदम (सटीक एलिप्टिक ह्यूग ट्रांसफॉर्म आदि) को सुनिश्चित करने के लिए देख रहा हूं।
सभी को धन्यवाद। और इस प्रश्न के अंतिम नोट के रूप में, यहां एक नई ज्यामितीय पहचान एल्गोरिथ्म के साथ एक ही छवि है, जिसकी कोई रंग पहचान नहीं है: