छवि मान्यता


11

एक ओपन-सोर्स सिस्टम की तलाश है जो व्यावसायिक उपयोग को 2-डी छवियों के एक बड़े और व्यवस्थित रूप से बढ़ते संग्रह पर छवि पहचान करने की अनुमति देता है जहां केवल ज्ञात विविधताएं होंगी:

  • छवि का स्केलिंग आकार,
  • चित्र का कोण, चित्र है,
  • रंग-सिंक ऑफ़सेट्स, जिसका अर्थ है कि स्रोत छवि के कैप्चर और रेंडरिंग में अनियमितताएँ उदाहरण के लिए उदाहरण से भिन्न होती हैं,
  • फ़ोटो की काट-छाँट,
  • वाटरमार्क या टेक्स्ट का जोड़,
  • संभव फ़ोकस विविधताएँ, जिसका अर्थ है कि कैप्चर फ़ोकस में नहीं था, न कि एक छवि हेरफेर फ़िल्टर लागू किया गया है।

मैं आवेदन को प्रशिक्षित करने के साथ ठीक हूं, जब तक कि ऐसा करने पर मिलने वाला भुगतान बंद हो जाएगा - उसने कहा, दीर्घकालिक मुझे उम्मीद है कि 2-डी उदाहरणों की गिनती प्रारंभिक कुछ हजारों से आगे बढ़ने के लिए सौ हजारों में; लेकिन यह दीर्घकालिक है, और मुझे खुशी होगी कि एक समाधान है जो 1000 उदाहरणों के प्रशिक्षण सेट और उदाहरण के लिए 10 उदाहरणों के साथ अच्छी तरह से काम करता है।

अद्यतन: बाइनरी रखने वाले सभी लोगों के लिए आंतरिक स्रोत के बिना भी कोड जारी किए बिना व्यावसायिक आंतरिक वितरण के लिए लाइसेंस का उपयोग करने की आवश्यकता है। कोड कभी भी बेचा नहीं जाएगा, बस आंतरिक उपयोग किया जाता है, लेकिन हर उपयोगकर्ता के पास स्रोत कोड तक पहुंच नहीं होगी, बस इंटरफ़ेस।


2
क्या आपने OpenCV पर विचार किया है?

+1 @pwny: धन्यवाद - तो नहीं, मैंने कभी भी किसी कंप्यूटर विज़न (CV) सिस्टम की कोशिश नहीं की है, बस यह अंदाजा लगाने की कोशिश कर रहा हूं कि क्या मैं जिस तरह से समस्या के बारे में सोच रहा हूं वह सही है। मैं बताता हूं कि चित्र क्या हैं, लेकिन चूंकि यह एक व्यावसायिक उद्यम से संबंधित है और सीवी प्रणाली केवल आंतरिक उपयोग के लिए होगी, मैं यह नहीं बताने का प्रयास कर रहा हूं कि सिस्टम क्या होगा, लेकिन यह चुनौतियों का सामना करेगा। यदि OpenCV वर्तमान आवश्यकताओं को पूरा करता है, तो कृपया इसे उत्तर के रूप में पोस्ट करें और यदि संभव हो तो प्रदान की गई कार्यात्मक आवश्यकताओं को कवर करने वाले संबंधित डॉक्स से लिंक करने का प्रयास करें। फिर से धन्यवाद!

1
कॉपीराइट कानून के अनुसार, "आंतरिक वितरण" जैसी कोई चीज नहीं है। इसलिए अधिकांश लाइसेंस (सभी के बारे में मुझे पता है) उस संबंध में प्रतिबंध से परेशान नहीं हैं।
एमएसल्टर्स

+1 @MSalters: धन्यवाद, क्या आपके पास "कॉपीराइट कानून के अनुसार" के लिए एक लिंक है - इसका मतलब है कि ऐसा लगता है जैसे आप कह रहे हैं कि यह यूएस कॉपीराइट कानून के भीतर कहा गया है, हालांकि शायद मैं आपकी टिप्पणी में पढ़ रहा हूं।

1
@blunders: तकनीकी रूप से, यह TRIPS (अनुच्छेद 1.3) से है, जो यह स्थापित करता है कि एक कानूनी व्यक्ति (जैसे एक निगम) को एक प्राकृतिक व्यक्ति की तरह व्यवहार किया जाना है।
एमएसल्टर्स

जवाबों:


10

यह थोड़ा निम्न-स्तर का हो सकता है, लेकिन OpenCV आपको ऐसे उपकरण प्रदान कर सकता है, जिन्हें आपको ऐसी छवि पहचान सॉफ़्टवेयर बनाने की आवश्यकता है। बेशक, OpenCV आपको बॉक्स से बाहर की आवश्यकता के साथ प्रदान नहीं करता है (मुझे लगता है, मैं कोई समर्थक नहीं हूं) लेकिन इसका उद्देश्य वास्तविक समय की कंप्यूटर दृष्टि के लिए जो आवश्यक है उसे प्रदान करना है।

आप यहां प्रलेखन पर पढ़ना शुरू कर सकते हैं । उस पृष्ठ पर कुछ अच्छी किताबें भी सूचीबद्ध हैं।

उम्मीद है कि इससे मदद करेगी, सुसंयोग!


क्या OpenCV के GPLV2 लाइसेंस का मतलब है कि यह बंद स्रोत प्रणाली के भीतर आंतरिक रूप से वितरित होने में असमर्थ है? धन्यवाद!

आप GPLV2 लाइसेंस कहां देखते हैं? होम पेज पर पहले पैराग्राफ में इसे बीएसडी लाइसेंस के रूप में सूचीबद्ध किया गया है।

@deterb: पाद लेख में, पृष्ठ के बहुत नीचे।

@deterb: GPL लिंक प्रकट करें मोइनमाइक विकी इंजन के लिए है जिसका उपयोग OpenCV के लिए विकी के लिए किया जाता है, OpenCV के लिए नहीं - मेरी त्रुटि को इंगित करने के लिए धन्यवाद!

+1 @pwny: इसलिए जैसा कि बताया गया है, ओपनसीवी एक बीएसडी लाइसेंस के तहत है, जो वेबसाइट होमपेज पर बताया गया है (प्रतीत होता है कि पाद GPLV2 लाइसेंस ओपनसीवी पर लागू नहीं होता है), इसके अलावा ओपनवीवी और सर्च सर्च लाइसेंस डाउनलोड करके इसकी पुष्टि करने का प्रयास किया गया है। यह सब फाइलें हैं; जो अन्य 3rd पार्टी लाइसेंसों के बीच में लौटता है, एक लाइसेंस जो OpenDV के लिए BSD लाइसेंस के रूप में दिखाई देता है, हालांकि यह नहीं बताता है कि यह BSD लाइसेंस है। तो, उस पर जा रहे हैं, आपका जवाब एक बड़ी मदद है, और आगे बढ़ने के लिए काफी अच्छा लगता है। धन्यवाद!

2

मैं आपको यहाँ के रूप में TopSurf का उपयोग करने की सलाह देता हूं: http://www.liacs.nl/~bthomee/topsurf/index.html http://press.liacs.nl/researchdownloads/topsurf/

यह बड़े पैमाने पर मान्यता दे सकता है और खुला स्रोत है। कम से कम इसके साथ अपने परिणामों को बेंचमार्क करने का प्रयास करें।


2

चर्चा में जोड़ने के लिए मैं वर्तमान में छवि मिलान पर काम कर रहा हूं और मैंने पाया कि OpenCV का ORB मुफ्त है; हालाँकि SURF और SIFT नहीं हैं। आप इस उदाहरण को एक संभावित शुरुआती बिंदु के रूप में देख सकते हैं ।


1

पास्टेक http://www.pastec.io को प्रारंभिक प्रश्न की आवश्यकताओं को पूरा करना चाहिए।

यह एलजीपीएल के तहत जारी छवि मान्यता के लिए एक खुला स्रोत सूचकांक और खोज इंजन है। यह एक सरल HTTP एपीआई का उपयोग करके आसानी से इंडेक्स में मेल खाने वाली छवियों को जोड़ने, हटाने और खोजने की अनुमति देता है। यह OpenCV पर आधारित है और ORB डिस्क्रिप्टर का उपयोग करता है, जो SURF और SIFT के विपरीत पेटेंट मुक्त है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.