कंप्यूटर दृष्टि एल्गोरिदम (यह कैसे संभव है?)


9

मैंने हाल ही में एक ऐसी कंपनी को ठोकर मारी है, जिसने एक ऐसी कंप्यूटर विज़न तकनीक बनाई है जो स्वचालित रूप से शॉपलिफ्टिंग का पता लगाने और अपने उपयोगकर्ताओं को सचेत करने में सक्षम है।

संपर्क

कंपनी द्वारा प्रदान किए गए कुछ वीडियो और उदाहरणों को देखने से मुझे पूरी तरह से चकित और आश्चर्यचकित हो गया है कि पृथ्वी पर वे इस कार्यक्षमता को कैसे प्राप्त कर सकते हैं।

मैं समझता हूं कि यहां कोई भी मुझे यह बताने में सक्षम नहीं है कि यह कैसे हासिल किया जा सकता है, लेकिन क्या कोई जागरूक है - और मुझे इस क्षेत्र में अनुसंधान करने के लिए संकेत दे सकता है या वैकल्पिक रूप से संभवतः विवरण प्रदान कर सकता है कि इस तरह से कुछ कैसे लागू किया जा सकता है या मार्गदर्शन जहां से शुरू हो सकता है?

मेरी समझ यह थी कि कंप्यूटर दृष्टि एल्गोरिदम इस परिष्कृत होने से कई साल दूर थे। क्या इस तरह का आवेदन वास्तव में संभव है? कोई भी एक अनुमान लगाने के लिए तैयार है कि उन्होंने यह कैसे हासिल किया?


2
यह इतना मुश्किल नहीं लगता है। खेल वस्तुओं के बीच हर समय टकराव का पता लगाते हैं; आप किसी व्यक्ति और वस्तुओं की शेल्फ के बीच टकराव का पता क्यों नहीं लगा सकते हैं, और तब एक अलार्म उठाएं जब वह व्यक्ति भुगतान किए बिना दरवाजे की ओर चल रहा था?
रॉबर्ट हार्वे

बिल्कुल सही। यह सिर्फ वस्तु मान्यता और टकराव का पता लगाने के लिए है। जब तक वे इसे स्कैनर पर हुक नहीं देते हैं, तब तक यह आसानी से स्कैनर के ऊपर वस्तुओं को ले जाकर आता है, लेकिन इसके थोड़ा ऊपर। ऑब्जेक्ट स्कैनर से टकराता हुआ दिखाई देगा लेकिन वास्तव में ऐसा नहीं था।
एंड्रयू टी फिनेल

वैसे भी, वेबसाइट (स्वीटहार्टिंग, बास्केट-लॉस एंड सेल्फ-चेकआउट) में वर्णित किसी भी डिटेक्शन मैकेनिज्म को दूरस्थ रूप से परिष्कृत रूप से कुछ भी करने की आवश्यकता नहीं है। वे एक बहुत ही सीमित क्षेत्र (कैशियर काउंटर) में जांच करते हैं, और टोकरी में देखी गई वस्तुओं को क्रॉस-चेक कर सकते हैं कि बार-कोड स्कैनर क्या कह रहा है, वास्तव में स्कैन किया गया था।
रॉबर्ट हार्वे

1
माफ़ कीजियेगा मैं भ्रमित हूँ। आओ हम स्वैच्छिक उदाहरण लेते हैं। मेरे पास दो आइटम हैं, एक कम लागत वाला आइटम, एक उच्च। मैंने उच्च लागत एक और स्कैन के तहत कम लागत वाली वस्तु को रखा। उस बिंदु पर हम तुलना कर सकते हैं कि कैशियर के हाथ में जो कैमरा में दिखाई दे रहा है, उसमें POS प्रणाली में क्या स्कैन किया गया था, लेकिन इसके लिए सैकड़ों सैकड़ों संभावितों के मुकाबले "बैग में क्या डाला जा रहा है" इस प्रणाली को सक्षम करने की आवश्यकता है सीमांत गुणवत्ता के कैमरे के माध्यम से आइटम। यह बेहद जटिल लगता है। मैं क्या खो रहा हूँ?
मैक्सिम गेर्शकोविच

6
मुझे लगता है कि आप इस बारे में बहुत अधिक काम कर रहे हैं कि यह कितना अच्छा है मुझे यकीन है कि आप एक सभ्य त्रुटि दर है, और यह प्रणाली को खेल के लिए बहुत आसान है। मैं इसे व्हिसल ब्लोअर प्रकार प्रणाली के रूप में देखता हूं, जहां यह वीडियो में संभावित स्थानों की पहचान करता है, जिन्हें मानव समीक्षा की आवश्यकता होती है। जैसे, अशुद्धि अच्छी तरह से सहन की जाती है।
क्रिस

जवाबों:


5

आप कला की स्थिति के बारे में गलत जानकारी दे रहे हैं। कई साल पहले मैंने एक ऐसी कंपनी के लिए काम किया था, जिसने कई तरह के उद्देश्यों के लिए ऐसी प्रणालियों का निर्माण किया। एक एक बेहद सफल हवाई अड्डा ई-नियंत्रण प्रणाली थी, जो आसानी से बाहर निकलने वाले दालान में गलत तरीके से चलने वाले व्यक्ति और अंतर में गेंदों जैसी चीजों के बीच अंतर बता सकती थी या लोगों ने सही तरीके से नेतृत्व किया। वास्तविक समय में किसी दृश्य में वस्तुओं को पहचानना आसान नहीं है, लेकिन हम इसे सुपर कंप्यूटर पर नहीं बल्कि एम्बेडेड सीपीयू पर कर रहे थे।

मैंने वहां कुछ भी नहीं देखा जो कुछ साल पहले विश्वसनीय नहीं था।


4

वास्तव में यह कंपनी भारत में कंप्यूटर विजन और मैनुअल रिव्यू का एक हाइब्रिड उपयोग करती है। यह विशेष रूप से जानेमन जैसे तत्वों के लिए शुद्ध कंप्यूटर दृष्टि नहीं है। वास्तव में मैं एक रिटेलर को जानता हूं जो इस प्रणाली के साथ काफी समस्या रखता है जो कि सिस्टम प्रदर्शन I स्टोर के कारण नहीं है लेकिन भारत में बैंडविड्थ शिपिंग वीडियो है। यह मैनुअल कोडिंग है कि वे त्रुटियों को कैसे कम करते हैं और अब कुछ विक्रेताओं के साथ एक विशिष्ट तकनीकी पूछताछ है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.