डीप न्यूरल नेटवर्क का उपयोग करके ऑब्जेक्ट का आकार मापना


10

मेरे पास उनकी लंबाई (100k से अधिक नमूनों) की जमीनी सच्चाई के साथ वाहनों का एक बड़ा डेटासेट है। क्या वाहन की लंबाई मापने / अनुमान करने के लिए एक गहरे नेटवर्क को प्रशिक्षित करना संभव है? मैंने गहरे तंत्रिका नेटवर्क का उपयोग करके ऑब्जेक्ट आकार का आकलन करने से संबंधित कोई भी कागजात नहीं देखा है।


1
बहुत अच्छा सवाल है। ऐ में आपका स्वागत है!
DukeZhou

(नोट टू मॉडरेटर) - यह एक प्लेसहोल्डर उत्तर है जो ओपी से सवाल पूछ सकता है क्योंकि मैं टिप्पणी नहीं कर सकता कि क्या आपका डेटा छवियों या पाठ सेट है? hisairnessag3, OpenCV से किसी वस्तु का पता लगाने वाले DNN
Adnan S

जवाबों:


4

हाँ! यह निश्चित रूप से किया जा सकता है। चूंकि आपके पास एक लेबल किया गया डेटासेट है, जो इसे और अधिक सरल बनाता है!

मैं इस परियोजना पर एक नज़र डालूंगा और आपको वहां जाना चाहिए जहां आपको जाने की आवश्यकता है।

कार्यान्वयन का विवरण बहुत सीधा होना चाहिए। मुझे बताएं यदि आपकी आगे सहायता की जा सकती है।


1
यह स्पष्ट करना आवश्यक नहीं है कि कोई व्यक्ति मतदान क्यों कर रहा है। कई प्रोग्रामर के पास टिप्पणियों को देखने के लिए पर्याप्त समय नहीं है, वे वोट देखने के लिए देखते हैं कि जवाब इसके लायक है या नहीं। यदि आप प्रश्न को फिर से पढ़ते हैं, तो आप पाएंगे कि प्रश्न विशेष रूप से डीएनएन का उपयोग करने के बारे में है, और कुछ नहीं। आपके द्वारा साझा की गई परियोजना Opencv का उपयोग करने के बारे में है ... यदि आप साझा की गई पोस्ट के तहत टिप्पणियों को पढ़ते हैं, तो आप पाएंगे कि लोग DNN के बारे में पूछ रहे हैं, लेकिन पोस्ट स्वयं DNN का उपयोग नहीं करता है। वैसे मैं वह व्यक्ति नहीं हूं, जिसने नीचे अपना जवाब दिया था
BH85

2
यह आवश्यक नहीं है लेकिन सहायक है। यदि आप किसी भी गहराई पर खोज करते हैं तो आपको DNNs के लिए इस विशेष उपयोग के मामले में कोई परियोजना या कागजात नहीं मिलेगा। कहा जा रहा है कि, मैंने ओपी शुरू होने की उम्मीद में निकटतम संभावित परियोजना का संदर्भ दिया। इसके अतिरिक्त, मैंने प्रश्न का उत्तर दिया। सवाल यह था कि क्या यह किया जा सकता है।
23/17

आपके उत्तर के लिए धन्यवाद! मुझे लगता है कि यह कैसे / क्यों संभव है की एक छोटी व्याख्या द्वारा सुधार किया जाएगा। कम से कम वास्तुकला की रूपरेखा बहुत मददगार होगी।
बेन एन

1

हाँ यह संभव है, लेकिन पहले आपको छवि में किसी वस्तु को पहचानना होगा , या तो 1) वाहन को स्वयं, और फिर उस वाहन के ज्ञात आकार की रिपोर्ट करें, या 2) एक ज्ञात वस्तु जो कार से कैमरे से समान दूरी पर हो ( एक अंकुश, एक स्टॉप साइन, ड्राइवर का सिर, एक शेटलैंड पोनी ... जो भी हो), और फिर उस वस्तु का उपयोग कार के आकार को जांचने के लिए करें जो इसके बहुत करीब है।

एक छवि में कोई भी कार कैमरे से एक अज्ञात दूरी होगी, जिससे कार का ऑब्जेक्ट फोटो से फोटो तक बड़ा या छोटा दिखाई देगा। यदि आप कार को नहीं पहचानते हैं या कम से कम एक रेफ़रेंट ऑब्जेक्ट जिसे एक ज्ञात आकार है, तो कार का भौतिक आकार अनलिब्रेट किया जाएगा - आपके पास आपके आकार के अनुमान के लिए कोई आधार नहीं होगा।

यदि कार अज्ञात है, तो भले ही आपके पास दृश्य सुराग हों (कैमरे से कार की दूरी का एक संदर्भ वस्तु मौजूद है या ज्ञात है), कैमरे के लेंस के चौड़े कोण-नेस की अज्ञात सीमा एक अज्ञात कार के आकार को विकृत कर सकती है (ऊँचाई बनाम चौड़ाई), इसके स्पष्ट आयामों का अनुमान लगाने की आपकी क्षमता को और जटिल करता है।


क्या वाहन का लाइसेंस प्लेट वह वस्तु हो सकती है जिसका उपयोग कार के आकार को जांचने के लिए किया जाता है? लाइसेंस प्लेट आमतौर पर एक ही आकार के होते हैं।
नाजी

1
आपको उन मान्यताओं के बारे में सावधान रहना होगा जो आप मानते हैं कि लाइसेंस प्लेट एक ही आकार के हैं। उदाहरण के लिए, एक ऑस्ट्रेलियाई प्लेट और यूएस प्लेट विभिन्न आकार हैं। यदि यह आपके आवेदन के लिए कोई समस्या नहीं है (यह केवल कभी एक देश में चलेगा), तो आप प्लेट के लिए एक संदर्भ आकार मान सकते हैं। आपको हालांकि अभी भी सावधान रहना होगा, क्योंकि प्लेट सामान्य रूप से आपके लिए उन्मुख नहीं हो सकती है। यदि कार 45 डिग्री पर है, तो प्लेट की चौड़ाई 0 पिक्सेल से कम दूरी पर होगी, यहां तक ​​कि समान दूरी पर भी।
18

1

मुझे लगता है कि यह पेपर आपकी मदद कर सकता है: डीप लर्निंग और ज्योमेट्री का उपयोग करके 3 डी बाउंडिंग बॉक्स एस्टीमेशन

उन्होंने कारों के आकार को जानने के लिए 1 VGG-19 (ImageNet पर दिखावा) का इस्तेमाल किया


आपकी तरह, मैंने माना कि यह एक 3D बाउंडिंग बॉक्स का संदर्भ देने के बारे में है जहाँ डेटा को 2D छवि में दर्शाया गया है। प्रोजेक्ट herairnessag3 द्वारा उल्लिखित केवल 2 डी बाउंडिंग बॉक्स को संबोधित करता है जिसमें 3 डी प्रकृति के बारे में कोई सीखा हुआ हीन व्यवहार नहीं है जो छवि में है।
जिम

यह कागज 2 डी फसली छवि का उपयोग करके कार के आकार और अभिविन्यास का अनुमान लगाता है (केवल वांछित वस्तु होती है)।
क्रायैक्स डेसा
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.