क्या कोई कंप्यूटर दृष्टि एल्गोरिदम विशेष रूप से गहराई छवियों को लक्षित कर रहे हैं?


9

मैं एक किनेक्ट आधारित एप्लिकेशन के साथ उपयोग करने के लिए मार्कर डिटेक्शन एल्गोरिदम में देख रहा हूं, और जो काम मैं करने में सक्षम हूं, वह स्पष्ट रूप से 'सामान्य' छवियों में फीचर डिटेक्शन पर केंद्रित है।

हालाँकि, kinect हार्डवेयर पिक्सेल के प्रति 11-बिट डेप्थ मान को अनिवार्य रूप से समायोजित करने के बाद प्रदान करता है।

इस गहराई की छवि में वस्तुओं के किनारों के आसपास डाली गई छाया से इसमें विभिन्न दृश्य कलाकृतियां हैं (उदाहरण के लिए इस वीडियो में मजबूत काली सीमा देखें http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related )।

हालांकि कुछ पारंपरिक मशीन विज़न तकनीक (उदाहरण के लिए एज डिटेक्शन) इस के साथ अच्छी तरह से काम करती हैं, अन्य लोग ऐसा नहीं करते हैं, और ऐसा लगता है कि नेट पर इस बारे में बहुत कम जानकारी है।

एक साधारण उदाहरण के रूप में, गहराई मूल्य का उपयोग करने से यह एक मार्कर ब्लॉक के उन्मुखीकरण का पता लगाने के लिए तुच्छ बना देता है जब आप इसे स्थित करते हैं।

तो, क्या किसी ने किसी भी चर्चा / पत्र / आदि को देखा है जो सुविधा का पता लगाने के लिए एक गहन छवि प्रसंस्करण को कवर करता है?

क्या कोई भी "गहराई" मार्करों (मुद्रित बी / डब्ल्यू मार्करों के बजाय प्रभावी रूप से ओरिगामी ब्लॉक) का पता लगाने के लिए एक अच्छे एल्गोरिदम की सिफारिश कर सकता है?

मैंने अब तक छवियों को संसाधित करने के लिए opencv का उपयोग करते हुए तदर्थ प्रयोग किया है, लेकिन यह स्थिर या तेज़ के पास नहीं है।

यदि आप किसी प्रकार के परीक्षण के बिना किसी व्यावसायिक मशीन विज़न उत्पाद से लिंक करते हैं, तो कृपया अपने उत्तर में उल्लेख करें कि आपको क्यों उचित लगा।


इसके लिए कई टन कागजात और कार्यक्रम हैं। खेद कम बैंडविड्थ पर अधिक विस्तार से जवाब नहीं दे सकता है। RGBDemo ऐप देखें, इसमें ऑब्जेक्ट पहचानकर्ता शामिल है। इसके अलावा, पॉइंटक्लाउड लाइब्रेरी (पीसीएल), आरओएस, ओपनसीवी, सॉफ्टवेयर के लिए, और संभवतः कागजों के लिए Google विद्वान। आप उल्लेख करते हैं कि OpenCV आपके लिए संतोषजनक नहीं है, लेकिन PCL और RGBDemo हो सकता है।

मैं एक डेमो के कार्यान्वयन की तलाश नहीं कर रहा हूं, जो किनेक्ट से पता चलता है, या कुछ पीसी डेमो जो दिखाते हैं कि कैनेकेट या इमेज प्रोसेसिंग टूलकिट (यानी। opencv) से 3 डी मॉडल कैसे उत्पन्न किया जाए। मैं गहराई की छवियों के आधार पर फीचर पहचान के लिए एल्गोरिदम की तलाश कर रहा हूं ।

RGBDemo उन एल्गोरिदम को लागू करता है। कोड या कोड के लिए संदर्भ पढ़ें।

जवाबों:


8

पंजीकरण और मान्यता के लिए मेरा पसंदीदा 2.5 डी / 3 डी फीचर डिस्क्रिप्टर स्पिन छवि (मूल पेपर + पीएचडी थीसिस और सीएमयू से उपलब्ध सॉफ़्टवेयर में अधिक विवरण ) है।

अन्य हालिया अग्रिमों (उपयुक्त एल्गोरिदम के लिए सभी खोजे जाने योग्य) में शामिल हैं: 3 डी-स्विफ्ट, फास्ट प्वाइंट फ़ीचर हिस्टोग्राम, सामान्य संरेखित रेडियल फ़ीचर (एनएआरएफ), डेप्थ कर्नेल डिस्क्रिप्टर्स। पुराने तरीकों ने केवल क्षेत्र के पैच की पहचान करने के लिए वक्रता और किनारों जैसे सतह गुणों का उपयोग किया।

कौन सा सबसे अच्छा है? आप जो ढूंढना चाहते हैं, उस पर निर्भर करता है, अदर्शन, अतिरिक्त अव्यवस्था आदि।


7

आपको सभी महत्वपूर्ण शब्द सही मिले, मुझे आश्चर्य है कि सामग्री की तलाश करते हुए आपको वास्तव में कोई संबंधित लेख नहीं मिला।

सौभाग्य से, मेरे पास IEEE Xplore डिजिटल लाइब्रेरी तक पहुंच है। मुझे इनमें से किसी भी विशेष एल्गोरिदम की आवश्यकता नहीं है, लेकिन यह बहुत दिलचस्प लग रहा है, इसलिए यहां एक त्वरित खोज के कुछ परिणाम हैं जो मुझे लगता है कि प्रासंगिक हो सकता है (उनके शीर्षकों द्वारा उन्हें न देखें, उनके सार को देखें):

दुर्भाग्य से, मुझे नहीं लगता कि आप इनमें से किसी भी कागजात को मुफ्त में एक्सेस कर सकते हैं, कम से कम IEEE Xplore लाइब्रेरी के माध्यम से नहीं। यदि आपके पास पहुंच नहीं है, तो आप शायद Google विद्वान के साथ मिल सकते हैं , और वहां कुछ मुफ्त पेपर डेटाबेस हैं ( जब मैंने IEEE एक्सेस अभी तक नहीं किया है तो मैंने मेंडले डेटाबेस का उपयोग किया था)। इसके अलावा, सिर्फ कागज के अमूर्त या यादृच्छिक भागों के Googling भागों में कभी-कभी कुछ परिणाम मिलते हैं (आप लेख के लगभग पहले से प्रकाशित संस्करणों में ठोकर खा सकते हैं)।

उल्लिखित कागजात को खोजने के लिए मैंने जो खोज क्वेरीज़ का इस्तेमाल किया, वे थे: 3 डी इमेज , डेप्थ इमेज , किनेक्ट । जब आप पहले दो प्रश्नों को देख रहे हैं तो आप प्रोसेसिंग में भी फेंकना चाह सकते हैं ।

आशा है कि यह कुछ मदद करता है! मुझे खेद है कि मैं इस विषय में अधिक नहीं मिल सकता है, वास्तव में दिलचस्प लगता है।



@ मैनकॉफ़ सिर्फ एब्सट्रैक्ट से, मैं बस काम को ट्रैकिंग पर ध्यान केंद्रित करते हुए देखता हूं, और ऐसा लगता है कि यह प्रत्यक्ष जानकारी का उपयोग करने पर ध्यान केंद्रित करता है जिसमें बहुत अधिक फ़ीचर नहीं है। लेकिन फिर, मैं सिर्फ अमूर्त पढ़ता हूं, इसलिए यह सुनिश्चित नहीं है।

उन कई कागजों के लिए पीडीएफ खोजने के लिए कागजी शीर्षकों को पूरा करना पर्याप्त है। एक और अच्छा स्रोत है CiteSeer: citeseerx.ist.psu.edu/index कागजात की सूची के लिए धन्यवाद!
रीथंक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.