रोबोट नेविगेशन के लिए लोग लेजर सेंसर के बजाय कैमरे का उपयोग क्यों करते हैं?


11

मैं शहरी वातावरण में रोबोट स्थानीयकरण और नेविगेशन पर काम कर रहा हूं। मैं कैमरा इस्तेमाल करना चाहता हूं। लेकिन मैं LRF डेटा या अन्य लेजर डेटा के बारे में थोड़ा भ्रमित हूं।

लोग कैमरे का उपयोग क्यों करना चाहते हैं?

LRF या अन्य लेजर डेटा क्यों नहीं?

क्या कोई समझा सकता है कृपया कैमरे के पक्ष में?

जवाबों:


15

एक 3D लेजर रेंज फाइंडर या LIDAR जैसे कि Google कार पर एक कैमरा की तुलना में कहीं अधिक महंगा है। दूसरा कारण यह है कि एक LIDAR के मामले में हर पिक्सेल की दूरी उपलब्ध होने पर, संसाधित होने वाला उत्पन्न डेटा बहुत बड़ा है। आपको तेजी से डेटा ट्रांसफर और प्रोसेस करना होगा जो बढ़ती लागत के रूप में फिर से सामने आता है। अंत में कैमरों में आमतौर पर लंबा जीवनकाल होता है, इसलिए कम रखरखाव की आवश्यकता होती है।

अपेक्षाकृत सस्ते कैमरों और कंप्यूटर दृष्टि के साथ, बहुत अच्छे परिणाम प्राप्त किए जा सकते हैं।

उदाहरण:

  1. ऑब्जेक्ट डिटेक्शन (ध्यान दें कि किसी व्यक्ति द्वारा खींचा गया सूटकेस लाल रंग में हाइलाइट नहीं किया गया है)।
  2. नज़र रखना

3
लागत बिल्कुल जवाब है। गुणवत्ता लेजर स्कैनर (अंत उपयोगकर्ता के लिए) आम तौर पर $ 10,000 के आसपास शुरू होते हैं। गुणवत्ता वाले कैमरे लागत का दसवां हिस्सा हैं।
चक

1
आप किस प्रकार के LIDAR के बारे में सोच रहे हैं? मैंने एक का उपयोग किया है जो प्रति स्कैन (2 डी विमान पर) लगभग 1000 अंक लौटाता है, लेकिन एक सामान्य आधुनिक कैमरा लाखों पिक्सेल लौटाता है, जो बहुत अधिक डेटा है।
user253751

2
@ मिनीबिस - वेलोडाइन वीएलपी -16 प्रति 16 विमानों में लगभग 300k अंक प्रति सेकंड करता है, और SICK LMS511 1 विमान भर में लगभग 50k अंक प्रति सेकंड करता है। वीएलपी -16 में 360 डिग्री क्षेत्र है और यह लगभग 8k है, LMS511 में 190 डिग्री का दृश्य क्षेत्र है और यह लगभग 10k है, लेकिन औद्योगिक उपयोग के लिए बीहड़ है। ये दूरी मापक हैं , चित्र नहीं। कैमरे निश्चित रूप से एक उच्च रिज़ॉल्यूशन वापस कर सकते हैं, लेकिन आम तौर पर स्टीरियो इत्यादि करने के लिए इतनी उच्च मारक क्षमता होती है कि फ्रेम बहुत कम रिज़ॉल्यूशन B & W या नीचे ताज़ा दर बहुत कम हो जाती है।
चक

1
तो प्रति सेकंड 300k अंक, बनाम 50 मिलियन-ईश पिक्सेल प्रति सेकंड। कैमरे में अभी भी स्थानांतरण के लिए अधिक डेटा है। निश्चित रूप से या तो मामले में आप डेटा को छोड़ सकते हैं / नीचे कर सकते हैं यदि आप इसे पर्याप्त तेजी से संसाधित नहीं कर सकते हैं।
1:25 बजे user253751

4

बेंस के जवाब में उन बिंदुओं के अलावा, कैमरे कर सकते हैं:

  • कई जटिल विशेषताओं की गणना करें, जिसके परिणामस्वरूप फ़्रेम, और ऑब्जेक्ट मान्यता के बीच बहुत मजबूत मिलान होता है
  • उच्च कोणीय संकल्प (विशिष्ट निम्न-> उच्च श्रेणी -> 0.025 ular से जाता है )0.50.025
  • कम बिजली का उपयोग
  • निष्क्रिय सेंसर (एक लेजर के 'स्वच्छ' संकेत की आवश्यकता नहीं है)

3

शहरी वातावरण में नेविगेशन

लेजर के आधार पर, वहाँ कानूनी अड़चन हो सकती है जहाँ आप इसका उपयोग कर सकते हैं। लेजर किरणों को फेंकने वाले शहर के चारों ओर चलने के लिए विशेष अनुमति / लाइसेंस की आवश्यकता हो सकती है।


5
बेशक, लेजर पर निर्भर करता है । लेकिन हम यहां स्टारशिप हथियारों के बारे में बात नहीं कर रहे हैं। उदाहरण के लिए, आपको बारकोड स्कैनर का उपयोग करने के लिए अनुमति या लाइसेंस की आवश्यकता नहीं है।
डेविड रिचरबी

अधिकांश वाणिज्यिक LRF (वेलोडाइन, होकुयो) कक्षा 1 लेज़रों का उपयोग करते हैं, और वे पूरी तरह से सुरक्षित हैं। Google, उबेर आदि पहले से ही इस तरह के LRF के साथ अपने प्रोटोटाइप का परीक्षण कर रहे हैं। मुझे नहीं लगता कि उनके कानूनी विभाग को नाराज माता-पिता की शिकायतों से
तंग आ गया है

2

अन्य की तरह पहले से ही जवाब दिया। कैमरा आम तौर पर बहुत से सस्ता है एल aser आर Ange एफ inders।

जब आप कैमरे के बारे में बात करते हैं तो इसका मतलब है कि 2 डी कैमरा नहीं है? कुछ 3D कैमरे हैं जैसे कि कैमरों के ifm O3D3xx परिवार उपलब्ध हैं। उन कैमरा में लेजर स्कैनर की सटीकता नहीं हो सकती है, लेकिन वे ~ 1k के मूल्य बिंदु पर उचित फ्रेम दर में 3 डी गहराई डेटा प्रदान करते हैं


1

वहाँ एक मानक RGB कैमरा बनाम SLAM के लिए एक LIDAR का उपयोग करने के लिए कोई लाभ हैं?

आप इस लिंक की जाँच कर सकते हैं जहाँ मैंने पहले भी कुछ इसी तरह के प्रश्न का उत्तर दिया है। (प्रत्येक के फायदे और नुकसान)

शहरी वातावरण में

यदि आप Google जैसी स्वायत्त कारों का उल्लेख कर रहे हैं, तो बहुत सारे विचार और बाधाएं हैं (सुरक्षा, लागत आदि)।

यदि आप अनुसंधान और सीखने में रुचि रखते हैं, तो मेरा सुझाव है कि आप उपलब्ध किसी भी हार्डवेयर प्लेटफॉर्म का उपयोग करें।

याद रखो:

  1. एक LIDAR वाली कार जो बेहद महंगी है, आसानी से नहीं बिकेगी।
  2. एक कार जो लोगों के चारों ओर अनायास चलती है, गलती की स्थिति में मार सकती है। इस प्रकार अनुसंधान और सीखने के लिए विचार सिर्फ एल्गोरिदम विकसित करने से अलग हैं।

0

मुझे नहीं लगता कि लोग वास्तव में "चाहते हैं" केवल कैमरों का उपयोग करें। यदि हर शोधकर्ता LiDARs को वहन कर सकता है तो वे बाहरी वातावरण के लिए उन सभी रोबोटों पर LiDARs लगा सकते हैं।

कैमरे काफी सस्ते होते हैं और रेंज की एकमात्र सीमा पिक्सेल / सुपरपिक्सल रिज़ॉल्यूशन है जिसे आप अपने एल्गोरिथ्म / सॉफ्टवेयर में प्रोसेस कर सकते हैं।

अधिकांश शोधकर्ता (मेरे सहित) संरचित प्रकाश कैमरों का उपयोग करते हैं (हालांकि वे बाहर काम नहीं करते हैं, इसलिए हम रोबोट के बाहर होने पर इन सेंसर पर आरजीबी कैमरों पर स्विच करते हैं)। इस प्रकाश समस्या का एक समाधान यह है कि हम नियंत्रक / सीपीयू की प्रसंस्करण क्षमताओं के आधार पर गहराई से निर्धारण के लिए स्टीरियो कैमरा (स्टीरियो विज़न / मल्टी-व्यू डेप्थ जो कि कम्प्यूटेशनल रूप से महंगा है) का भी उपयोग करते हैं। एक अन्य समाधान जो मैंने अभी तक व्यक्तिगत रूप से पता लगाने के लिए है, वह है कई किन्कस / एसस्यू एक्सशन इत्यादि का उपयोग करना, जहाँ आपको गहराई के साथ-साथ सड़क के बाहर कई आरजीबी कैमरे मिलते हैं।

आमतौर पर LiDARs बहुत महंगे होते हैं (वास्तव में अच्छे लोगों के लिए हजारों डॉलर में)। हालांकि यह भविष्य में स्वीप जैसी $ 250 "LiDARs" के साथ आने वाली कुछ कंपनियों के साथ बदल सकता है ।

इसके अलावा, LRF / LiDARs की सीमित सीमा और रिज़ॉल्यूशन है (यानी, एक निश्चित दूरी से परे, वे गहराई से गहराई से हल नहीं कर सकते हैं और इसलिए वे 0 मान लौटाते हैं (मुझे निश्चित रूप से LiDARs के बारे में निश्चित नहीं है, लेकिन गहराई वाले कैमरों में अधिकतम (ऊपर) है) साथ ही न्यूनतम सीमा (जिसके नीचे) वे आपको गहराई नहीं देते हैं।

उम्मीद है की यह मदद करेगा।


0

मैं एक और कारण जोड़ने जा रहा हूं कि स्पष्ट रूप से मैं उम्मीद कर रहा था कि कोई और लाएगा। क्योंकि हम पहले स्थान पर रोबोट क्यों बनाते हैं? हमारे गंदे काम करने के लिए भावनाहीन मशीनें?

मुझे लगता है कि तथ्य यह है कि एक रोबोट विशुद्ध रूप से "दृष्टि" पर भरोसा कर सकता है जैसे हम स्तनधारी करते हैं, उन्हें हमारे जैसे और अधिक बनाता है। इसलिए मेरे लिए, लेज़र और सोनार धोखा दे रहे हैं। IMHO को धोखा देने के लिए किस पर ध्यान देना चाहिए, उच्च फ्रेम-दर, उच्च गतिशील रेंज और कम कलाकृतियों के साथ बेहतर कैमरे बना रहा है, और सॉफ्टवेयर लिखता है जो उनसे आवश्यक डेटा प्राप्त कर सकता है। (या, 2012 के बाद की शर्तों में बोलते हुए, हमारे नेटवर्क को यह जानने के लिए प्रशिक्षित करें कि उन्हें उनसे क्या डेटा चाहिए)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.