कंप्यूटर विजन और इमेज प्रोसेसिंग के बीच ए (क्लियर) लाइन


14

मैं कुछ वर्षों से कंप्यूटर विज़न और इमेज प्रोसेसिंग दोनों के बारे में काम कर रहा हूं और सीख रहा हूं, और मेरा मानना ​​है कि मैं अभी पूरी तरह से शुरुआती नहीं हूं।

फिर भी, इन सभी वर्षों के बाद, मेरे लिए अपने काम के किसी विशेष हिस्से के लिए यह बताना मुश्किल है कि क्या यह ज्यादातर कंप्यूटर दृष्टि से संबंधित है, या यदि यह छवि प्रसंस्करण है । मैं सिर्फ लाइन नहीं देख सकता - जब मैं काम करता हूं, अध्ययन और अनुसंधान करता हूं, तो मैं दोनों कीवर्ड के साथ संदर्भ सामग्री पढ़ता हूं।

इसलिए, मैं कंप्यूटर दृष्टि और छवि प्रसंस्करण क्षेत्रों की परिभाषा में दिलचस्पी रखता हूं , जिसमें खेतों की तुलना (अंतर और साथ ही ओवरलैप) पर ध्यान केंद्रित किया गया है

इसके अतिरिक्त, मुझे लगता है कि (वैचारिक या मौजूदा) व्यावहारिक अनुप्रयोगों, परियोजनाओं और कार्यों के साथ इसका उपयोग करना / उपयोग करना:

  • पूरी तरह से (या अधिकतर) कंप्यूटर दृष्टि उपकरण और विचार
  • पूरी तरह से (या अधिकतर) छवि प्रसंस्करण उपकरण और विचार
  • दोनों क्षेत्रों से उपकरणों और विचारों का एक संयोजन

इस पर विशेष ध्यान देने के साथ कि यह एक को बनाता है और दूसरे को नहीं , या यह दोनों बनाता है ।

मैं समझता हूं कि ये क्षेत्र अत्यधिक संबंधित हैं और "लाइन" उतनी स्पष्ट नहीं हो सकती है जितना कि यह प्रश्न पूछ रहा है, लेकिन मुझे आशा है कि आप यह समझेंगे कि इस प्रश्न का बिंदु वर्गीकरण (मेरे) के लिए एक साधारण निर्णय नियम तैयार करना नहीं था। काम, बल्कि इन क्षेत्रों के फोकस और लक्ष्यों की बेहतर समझ है। इसके अलावा, कोई भी अतिरिक्त जानकारी जो मेरे प्रश्न टोन के साथ ऑन-टॉपिक लगती है, स्वागत योग्य है, भले ही मैंने विशेष रूप से इसके लिए नहीं पूछा हो।


"मशीन विजन" के बारे में क्या? क्या आप इसे "कंप्यूटर विजन" का पर्याय मानते हैं?
एलेसांद्रो जैकॉपसन

@uvts_cvs ईमानदार होने के लिए, मैंने कभी "मशीन विजन" की शिक्षा नहीं दी ... हो सकता है कि "मशीन (एम्बेडेड सिस्टम के साथ) का कोई अर्थ हो सकता है जो कुछ कंप्यूटर विज़न कार्य को आगे बढ़ाने के लिए विशिष्ट है", जैसे मैंने एक बार लाइसेंस को पहचानने में सक्षम कैमरों के बारे में पढ़ा। प्लेटें। लेकिन फिर, मैं इस एक के बारे में गलत हो सकता हूं :)
पेनेलोप

जवाबों:


12

मेरा मानना ​​है कि गोंजालेज और वुड्स अपनी राय पर भरोसा करने में सक्षम हैं:

जहां छवि प्रसंस्करण स्टॉप और अन्य संबंधित क्षेत्र, जैसे छवि विश्लेषण और कंप्यूटर दृष्टि, प्रारंभ के बारे में लेखकों के बीच कोई सामान्य समझौता नहीं है। कभी-कभी इमेज प्रोसेसिंग को एक अनुशासन के रूप में परिभाषित करके एक अंतर बना दिया जाता है, जिसमें एक प्रक्रिया के इनपुट और आउटपुट दोनों ही इमेज होते हैं । हम इसे एक सीमित और कुछ हद तक कृत्रिम सीमा मानते हैं । उदाहरण के लिए, इस परिभाषा के तहत, यहां तक ​​कि एक छवि की औसत तीव्रता (जो कि एक एकल संख्या प्राप्त करता है) की गणना का तुच्छ कार्य एक छवि प्रसंस्करण ऑपरेशन नहीं माना जाएगा। दूसरी ओर, कंप्यूटर दृष्टि जैसे क्षेत्र हैं जिनका अंतिम लक्ष्य कंप्यूटर का उपयोग मानव दृष्टि का अनुकरण करना है, जिसमें सीखने और शामिल होने और दृश्य आदानों के आधार पर कार्रवाई करने में सक्षम है। यह क्षेत्र स्वयं कृत्रिम बुद्धिमत्ता (एआई) की एक शाखा है जिसका उद्देश्य मानव बुद्धि का अनुकरण करना है। एआई का क्षेत्र विकास के मामले में प्रारंभिक अवस्था में है, मूल रूप से प्रत्याशित की तुलना में प्रगति धीमी है। के क्षेत्र छवि विश्लेषण (जिसे छवि समझ कहा जाता है) में है छवि प्रसंस्करण और कंप्यूटर दृष्टि के बीच

इसलिए मैं कहूंगा कि प्राथमिक अंतर लक्ष्यों में है, विधियों में नहीं। उदाहरण के लिए, यदि लक्ष्य बाद में मनुष्यों द्वारा उपयोग के लिए छवि को बढ़ाना है, तो इसे छवि प्रसंस्करण कहा जा सकता है। और यदि लक्ष्य मानव दृष्टि का अनुकरण करना है ( जैसा कि यह ऑब्जेक्ट मान्यता, दोष का पता लगाने या स्वचालित ड्राइविंग है), तो यह कंप्यूटर दृष्टि के करीब है। हालाँकि, ध्यान दें कि परिभाषा द्वारा मानवीय दृष्टि का अनुकरण करने के लिए भी छवि वृद्धि की आवश्यकता हो सकती है, इसलिए अधिकांश वास्तविक मामलों में कंप्यूटर दृष्टि छवि प्रसंस्करण पर निर्भर करती है

छवि समझ (सुविधा निष्कर्षण) दोनों में समान रूप से उपयोग की जा सकती है - शुद्ध छवि प्रसंस्करण और कंप्यूटर दृष्टि।


शुभ अंक (ओं) ..
स्पेसी

बहुत अच्छा जवाब। अनुभव से संदर्भ सामग्री और व्याख्या का सिर्फ सही अनुपात। धन्यवाद
पेनेलोप

10

जिस तरह से मैं इसे समझता हूं, छवि प्रसंस्करण का उद्देश्य एक (किसी तरह से परिवर्तित) छवि प्राप्त करना है। कंप्यूटर विज़न का उद्देश्य छवि में मौजूद चीज़ों के बारे में कुछ पता लगाना है (जैसे तस्वीर पर लड़का खुश या उदास है, छवि में कितनी कारें हैं और वे किस तरह से गाड़ी चला रहे हैं)।

पूरी तरह से (या अधिकतर) कंप्यूटर दृष्टि उपकरण और विचार

मुझे नहीं लगता कि यह संभव है, न कि जिस तरह से मैं शर्तों को समझता हूं।

पूरी तरह से (या अधिकतर) छवि प्रसंस्करण उपकरण और विचार

उदाहरण के लिए, Adobe Photoshop: यह एक छवि ले सकता है और इसे बेहतर त्वचा के साथ एक स्लिमर व्यक्ति की छवि में बदल सकता है। लेकिन यह छवि में चित्रित वस्तुओं के बारे में कुछ भी "नहीं जानता" है।


मैं आपको एक उदाहरण देता हूं: मैं वर्तमान में सामग्री आधारित छवि पुनर्प्राप्ति पर काम कर रहा हूं। ज्यादातर लोग इस बात पर जोर दे रहे हैं कि इमेज प्रोसेसिंग हो। मुझे यकीन नहीं है कि यह आपके उत्तर पर फिट बैठता है (यह कहकर कि यह एक बुरा उत्तर है, बस सोच रहा है)
पेनेलोप

एक संकेतक है: क्या आपके कार्य का परिणाम एक छवि (IP) या कुछ अन्य डेटा संरचना (CV) है। CBIR में, परिणाम कुछ अन्य डेटा संरचना (उदाहरण के लिए छवियों के बीच एक समानता माप) है, इसलिए मैं कहूंगा कि यह कंप्यूटर विज़न है। विकिपीडिया का कहना है कि यह कंप्यूटर की दृष्टि भी है।
निकी एस्टनर

वहां, मैंने अब खुद कुछ googling किया है, और मुझे यह अवलोकन लेख मिला है , और मैं बोली: "इन सिस्टमों में, छवि प्रसंस्करण एल्गोरिदम (आमतौर पर स्वचालित) का उपयोग फीचर वैक्टर को निकालने के लिए किया जाता है जो रंग जैसे छवि गुणों का प्रतिनिधित्व करते हैं, बनावट, आकार और आकार। " लेख मुझे बहुत ठोस लगता है ...
पेनलोप

2
हां, हर कंप्यूटर विज़न सिस्टम इमेज प्रोसेसिंग एल्गोरिदम का उपयोग करता है।
निकी एस्टनर

मैं आपके उत्तर और / या स्पष्टीकरण में किसी विशेष बिंदु से असहमत नहीं हूं ... यह सिर्फ ऐसा नहीं है ... जैसा कि मुझे लगता है कि मैं उतना ही उपयुक्त हूं। लेकिन, यह चर्चा में बदल रहा है, और यह प्रति-उत्पादक है। इसलिए, मैं बस उम्मीद कर रहा हूं कि इस प्रश्न के अन्य योगदान होंगे जो उम्मीद है कि एक अलग / स्पष्ट दृष्टिकोण देगा;)
पेनेलोप
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.