मैंने ऑब्जेक्ट डिटेक्शन, ऑब्जेक्ट रिकॉग्निशन, ऑब्जेक्ट सेगमेंटेशन, इमेज सेगमेंटेशन और सिमेंटिक इमेज सेगमेंटेशन के बारे में बहुत सारे पेपर पढ़े और यहाँ मेरे निष्कर्ष जो सच नहीं हो सकते हैं:
ऑब्जेक्ट रिकग्निशन: किसी दिए गए चित्र में आपको सभी ऑब्जेक्ट्स (ऑब्जेक्ट्स का एक प्रतिबंधित वर्ग आपके डेटासेट पर निर्भर करता है) का पता लगाना होगा, उन्हें एक बाउंडिंग बॉक्स और लेबल के साथ बाउंडिंग बॉक्स लेबल के साथ स्थानीयकृत करें। नीचे की छवि में आप कला वस्तु मान्यता की स्थिति का एक सरल आउटपुट देखेंगे।
ऑब्जेक्ट डिटेक्शन: यह ऑब्जेक्ट मान्यता की तरह है लेकिन इस कार्य में आपके पास ऑब्जेक्ट वर्गीकरण का केवल दो वर्ग है जिसका अर्थ है ऑब्जेक्ट बाउंडिंग बॉक्स और नॉन-ऑब्जेक्ट बाउंडिंग बॉक्स। उदाहरण के लिए कार का पता लगाना: आपको सभी कारों का उनके बाउंडिंग बॉक्स के साथ पता लगाना होगा।
ऑब्जेक्ट सेगमेंटेशन: ऑब्जेक्ट रिकग्निशन की तरह आप एक इमेज में सभी ऑब्जेक्ट्स को पहचान लेंगे लेकिन आपके आउटपुट को इमेज के क्लासिफाइडिंग पिक्स को इस ऑब्जेक्ट को दिखाना चाहिए।
छवि विभाजन: छवि विभाजन में आप छवि के क्षेत्रों को विभाजित करेंगे। आपका आउटपुट किसी छवि के सेगमेंट और क्षेत्र को लेबल नहीं करेगा जो एक-दूसरे के साथ एक ही सेगमेंट में होना चाहिए। किसी छवि से सुपर पिक्सेल निकालना इस कार्य या अग्रभूमि-पृष्ठभूमि विभाजन का एक उदाहरण है।
सिमेंटिक सेगमेंटेशन: सिमेंटिक सेग्मेंटेशन में आपको प्रत्येक पिक्सेल को ऑब्जेक्ट्स (कार, पर्सन, डॉग, ...) और नॉन-ऑब्जेक्ट्स (वाटर, स्काई, रोड, ...) के एक वर्ग के साथ लेबल करना होता है। मैं सिमेंटिक सेग्मेंटेशन के अन्य शब्दों को इमेज के प्रत्येक क्षेत्र में लेबल करूँगा।