पिछले उत्तर वास्तव में बहुत अच्छे हैं, मैं कुछ और अतिरिक्त बातें बताना चाहूंगा:
वस्तु विभाजन
इसका एक कारण यह है कि यह शोध समुदाय के पक्ष में है क्योंकि यह समस्याग्रस्त रूप से अस्पष्ट है। ऑब्जेक्ट विभाजन का अर्थ केवल एक छवि में एक या छोटी संख्या की वस्तुओं को खोजने और उनके चारों ओर एक सीमा खींचना है, और अधिकांश उद्देश्यों के लिए आप अभी भी मान सकते हैं कि इसका मतलब है। हालाँकि, इसका उपयोग उन वस्तुओं के विभाजन के लिए किया जाने लगा, जिनका पृष्ठभूमि से वस्तुओं का विभाजन हो सकता है (आमतौर पर जिसे अब बैकग्राउंड सबट्रैक्शन या बैकग्राउंड सेग्मेंटेशन या फोरग्राउंड डिटेक्शन कहा जाता है), और यहां तक कि कुछ मामलों में इंटरचेंजबाइक का उपयोग ऑब्जेक्ट मान्यता के साथ बाउंडिंग बॉक्स का उपयोग करके किया जाता है (यह ऑब्जेक्ट मान्यता के लिए गहरी न्यूरल नेटवर्क दृष्टिकोण के आगमन के साथ बंद हो जाता है, लेकिन पहले से ऑब्जेक्ट मान्यता भी हो सकता है) मतलब बस इसमें ऑब्जेक्ट के साथ पूरी इमेज को लेबल करना)।
क्या "विभाजन" "शब्दार्थ" बनाता है?
सिम्पी, प्रत्येक खंड, या प्रत्येक पिक्सेल के गहरे तरीकों के मामले में, श्रेणी के आधार पर एक वर्ग लेबल दिया जाता है। सामान्य रूप से विभाजन केवल कुछ नियम द्वारा छवि का विभाजन है। Meanshift विभाजन, उदाहरण के लिए, एक बहुत ही उच्च स्तर विभाजन से डेटा छवि के ऊर्जा के क्षेत्र में परिवर्तन के अनुसार। ग्राफ में कटौतीआधारित विभाजन समान रूप से सीखा नहीं है, लेकिन सीधे बाकी से अलग प्रत्येक छवि के गुणों से लिया गया है। अधिक हाल ही में (न्यूरल नेटवर्क आधारित) विधियाँ उन पिक्सल का उपयोग करती हैं जो उन विशिष्ट विशेषताओं के साथ जुड़ी स्थानीय विशेषताओं की पहचान करने के लिए लेबल किए जाते हैं, और फिर प्रत्येक पिक्सेल को वर्गीकृत करते हैं जिसके आधार पर उस पिक्सेल के लिए सबसे अधिक आत्मविश्वास होता है। इस तरह, "पिक्सेल-लेबलिंग" वास्तव में कार्य के लिए अधिक ईमानदार नाम है, और "विभाजन" घटक उभर रहा है।
उदाहरण खंड
ऑब्जेक्ट सेगमेंटेशन का संभवतः सबसे कठिन, प्रासंगिक और मूल अर्थ है, "उदाहरण विभाजन" का अर्थ है किसी भी दृश्य के भीतर व्यक्तिगत वस्तुओं का विभाजन, भले ही वे एक ही प्रकार के हों। हालाँकि, इसका एक कारण इतना कठिन है क्योंकि एक दृष्टि के दृष्टिकोण से (और कुछ मायनों में एक दार्शनिक) एक "वस्तु" उदाहरण बनाता है जो पूरी तरह से स्पष्ट नहीं है। क्या शरीर के अंग वस्तु हैं? इस तरह के "भाग-वस्तुओं" को एक उदाहरण विभाजन एल्गोरिथ्म द्वारा बिल्कुल खंडित किया जाना चाहिए? अगर उन्हें पूरे से अलग देखा जाए तो क्या उन्हें केवल खंडित किया जाना चाहिए? यौगिक वस्तुओं के बारे में दो चीजों को स्पष्ट रूप से स्थगित किया जाना चाहिए, लेकिन अलग होना एक वस्तु या दो होना चाहिए (क्या एक छड़ी एक कुल्हाड़ी, एक हथौड़ा, या सिर्फ एक छड़ी और एक चट्टान के शीर्ष से चिपकी हुई है जब तक कि ठीक से नहीं बनाई गई हो?)। इसके अलावा, यह नहीं है ' उदाहरणों को भेद करने के लिए स्पष्ट नहीं है। क्या अन्य दीवारों से एक अलग उदाहरण है जो इसे संलग्न है? उदाहरणों को किस क्रम में गिना जाना चाहिए? जैसा कि वे दिखाई देते हैं? दृष्टिकोण के लिए निकटता? इन कठिनाइयों के बावजूद, वस्तुओं का विभाजन अभी भी एक बड़ी बात है क्योंकि मनुष्य के रूप में हम हर समय वस्तुओं के साथ बातचीत करते हैं चाहे उनकी "क्लास लेबल" की परवाह किए बिना (अपने आस-पास यादृच्छिक वस्तुओं का उपयोग करते हुए, पेपर वेट पर, उन चीजों पर बैठे हों जो कुर्सियाँ नहीं हैं)। और इसलिए कुछ डेटासेट इस समस्या को प्राप्त करने का प्रयास करते हैं, लेकिन मुख्य कारण इस समस्या पर बहुत ध्यान नहीं दिया गया है क्योंकि यह अच्छी तरह से परिभाषित नहीं है।
दृश्य पार्सिंग / दृश्य लेबलिंग
सीन पार्सिंग दृश्य लेबलिंग के लिए कड़ाई से विभाजन दृष्टिकोण है, जिसमें अपनी स्वयं की कुछ अस्पष्टता समस्याएं भी हैं। ऐतिहासिक रूप से, दृश्य लेबलिंग का अर्थ संपूर्ण "दृश्य" (छवि) को खंडों में विभाजित करना और उन्हें सभी वर्ग लेबल देना है। हालांकि, इसका मतलब यह भी था कि छवि के क्षेत्रों को स्पष्ट रूप से विभाजित किए बिना वर्ग लेबल देने का मतलब है। विभाजन के संबंध में, "सिमेंटिक विभाजन" पूरे दृश्य को विभाजित नहीं करता है । सिमेंटिक सेगमेंटेशन के लिए, एल्गोरिथ्म का उद्देश्य केवल उन वस्तुओं को सेगमेंट करना है, जिन्हें वह जानता है, और पिक्सल को लेबल करने के लिए इसके नुकसान फ़ंक्शन द्वारा दंडित किया जाएगा, जिसमें कोई लेबल नहीं है। उदाहरण के लिए MS-COCO डेटासेट सिमेंटिक सेगमेंट के लिए एक डेटासेट है जहां केवल कुछ वस्तुओं को खंडित किया जाता है।