सबसे आम आधुनिक दिन छवि विभाजन तकनीक


11

मैं छवि विभाजन तकनीकों पर कुछ पढ़ रहा था और मैं आधुनिक दिन, अत्याधुनिक विभाजन एल्गोरिदम के बारे में सोच रहा था।

वर्तमान में ऐसी कौन-सी विभाजन तकनीकें हैं जो 'अवश्य पढ़ें' हैं, यानी वर्तमान में समुदाय में सबसे अधिक उपयोग की जाती हैं? आप किस तकनीक के संपर्क में आए और सबसे प्रभावी और उपयोगी पाया गया (और किस अनुप्रयोग के लिए)?


आपने अब तक कहां देखा है?
फोनन

1
मैं सामान्यीकृत कट्स, ग्राफ कट्स, मिन कट्स पर लेवल सेट विधियों और फास्ट मार्चिंग विधियों के अलावा कुछ पढ़ रहा हूं।
गेमिंगएक्स

3
नवंबर 2012 से अच्छा और छोटा: छवि विभाजन: एक समीक्षा
Emre

( थ्रेसहोल्डिंग पर इस सवाल से प्रेरित होकर संपादित करें , शायद यह सवाल विभाजन के तरीकों का एक समान संदर्भ हो सकता है)
पेनेलोप

जवाबों:


7

मुझे कई विभाजन तकनीकों के बारे में नहीं पता है, लेकिन मैं उन संरचनाओं से निपट रहा हूं जो विभाजन के टुकड़ों की "पसंद" की पेशकश करते हैं जिन्हें संतोषजनक विभाजन बनाने के लिए आगे की जांच की जा सकती है।

उम्मीद है कि कोई अन्य व्यक्ति कुछ अलग अत्याधुनिक पद्धति के बारे में लिख सकता है जिसके बारे में मुझे ज्यादा जानकारी नहीं है।

अलग छवि के लिए विभाजन का विकल्प, या स्तर, क्यों अच्छा है, इसका एक छोटा परिचय: विभाजन एक बीमार परिभाषित समस्या है। जमीनी सच्चाई मौजूद नहीं है: वांछित परिणाम हमेशा उपयोगकर्ता की आवश्यकताओं और विशिष्टताओं पर निर्भर हैं। एक अच्छी बोली:

यहां तक ​​कि एक निश्चित छवि के लिए, एक से अधिक "सर्वश्रेष्ठ" विभाजन हो सकते हैं क्योंकि एक विभाजन की गुणवत्ता को परिभाषित करने वाले मानदंड आवेदन पर निर्भर हैं। इसने हमें छवि-विभाजन तकनीकों पर अपने शोध पर ध्यान केंद्रित करने के लिए प्रेरित किया जो "पहेली टुकड़े" प्रदान करता है जिसका उपयोग किया जा सकता है (...) विशिष्ट उपयोगकर्ता आवश्यकताओं को संतुष्ट करने वाला एक विभाजन उत्पन्न करने के लिए (...)

( पी Soille: श्रेणीबद्ध छवि विभाजन और सरलीकरण के लिए कंस्ट्रेन्ड कनेक्टिविटी (2008) )

हैं श्रेणीबद्ध संरचनाओं , श्रेणीबद्ध छवि decompositions कि अलग जटिलताओं के साथ छवि विभाजन का प्रस्ताव। इन संरचनाओं को सबसे अधिक वृक्ष संरचनाओं के रूप में दर्शाया गया है, जहां प्रत्येक नोड छवि में एक क्षेत्र का प्रतिनिधित्व करता है। संरचनाओं के साथ विचार:

  • संरचना की पत्तियां एक ठीक विभाजन के क्षेत्र हैं, या एक छवि का अधिक विभाजन (जैसे पिक्सेल, फ्लैट ज़ोन - एक ही तीव्रता के जुड़े क्षेत्र, वाटरशेड )
  • पेड़ में लिंक (पड़ोसी) क्षेत्रों के विलय या संघ का प्रतिनिधित्व करते हैं और अधिक जटिल क्षेत्र बनाते हैं, और एक तरह से वस्तुओं के अनुरूप क्षेत्रों का निर्माण करने की संभावना रखते हैं (उम्मीद है :)
  • क्षेत्रों की जटिलता पेड़ की जड़ की ओर नोड्स से प्रत्येक शाखा के साथ बढ़ती है
  • पेड़ का हर स्तर (भी, हर कट) एक छवि का विभाजन / विभाजन है (इसे जड़ के करीब ले जाता है)
  • पेड़ की जड़ पूरे छवि डोमेन को कवर करती है

की तुलना में विभाजन होते हैं करने के लिए क्षेत्रों और उनकी प्रस्तावित यूनियनों, की जांच की निर्धारित पेड़ में क्षेत्रों या पेड़ की कटौती की आवश्यकता के लिए इसी ब्याज की वस्तु, या अन्य पूर्व निर्धारित उपयोगकर्ता विनिर्देशों के बारे में सटीक, या कुछ भी जाना जाता है गुण।

इस तरह के गुणों वाले पेड़ (अर्थात पदानुक्रमित छवि विघटन) हैं:

पहले से उपलब्ध कराए गए कागजात के लिंक के अलावा, इस तरह के विभाजन तकनीकों पर कुछ और विशिष्ट और कम विशिष्ट वर्तमान कागजात:

(और अधिक व्यावहारिक):


1
"आधुनिक" (और ट्रेंडी) विभाजन एल्गोरिथम परिवारों के लिए, मैं सुपरपिक्सल जोड़ूंगा। इस शब्द के लिए Googling वास्तव में प्रभावशाली है।
संस्सुवो

@sansuiso खैर, इसे एक उत्तर के रूप में जोड़ें :) उम्मीद है कि हम इस प्रश्न में कई दिलचस्प अत्याधुनिक दृष्टिकोण एकत्र कर सकते हैं
पेनेलोप

6

पेनेलोप के उत्तर के एक परिशिष्ट के रूप में , एल्गोरिदम के दो लोकप्रिय परिवार (और फैशनेबल)।

Superpixels

एल्गोरिदम का एक बहुत लोकप्रिय परिवार जिसे सुपरपिक्सल कहा जाता है, अभी बहुत फैशनेबल है (सीवी सम्मेलनों में कुछ सुपरपिक्सल सत्र भी हैं)। सुपरपिक्सल्स बहुत अधिक ओवर-सेगमेंटेशन की तरह हैं (जैसे वाटरशेड आपको क्या देता है), इसलिए कुछ पोस्ट-प्रोसेसिंग की आवश्यकता होती है।

सुपरपिक्सल को छोटे सजातीय चित्र क्षेत्रों के रूप में देखा जा सकता है । पिक्सल के बीच की दूरी का मूल्यांकन द्विपक्षीय फ़िल्टरिंग के रूप में किया जाता है, अर्थात, यह उनकी स्थानिक दूरी और उनकी दृश्य समानता के बीच एक मिश्रण है जो 0 के पास जाता है जब वे करीब और समान होते हैं और अन्यथा कुछ बड़े मूल्य पर।
फिर, सुपरपिक्सल तरीके इस माप के संबंध में छोटे सजातीय क्षेत्रों को बनाने के लिए विभिन्न मानदंडों का प्रयास करते हैं। उनमें से कई हैं (ग्राफ़-आधारित, मोड की मांग / आधारित क्लस्टरिंग ...), इसलिए मुझे लगता है कि इस तकनीकी रिपोर्ट में आपको संदर्भित करना सबसे अच्छा है ।

(संपादित करें :) मामले में किसी को एक प्रकाशित सहकर्मी-समीक्षित काम की तलाश है, यह लेख समान लेखकों द्वारा है और तकनीकी रिपोर्ट के समान सामग्री को कवर करता है: आर अचंता, ए। शाजी, के। स्मिथ, ए। लुच्ची, पी। फुआ, एस। सेस्ट्रुंक: एसएलआईसी सुपरपिक्सल्स, अत्याधुनिक सुपरपिक्सल तरीकों की तुलना में

ध्यान दें जैसा कि मैंने उत्तर का पहला संस्करण लिखा है कि नेत्रहीन परिणाम बहुत समान है जो वाटरशेड अति-विभाजन आपको प्रदान करता है। यह तकनीकी रिपोर्ट के लेखकों द्वारा पुष्टि की जाती है जो संबंधित कार्य भाग में वाटरशेड शामिल करते हैं। इस प्रकार, आपको एक ही पोस्ट-प्रोसेसिंग करने की भी आवश्यकता है: जबकि सुपरपिक्सल पिक्सेल के बजाय उपयोग करने के लिए आसान विशेषताएं हो सकते हैं, फिर भी आपको ऑब्जेक्ट्स को ट्रैक / पता लगाने की आवश्यकता होने पर उच्च-स्तरीय क्षेत्र बनाने के लिए समूहबद्ध करने की आवश्यकता होती है।

ग्राफ आधारित विभाजन विधियाँ

एल्गोरिदम का एक और लोकप्रिय परिवार पिक्सेल संबंध के विश्लेषण से आता है, अर्थात, पिक्सेल उनकी उपस्थिति में कैसे करीब हैं। यह सामान्यीकृत कटौती (जे शि, जे मलिक: सामान्यीकृत कटौती और छवि विभाजन ) जैसे विभाजन के तरीकों का एक ग्राफ-सिद्धांत आधारित परिवार देता है ।

यहाँ इस दृष्टिकोण के लिए अंतर्ज्ञान है: मान लीजिए कि आपके पिक्सेल अब एक उच्च-आयामी ग्राफ के अंक (कोने) हैं।
ग्राफ में, दो छोरों को एक किनारे से जोड़ा जा सकता है , जिसका वजन कोने के बीच की दूरी के विपरीत होता है। आमतौर पर, वजन समारोह उनके स्थानिक दूरी और द्विपक्षीय फिल्टरेशन में उनकी दृश्य समानता 8as के बीच मिश्रण का कुछ पारस्परिक होगा)।
फिर, इस ग्राफ को देखते हुए, विभाजन एल्गोरिदम वर्टिकल के सबसे अच्छे समूहों के लिए देख सकते हैं, अर्थात, उन समूहों के समूह जिनकी एक छोटी अंतर-समूह दूरी और एक बड़ी अतिरिक्त-समूह दूरी है।

सामान्यीकृत कट दृष्टिकोण में, समूहों की विभिन्न जनसंख्या आकारों द्वारा शुरू किए गए किसी भी पूर्वाग्रह से बचने के लिए कुछ अतिरिक्त देखभाल की जाती है। इसके अलावा, ग्राफ एक्सप्लोरेशन में कनेक्टिविटी मैट्रिक्स के रूप में भी जाना जाने वाला वेट मैट्रिक्स के एसवीडी की गणना करके ग्राफ एक्सप्लोरेशन से बचा जा सकता है।


अरे, यह मुझे थोड़ी देर लगी, उत्तर के लिए धन्यवाद, लेकिन ... क्या आप 2 तकनीकों पर कम से कम एक छोटे से विस्तार कर सकते हैं जो आपने उल्लेख किया है? मेरा मतलब यह नहीं है कि मैं उन्हें यहाँ विस्तार से समझाऊंगा, लेकिन मैं उनमें से प्रत्येक के बारे में एक या दो वर्णनात्मक वाक्यों की सराहना करूँगा।
पेनेलोप

मैंने उत्तर का विस्तार किया। यह थोड़ा भ्रामक है, हालांकि, सबसे अच्छा यह है कि मैं रिपोर्ट में लिंक करने वाली तकनीकी रिपोर्ट का संदर्भ दूं (मुझे यह स्वीकार करना होगा कि मैं एक सुपरपिक्सल लड़का नहीं हूं और मैं अभी भी उनकी रुचि के बारे में थोड़ा उलझन में हूं, हालांकि वे हैं वास्तव में फैशनेबल)।
संसेवो

ग्राफ़ आधारित विभाजन विधियों के लिए, मुझे लगता है कि यह काम कला परिणामों के सर्वोत्तम स्थिति में से एक का सुझाव देता है: research.microsoft.com/pubs/167600/jmiv_bnm_final.pdf यह एक सहज ज्ञान युक्त पेपर है और कोड उपलब्ध है।
तोलगा बर्डल

3

मुझे लगता है कि विभाजन के लिए कला एल्गोरिदम की स्थिति के वैश्विक अवलोकन के लिए नवीनतम सर्वेक्षणों की तलाश करनी चाहिए। चुनौतियों के साथ एक अच्छा वैश्विक अवलोकन सेज़िस्की बुक में प्रस्तुत किया गया है ।

यहाँ छवि विवरण दर्ज करें

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.