अनुकूली थ्रेशोल्डिंग के लिए सबसे आम एल्गोरिदम क्या हैं?

38

कुछ सवालों में पहले अनुकूली थ्रेशिंग पर चर्चा की गई है:

Matlab का उपयोग करके जिगर विभाजन के लिए अनुकूली थ्रेसहोल्डिंग

इस उदाहरण में दस्तावेज़ छवि थ्रेसहोल्डिंग के लिए सबसे अच्छा एल्गोरिदम क्या हैं?

बेशक, एडाप्टिव थ्रॉल्डिंग के लिए कई एल्गोरिदम हैं। मैं जानना चाहता हूं कि आपने किन लोगों को सबसे प्रभावी और उपयोगी पाया है।

कौन सा अनुकूली एल्गोरिदम आपने सबसे अधिक उपयोग किया है और किस एप्लिकेशन के लिए; आप इस एल्गोरिथ्म को चुनने के लिए कैसे आए?

image-processing thresholding

— दीपन मेहता
स्रोत

24

मुझे नहीं लगता कि मेरा एक पूर्ण उत्तर होगा, लेकिन मैं वही प्रस्तुत करूंगा जो मुझे पता है और चूंकि यह एक समुदाय संपादित साइट है, मुझे आशा है कि कोई व्यक्ति जल्द ही एक प्रशंसात्मक उत्तर देगा :)

अनुकूली थ्रॉल्डिंग विधियां वे हैं जो पूरे छवि में एक ही दहलीज का उपयोग नहीं करते हैं ।

लेकिन, कुछ सरल उपयोगों के लिए, यह कभी-कभी सबसे सरल पुनरावृत्ति विधि की तुलना में होशियार विधि के साथ एक सीमा लेने के लिए पर्याप्त है । ओट्सू की विधि एक लोकप्रिय थ्रॉल्डिंग विधि है जो मानती है कि चित्र में दो वर्गों के पिक्सेल होते हैं - अग्रभूमि और पृष्ठभूमि , और इसमें एक द्वि-मोडल हिस्टोग्राम है । यह तब उनके संयुक्त प्रसार (इंट्रा-क्लास विचरण) को कम करने का प्रयास करता है।

सबसे सरल एल्गोरिदम जिसे वास्तव में अनुकूली थ्रेशोल्डिंग विधि माना जा सकता है, वे होंगे जो छवि को कोशिकाओं के ग्रिड में विभाजित करते हैं और फिर प्रत्येक सेल पर एक साधारण थ्रेशोल्डिंग विधि (जैसे पुनरावृत्ति या ओत्सु की विधि) को लागू करते हैं जो इसे एक अलग छवि (और अनुमान के रूप में मानते हैं) एक द्वि-मोडल हिस्टोग्राम)। यदि एक उप-छवि को थ्रेसहोल्ड नहीं किया जा सकता है तो पड़ोसी कोशिकाओं में से किसी एक का उपयोग किया जा सकता है।

स्थानीय सीमा को खोजने के लिए वैकल्पिक दृष्टिकोण सांख्यिकीय रूप से प्रत्येक पिक्सेल के स्थानीय पड़ोस के तीव्रता मूल्यों की जांच करना है । दहलीज प्रत्येक पिक्सेल के लिए अलग है और इसकी गणना स्थानीय पड़ोस (एक औसत, औसत और अन्य विकल्प संभव है) से की जाती है। फ़ंक्शन में OpenCV लाइब्रेरी में शामिल इस तरह के तरीकों का कार्यान्वयन है cv::adaptiveThresholding।

मुझे ब्रैडली लोकल थ्रेशहोल्डिंग नामक एक और समान विधि मिली । यह प्रत्येक पिक्सेल के पड़ोस की भी जांच करता है, जिससे ब्राइटनेस ब्लैक पर सेट होता है यदि पिक्सेल की चमक आसपास के पिक्सल्स की औसत चमक की तुलना में कम प्रतिशत है । संबंधित कागज यहां पाया जा सकता है ।

यह स्टैकवर्मफ़्लो उत्तर एक स्थानीय (अनुकूली) थ्रॉल्डिंग विधि का उल्लेख करता है जिसे निबलैक कहा जाता है लेकिन मैंने इसके बारे में पहले नहीं सुना है।

अंत में, एक तरीका है जो मैंने अपने पिछले छोटे प्रोजेक्ट्स में इस्तेमाल किया है, जिसे वैरिएंट मिनीमैक्स ऑप्टिमाइज़ेशन द्वारा इमेज थ्रेशहोल्डिंग कहा जाता है । यह एक पुनरावृत्त विधि है, जो एक ऊर्जा फ़ंक्शन के अनुकूलन पर आधारित है जो दो घटकों का एक गैर-संयोजन संयोजन है। एक घटक का उद्देश्य छवि में सबसे मजबूत तीव्रता परिवर्तन की स्थिति के आधार पर सीमा की गणना करना है। अन्य घटक का उद्देश्य (वस्तु) सीमावर्ती क्षेत्रों में सीमा को सुचारू करना है। यह एनालॉग इंस्ट्रूमेंट्स की छवियों (ग्लास / प्लास्टिक से विभिन्न छायांकन और प्रतिबिंब) पर काफी अच्छा साबित हुआ है, लेकिन पुनरावृत्तियों की संख्या के लिए सावधानीपूर्वक विकल्प की आवश्यकता होती है।

$f$ $\gamma(f)$

एक बड़े वर्ग एसई के साथ मूल छवि का उद्घाटन सभी प्रासंगिक छवि संरचनाओं को हटा देता है, लेकिन रोशनी फ़ंक्शन को संरक्षित करता है। मूल छवि से सफेद टॉप-हैट या मूल छवि से घटाव फ़ंक्शन का घटाव एक सजातीय रोशनी के साथ एक छवि को आउटपुट करता है।

— पेनेलोप
स्रोत

14

आप यहां कई थ्रॉल्डिंग विधियों की तुलना करने वाला एक पेपर पा सकते हैं:

एम। सेज़गिन, बी। शकूर - इमेज थ्रेशोल्डिंग तकनीक और मात्रात्मक प्रदर्शन मूल्यांकन पर सर्वेक्षण, इलेक्ट्रॉनिक इमेजिंग जर्नल, 2004 - पीडीएफ

यहाँ एक और कागज का बाइनराईज़ेशन विधियों का मूल्यांकन किया गया है:

पी। स्टैथिस, ई। कवेलियरतो और एन। पैपामार्कोस - एक मूल्यांकन तकनीक बिनाराइजेशन एल्गोरिदम के लिए, यूनिवर्सल कंप्यूटर साइंस जर्नल, 2008, - पीडीएफ

मेरे अंतिम प्रोजेक्ट में मैंने जो अनुकूली बाइनरीज़ेशन विधि का इस्तेमाल किया है, वह सौवला विधि द्वारा उपयोग किए जाने वाले थ्रेशोल्ड फंक्शन की तेज़ गणना के लिए अभिन्न चित्रों का उपयोग करता है। Sauvola विधि में वर्णित है:

जे। सौवोला और एम। पीटाइकेन, अनुकूली दस्तावेज़ छवि द्वैरीकरण, पैटर्न मान्यता 33, 2000. - पीडीएफ

संशोधन जो 20-गुना स्पीडअप (कागज के अनुसार) प्रदान करने वाली अभिन्न छवियों का उपयोग करता है, उसे इस पेपर में वर्णित किया गया है:

एफ। शफित, डी। कीरेज़, और टीएम ब्रूएल, अभिन्न छवियों, दस्तावेज़ मान्यता और पुनर्प्राप्ति XV, 2008 का उपयोग करते हुए स्थानीय अनुकूली थ्रॉल्डिंग तकनीकों का कुशल कार्यान्वयन - पीडीएफ

ये सिर्फ मेरे द्वारा उपयोग किए जाने वाले कागजात हैं, जब मैं अपने प्रोजेक्ट के लिए बिनाराइजेशन विधि चुनता हूं (छवियों में पाठ खोजने के लिए)। मैं एक विशेषज्ञ नहीं हूं इसलिए मैं यह नहीं कह सकता कि कौन सा तरीका किस एप्लिकेशन के लिए सबसे अच्छा है।

— ppalasek
स्रोत

6

इस प्रश्न का उत्तर अलग-अलग दृष्टिकोणों से बहुत अच्छी तरह से दिया गया है, और मैं सिर्फ अपने अनुभव को संक्षेप में प्रस्तुत करना चाहता हूं और अनुकूली वनीकरण से संबंधित कुछ समस्याओं पर भी जोर देना चाहता हूं।

अनुकूली बिनराइजेशन को तीन श्रेणियों में विभाजित किया जा सकता है:

1) वैश्विक विधि: इस विधि के साथ सबसे पहले छवि की पृष्ठभूमि का अनुमान लगाया गया है; उसके बाद पृष्ठभूमि की जानकारी की मदद से एक सामान्यीकृत छवि तैयार की जाती है। तब वैश्विक बिनाराइजेशन विधि कार्यरत है।

2) पैच-आधारित विधि: जैसा कि नाम से संकेत मिलता है, पैच-आधारित पद्धति पैच द्वारा द्विप्रमाणीकरण पैच का प्रदर्शन करेगी। प्रत्येक पैच पर, एक binarization एक वैश्विक binarization विधि के साथ अनुमानित है। उसके बाद, कुछ पोस्ट-प्रोसेसिंग को मुकदमा बनाने के लिए किया जाता है कि पड़ोसी पैच में बिनाराइजेशन थ्रेशोल्ड में चिकनी संक्रमण होता है।

3) मूविंग-विंडो विधि: इस विधि के साथ, बायनेरिज़ेशन पिक्सेल द्वारा पिक्सेल किया जाता है। विंडो के भीतर पिक्सेल आँकड़ों की गणना के लिए एक चलती हुई खिड़की स्थापित की जाती है, और आँकड़ों के आधार पर खिड़की के भीतर केंद्रीय पिक्सेल के लिए सीमा की गणना की जाती है।

यह बताना बहुत कठिन है कि कौन सा तरीका सबसे अच्छा है क्योंकि यह एप्लिकेशन पर निर्भर करता है। जब आप एक अनुकूली विचलन के बारे में सोचते हैं, तो निम्नलिखित प्रश्नों पर विचार करना न भूलें:

1) पैरामीटर सेटिंग: क्या विधि में स्वचालित पैरामीटर सेटिंग प्रक्रिया है? हम मापदंडों को बहुत अच्छी तरह से कैसे सेट कर सकते हैं ताकि यह ज्यादातर मामलों पर काम कर सके?

2) एक अच्छा अनुकूली बैनरीकरण को सही ठहराने की कसौटी क्या है? कई मामलों में, अलग-अलग द्विभाजन विधियों के बीच अंतर वास्तव में छोटा है। हालाँकि, छोटे अंतर से अंत में बड़ा अंतर आ सकता है।

3) क्या कुछ विशेष स्थितियों पर बिनाराइजेशन काम कर सकता है? उदाहरण के लिए, मान लीजिए कि अनुकूली बिनराइजेशन का लक्ष्य काली पृष्ठभूमि से वस्तुओं को निकालना है, तो क्या बिनराईकरण स्वचालित रूप से इस स्थिति के अनुकूल हो सकता है? या वाइस वीज़ा।

4) अनुकूली विधियों में केवल स्थानीय विन्यास पर ध्यान केंद्रित करने की प्रवृत्ति होती है, इसलिए बाइनरी परिणाम अनुकूलित नहीं होता है। उदाहरण के लिए, प्रसिद्ध Sauvola विधि खोखली वस्तु उत्पन्न करेगा यदि ऑब्जेक्ट को अनुकूलित किया जाना चलती खिड़की की तुलना में कहीं अधिक बड़ा है। क्या आपकी अनुकूली विधि इस सीमा को पूरा कर सकती है?

5) प्रीप्रोसेसिंग। एक अच्छे बाइनराइजेशन में इमेज प्रोसेसिंग इंसाइडर भी शामिल होना चाहिए। यदि छवि बहुत धुंधली हो रही है, तो यह स्वचालित रूप से एल्गोरिथ्म के मापदंडों को समायोजित कर सकता है या खराब द्विप्रकरण से बचने के लिए कुछ पूर्वप्रक्रिया को लागू कर सकता है।

— स्वतंत्र महसूस करना
स्रोत