धूमिल छवि के गैर धुंधले हिस्से को अलग करें


10

मेरे पास एक मोबाइल फोन कैमरे द्वारा ली गई एक छवि है, जिसके एक हिस्से पर ध्यान केंद्रित करते हुए एक चेहरा या जो कुछ भी कहें। मैं जानना चाहता हूं-साधारण रूप से जहां केंद्रित क्षेत्र है। उदाहरण के लिए, केंद्रित क्षेत्र के चारों ओर एक बाउंडिंग बॉक्स। उदाहरण : मूल डिटेक्शन के बाद

जवाबों:


7

सामान्य तौर पर, यह एक छवि विभाजन समस्या है ( http://en.wikipedia.org/wiki/Image_seactation ) जिसमें आप छवि के गैर-केंद्रित क्षेत्रों में ध्यान केंद्रित को अलग करने की कोशिश कर रहे होंगे।

ऑप्टिकल लेंस वैसे भी कम पास फिल्टर के बराबर होते हैं और एक सिग्नल पर कम पास फिल्टर का प्रभाव उच्च आवृत्ति सामग्री को सीमित करके इसे सुचारू करना है।

डिजिटल इमेज प्रोसेसिंग में, कम आवृत्तियों बड़ी वस्तुओं (सामान्य रूप) के अनुरूप होती हैं और उच्च आवृत्तियों छोटी वस्तुओं (विवरण) के अनुरूप होती हैं।

इसलिए, ध्यान केंद्रित क्षेत्र को अलग करने के लिए, आप उन क्षेत्रों की तलाश कर सकते हैं जो धुंधले क्षेत्रों के सापेक्ष उच्च मानक विचलन पर हैं जो आउट-ऑफ-फोकस लेंस के सुचारू संचालन के कारण कम मानक विचलन पर होंगे।

'धुंधले' बनाम 'धुंधले' क्षेत्रों को अलग-अलग करने के लिए, आप आयामों के एक "विंडो" को सेट कर सकते हैं और इसे अपनी छवि पर स्लाइड कर सकते हैं।×एन

विंडो के प्रत्येक स्थान पर "पैच" मानों के विचरण की गणना करते हैं जैसे कि वे मानों के एक आयामी वेक्टर थे । यह आपकी छवि में प्रत्येक स्थान पर मानक विचलन की भिन्नता को दर्शाते हुए एक और "छवि" (या आमतौर पर एक दो-आयामी सरणी) का परिणाम देगा। फिर आप इन सभी मूल्यों को एकत्र कर सकते हैं और उनका हिस्टोग्राम प्राप्त कर सकते हैं। हिस्टोग्राम एक मल्टीमॉडल वितरण प्रदर्शित करेगा (अधिक जानकारी के लिए कृपया http://en.wikipedia.org/wiki/Multimodal_distribution देखें )।×एन

आपकी पोस्ट में छवि के मामले में, हिस्टोग्राम दो मोड प्रदर्शित करने की संभावना है। मानक विचलन (केंद्रित क्षेत्र) के अपेक्षाकृत उच्च मूल्यों के लिए एक और मानक विचलन (धुंधले क्षेत्रों) के अपेक्षाकृत कम मूल्यों के अनुरूप है।

इसके बाद आप एक थ्रेशोल्ड की स्थिति बना सकते हैं, उदाहरण के लिए अपने ध्यान केंद्रित किए गए और अनफोकस्ड क्षेत्रों के बीच एक मानदंड स्थापित करने के लिए बस दो मोड के बीच और फिर उन सभी "पैच" (या एमएक्सएन विंडो क्षेत्रों) का चयन करें, जिनका मानक विचलन आपकी सीमा से अधिक है। (अधिक जानकारी के लिए कृपया देखें: http://en.wikipedia.org/wiki/Thresholding_%28image_process%%29 )

यह आपके लिए छवि के केंद्रित भागों को अलग कर देगा।

उम्मीद है की यह मदद करेगा।


मैं आपके उत्तर के लिए एक गहरी पढ़ने जा रहा हूं और एक फीड बैक के साथ वापस आ रहा हूं, बहुत धन्यवाद
हमम हेलफावी

बहुत बहुत धन्यवाद, शानदार और विस्तृत उत्तर, मैं कार्यान्वयन साझा करने जा रहा हूं अगर मुझे opencv का उपयोग करके अच्छे परिणाम मिले, फिर से धन्यवाद
हमम हेलफावी

जिस तरह से बात करते हैं छवि का एक ग्रे प्रतिनिधि पर्याप्त है या मुझे प्रत्येक चैनल को ओ प्रक्रिया की आवश्यकता है?
हमाम हेलफावी

खुशी है कि आपने इसे मददगार पाया। ग्रेस्केल में काम करना धुंधला और केंद्रित क्षेत्रों के बीच भेदभाव के लिए ठीक काम करेगा, लेकिन अतिरिक्त रंग जानकारी सहित आप अधिक जटिल क्षेत्रों को संरक्षित करने में मदद कर सकते हैं (उदाहरण के लिए, एक चित्र में चेहरे के क्षेत्र को ट्रैक करें या चित्र में बस फूल को अलग करें आपकी डाक)।
a_A

इस सवाल पर चर्चा के बाद अपने मूल रूप में वापस संपादित किया गया: meta.dsp.stackexchange.com/questions/1337/… @ विशाल-शिक्षाविद कृपया अपनी टिप्पणियों को एक अलग प्रतिक्रिया के रूप में जोड़ें। मुख्य भाग को यहां संरक्षित किया गया है: pastebin.com/kjCC1wM6
A_A

5

यहां एक आसान तरीका है, जिसमें स्लाइडिंग-विंडो विश्लेषण शामिल नहीं है।

  • अपनी छवि को ग्रेस्केल में बदलें (यह आवश्यक नहीं है, लेकिन मैं मान लूंगा कि आपके पास स्पष्टता के लिए केवल एक चैनल है)

  • दोनों दिशाओं में ढाल की गणना करें

  • परिमाण की गणना करें (या बस वर्ग को ढाल)

  • दोनों दिशाओं में दोनों ढाल छवियों को जोड़ो

जैसा कि पहले ही कहा गया था, छवि के फोकस्ड हिस्से में गैर-फोकस्ड क्षेत्र की तुलना में उच्च आवृत्तियां होंगी। सारांश से आप दो अनुमानों के साथ समाप्त हो जाएंगे, जहां उस हिस्से में बहुत अधिक भिन्नता (उच्च मूल्य) हैं जहां फोकस्ड ऑब्जेक्ट को इस दिशा में रखा गया है। अब आप निम्न कार्य कर सकते हैं:

  • इन उच्च मूल्यों के प्रारंभ और अंत बिंदु को निर्धारित करें। आप एक साधारण सीमा का उपयोग कर सकते हैं (उदाहरण के लिए 0.7 * max_value) या प्रोफाइल को चिकना करें, दूसरा व्युत्पन्न लें और वहां के उच्चतम मूल्यों की जांच करें।

  • पिछले चरण से प्रारंभ / रोक स्थितियां आपको उन दोनों दिशाओं के साथ पिक्सेल स्थान प्रदान करती हैं, जहां आपके क्षेत्र-शार्पन-संकेतित आयत को रखना है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.