यदि किसी छवि में स्थानिक रूप से जुड़े हुए अलग-अलग क्षेत्र हैं, तो इसके लिए सांख्यिकीय माप


14

इन दो स्केल छवियों पर विचार करें:

नदी बिना सोचे समझे

पहली छवि एक बहती नदी पैटर्न दिखाती है। दूसरी छवि यादृच्छिक शोर दिखाती है।

मैं एक सांख्यिकीय उपाय की तलाश में हूं जिसे मैं यह निर्धारित करने के लिए उपयोग कर सकता हूं कि क्या यह संभावना है कि एक छवि एक नदी पैटर्न दिखाती है।

नदी की छवि के दो क्षेत्र हैं: नदी = उच्च मूल्य और हर जगह = कम मूल्य।

परिणाम यह है कि हिस्टोग्राम बिमोडल है:

यहाँ छवि विवरण दर्ज करें

इसलिए नदी पैटर्न वाली छवि में उच्च विचरण होना चाहिए।

हालाँकि, ऊपर यादृच्छिक छवि है:

River_var = 0.0269, Random_var = 0.0310

दूसरी ओर यादृच्छिक छवि में स्थानिक निरंतरता होती है, जबकि नदी की छवि में उच्च स्थानिक निरंतरता होती है, जो स्पष्ट रूप से प्रायोगिक वैरोग्राम में दिखाई जाती है: यहाँ छवि विवरण दर्ज करें

उसी तरह से जब विचरण एक संख्या में हिस्टोग्राम को "सारांशित" करता है, मैं स्थानिक अंतर्विरोध के एक उपाय की तलाश कर रहा हूं जो प्रयोगात्मक चर को "सारांशित" करता है।

मैं चाहता हूं कि यह उपाय बड़े लैग की तुलना में छोटे लैग में उच्च अर्धवृत्तांत को "दंडित" करने के लिए हो, इसलिए मैं इसके लिए आया हूं:

 svar=h=1nγ(h)/h2

अगर मैं केवल lag = 1 से 15 तक जोड़ूँ तो मुझे मिलता है:

River_svar = 0.0228, Random_svar = 0.0488

मुझे लगता है कि एक नदी की छवि में उच्च विचरण होना चाहिए, लेकिन कम स्थानिक विचरण है इसलिए मैं एक विचरण अनुपात प्रस्तुत करता हूं:

 ratio=var/svar

परिणाम है:

River_ratio = 1.1816, Random_ratio = 0.6337

मेरा विचार इस अनुपात को निर्णय मानदंड के रूप में उपयोग करने के लिए है कि क्या कोई छवि नदी की छवि है या नहीं; उच्च अनुपात (जैसे> 1) = नदी।

किसी भी विचार पर कि मैं चीजों को कैसे सुधार सकता हूं?

किसी भी जवाब के लिए अग्रिम धन्यवाद!

EDIT: यहां व्हीबर और Gschneider की सलाह के बाद फेलिक्स हेबेलर मैटलैब फ़ंक्शन का उपयोग करके 15x15 व्युत्क्रम दूरी के मैट्रिक्स के साथ गणना की गई दो छवियों के मोरन I हैं :

River_M Random_M

मुझे प्रत्येक छवि के लिए परिणामों को एक संख्या में संक्षेप में प्रस्तुत करने की आवश्यकता है। विकिपीडिया के अनुसार: "मान w1 (पूर्ण फैलाव का संकेत) से लेकर +1 (पूर्ण सहसंबंध) तक है। एक शून्य मान एक यादृच्छिक स्थानिक पैटर्न को दर्शाता है।" अगर मुझे उन सभी पिक्सल्स के लिए मोरान I का वर्ग मिलता है जो मुझे मिलते हैं:

River_sumSqM = 654.9283, Random_sumSqM = 50.0785 

यहाँ एक बहुत बड़ा अंतर है इसलिए मोरांस मुझे स्थानिक निरंतरता :-) का एक बहुत अच्छा उपाय लगता है।

और यहाँ नदी की छवि के 20 000 क्रमांकन के लिए इस मूल्य का एक हिस्टोग्राम है: अनुमति के हिस्टोग्राम

स्पष्ट रूप से River_sumSqM मान (654.9283) की संभावना नहीं है और इसलिए नदी की छवि स्थानिक रूप से यादृच्छिक नहीं है।


4
दिलचस्प सवाल। एक सलाह जो तुरंत दिमाग में आती है, वह है कि वेोग्राम की शॉर्ट-रेंज वाले हिस्से पर ध्यान केंद्रित करें: यह महत्वपूर्ण हिस्सा है और इन जैसे चित्रों की जोड़ी को अलग करने का सबसे अच्छा काम करेगा। (बारीकी से संबंधित आँकड़े मोरन के I और गियरीज़ सी हैं ।) यह विशिष्ट सलाह देना कठिन है, हालांकि, जब तक कि आप उन छवियों के प्रकार को स्पष्ट रूप से चिह्नित नहीं कर सकते जिन्हें आप प्रसंस्करण का अनुमान लगाते हैं।
whuber

2
+1 व्हीबर, मोरन की मैं इस मामले में एक अच्छी शुरुआत की तरह लगता हूं। तब शायद एक क्रमचय परीक्षण पर विचार करें कि आपकी छवि कितनी "चरम" है।
Gschneider

@Gschneider क्रमपरिवर्तन परीक्षण एक अच्छा विचार है, खासकर क्योंकि किसी भी क्रमपरिवर्तन का संचालन करने की आवश्यकता नहीं है! छवि में मूल्यों के क्रमपरिवर्तन के तहत वेरोग्राम (या मोरन I या गिरी के सी या जो भी) के वितरण की गणना करना सीधा है: बहुत सारे मूल्य हैं जो CLT लागू होते हैं। (जैसे, वैरोग्राम हरे बिंदुओं की तरह दिखाई देगा; दो बार उनकी निरंतर ऊंचाई छवि मूल्यों का विचरण है।) समस्या तब और अधिक चुनौतीपूर्ण हो जाती है जब एक "नदी" पैटर्न को अन्य पैटर्न जैसे "झील" से अलग करने की आवश्यकता होती है। "नदियों" में व्यापक रूप से भिन्न चौड़ाई हो सकती है।
whuber

क्षमा करें, लेकिन मुझे यकीन नहीं है कि मैं अनुसरण कर रहा हूं: क्या आप मुझे कुछ यादृच्छिक फैशन में पिक्सेल प्रति पिक्सेल परीक्षण की जा रही छवि को अनुमति देने के लिए कह रहे हैं और फिर मोरन के आई मूल्य की तुलना में अनुमति दी गई छवि के साथ परीक्षण किया जा रहा है?
एंडी

जो कुछ मेरे मन में था वह पहले (शायद सरल) पड़ोस की संरचना को परिभाषित करता था और मोरन के आई की गणना करता था। तब आप के की गणना कर सकते हैं, 200,000, पिक्सेल की संभावित अनुमति, प्रत्येक क्रमांकन के लिए मोरन की गणना करते हुए। एक बार जब आप इन 200,000 मोरन I को प्राप्त कर लेते हैं, तो देखें कि आपके अवलोकनित आंकड़े कहां हैं। लेकिन, व्हीबर की विधि आसान लगती है :)।
Gschneider

जवाबों:


1

मैं सोच रहा था कि एक गाऊसी धब्बा बड़े पैमाने के ढांचे को पीछे छोड़ते हुए और उच्च तरंग-संख्या वाले घटकों को हटाने के लिए एक कम-पास फिल्टर के रूप में कार्य करता है।

आप छवि बनाने के लिए आवश्यक तरंगों के पैमाने को भी देख सकते हैं। यदि सभी जानकारी छोटे पैमाने पर तरंगों में रह रही हैं, तो यह नदी नहीं है।

आप अपने साथ नदी की एक पंक्ति के कुछ प्रकार के ऑटो-सहसंबंध पर विचार कर सकते हैं। इसलिए यदि आपने शोर के साथ भी नदी के पिक्सेल की एक पंक्ति ली, और अगली पंक्ति के साथ क्रॉस-सहसंबंध समारोह पाया, तो आप चोटी के स्थान और मूल्य दोनों पा सकते हैं। यह मूल्य यादृच्छिक शोर के साथ जो आप प्राप्त करने जा रहे हैं, उससे बहुत अधिक होने वाला है। जब तक आप उस क्षेत्र से कुछ नहीं उठाते, जहां नदी है, तब तक पिक्सल्स का एक कॉलम बहुत ज्यादा सिग्नल नहीं देता है।

http://en.wikipedia.org/wiki/Gaussian_blur

http://en.wikipedia.org/wiki/Cross-correlation


1
कुछ रोचक विचार यहाँ! क्या मैं आपको इस उत्तर के लिए नमूना चित्रों के लिए एक या एक से अधिक दृष्टिकोणों को लागू करने के लिए मना सकता हूं (1) यह दिखाएं कि आपके तरीके कैसे काम करते हैं और (2) मूल्यांकन करते हैं कि वे कितना अच्छा प्रदर्शन करते हैं?
whuber

1
यह मेरे थीसिस से है। (मैकेनिकल इंजीनियरिंग) मैंने एक ग़ैर-पेंडुलम की स्थिति पर एक गौसियन धब्बा लगाया, और फिर एक छवि से स्थिति को वापस करने और एनालिटिक की तुलना करने के लिए कनवल्शन विधि का उपयोग किया। मैंने इसे कई स्तरों के शोर के साथ आजमाया। जब तक शोर गॉसियन के आकार से संबंधित दहलीज के नीचे था, तब तक बहुत अच्छा पुनर्निर्माण था। लिंक चित्र 11 पुनर्निर्माण के लिए प्रासंगिक ग्राफ था। चित्रा 6 और समीकरण 2 शोर की प्रतिक्रिया दर्शाते हैं।
EngrStudent

धन्यवाद! तो ऐसा लगता है कि आप इस उत्तर को समझने के लिए एक बढ़िया स्थिति में हैं और यह प्रदर्शित करते हैं कि यह वास्तव में कितना प्रभावी है। :-)
whuber

दोहरी टिप्पणी के लिए क्षमा करें। मुझे लगता है कि अपने लिए छद्म "मदर-वेवलेट" के रूप में किसी वस्तु के हिस्से का उपयोग करना "चतुर" है। यह आत्म संदर्भित लगता है, लेकिन काव्य भी। सेल्फ एडजॉइंट।
EngrStudent

1

यह थोड़ा देर से है, लेकिन मैं एक सुझाव और एक अवलोकन का विरोध नहीं कर सकता।

पहले, मेरा मानना ​​है कि हिस्टोग्राम / वेरोग्राम विश्लेषण की तुलना में अधिक "इमेज प्रोसेसिंग" दृष्टिकोण बेहतर हो सकता है। मैं कहूंगा कि EngrStudent का "चौरसाई" सुझाव सही रास्ते पर है, लेकिन "कलंक" वाला भाग काउंटर-उत्पादक है। क्या कहा जाता है एक धार-संरक्षण वाली चिकनी, जैसे कि एक द्विपक्षीय फ़िल्टर , या एक मध्य फ़िल्टर । ये मूविंग एवरेज फिल्टर्स की तुलना में अधिक परिष्कृत होते हैं, क्योंकि ये आवश्यकता से अधिक नॉनलाइनर होते हैं

यहाँ मेरा जो अर्थ है उसका प्रदर्शन है। नीचे दो चित्र आपके दो परिदृश्यों को अंकित कर रहे हैं, साथ ही उनके चित्र भी। (चित्र सामान्यीकृत तीव्रता के साथ प्रत्येक 100 से 100 हैं)।

कच्चे चित्र कच्ची छवियाँ

इन छवियों में से प्रत्येक के लिए मैं फिर 5 से 5 मंझला फिल्टर 15 गुना * लगाता हूं, जो किनारों को संरक्षित करते हुए पैटर्न को चिकना करता है । परिणाम नीचे दर्शाए गए है।

चटकीली छवियाँ चिकनी छवियाँ

(* एक बड़े फिल्टर का उपयोग करना अभी भी किनारों के विपरीत विपरीत बनाए रखेगा, लेकिन उनकी स्थिति को सुचारू कर देगा।)

ध्यान दें कि "नदी" छवि में अभी भी एक बिमोडल हिस्टोग्राम है, लेकिन अब इसे 2 घटकों में अच्छी तरह से अलग किया गया है। इस बीच, "सफेद शोर" छवि में अभी भी एक एकल-घटक यूनिमोडल हिस्टोग्राम है। (* आसानी से एक मुखौटा बनाने और विभाजन को अंतिम रूप देने के लिए, ओट्सु की विधि के माध्यम से पता लगाया गया।)


दूसरा, अपनी छवि को निश्चित रूप से है नहीं एक "नदी"! इस तथ्य के अलावा कि यह बहुत ही अनिसोट्रोपिक ("एक्स" दिशा में फैला हुआ) है, इस हद तक कि नदियों को एक साधारण समीकरण द्वारा वर्णित किया जा सकता है, उनकी ज्यामिति वास्तव में साइन- वक्र की तुलना में साइन- जेनरेटेड वक्र के बहुत करीब होती है। (जैसे यहाँ या यहाँ देखें )। निम्न आयामों के लिए यह लगभग साइन वक्र है, लेकिन उच्च आयामों के लिए लूप "उलट" हो जाते हैं ( ), जो प्रकृति में अंततः कटऑफ की ओर जाता है ।xf[y]

(शेख़ी के लिए क्षमा करें ... मेरा प्रशिक्षण एक भू-वैज्ञानिक के रूप में था, मूल रूप से)


एक साइड नोट पर, आम तौर पर प्राकृतिक छवियों के लिए "वैरोग्राम तरीकों" को लागू करने में बहुत सावधानी बरतना एक अच्छा विचार है, जो आमतौर पर स्थिर नहीं होते हैं । यह मेरे उत्तर में यहाँ पर छुआ है
जियोमैट 22

0

एक सुझाव जो एक त्वरित जीत हो सकती है (या बिल्कुल भी काम नहीं कर सकती है, लेकिन आसानी से समाप्त हो सकती है) - क्या आपने छवि तीव्रता हिस्टोग्राम के माध्य के अनुपात को देखने की कोशिश की है?

यादृच्छिक शोर छवि ले लो। यह मानते हुए कि यह कैमरे से बेतरतीब ढंग से उत्सर्जित फोटॉनों (या समान) से उत्पन्न होता है, और प्रत्येक पिक्सेल के हिट होने की संभावना होती है, और आपके पास कच्ची रीडिंग होती है (अर्थात मानों को फिर से नहीं जोड़ा जाता है, या एक ज्ञात तरीके से फिर से विभाजित किया जाता है जिसे आप पूर्ववत कर सकते हैं) , फिर प्रत्येक पिक्सेल में रीडिंग की संख्या को पॉइसन वितरित किया जाना चाहिए; आप एक निश्चित समयावधि (एक्सपोज़र टाइम) में कई बार (सभी पिक्सेल से अधिक) होने वाली घटनाओं की संख्या (एक पिक्सेल मारते हुए पिक्सेल) गिन रहे हैं।

इस मामले में जहां दो अलग-अलग तीव्रता के मूल्यों की एक नदी है, आपके पास दो पॉसों के वितरण का मिश्रण है।

वास्तव में एक छवि का परीक्षण करने का एक त्वरित तरीका, तीव्रता के भिन्नता के माध्य के अनुपात को देखना हो सकता है। एक कविता वितरण के लिए माध्य लगभग विचरण के बराबर होगा। दो पॉसों के वितरण के मिश्रण के लिए, विचरण माध्य से बड़ा होगा। आपको कुछ पूर्व-निर्धारित सीमा के विरुद्ध दोनों के अनुपात का परीक्षण करने की आवश्यकता होगी।

यह बहुत कच्चा है। लेकिन अगर यह काम करता है, तो आप अपनी छवि में प्रत्येक पिक्सेल पर बस एक पास के साथ आवश्यक पर्याप्त आँकड़ों की गणना करने में सक्षम होंगे :)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.