जब अलग-अलग प्रस्तावों के आपदाओं से निपटना चाहिए, तो क्या किसी को उच्चतम या निम्नतम रिज़ॉल्यूशन पर फिर से चलना चाहिए?


16

मैं विभिन्न प्रस्तावों और अनुमानों के साथ रेखापुंज डेटा परतों से निपटने के लिए सर्वोत्तम प्रथाओं पर सिफारिशों की तलाश कर रहा हूं। मुझे जो सलाह दी गई है, वह यह है कि किसी भी विश्लेषण को करने से पहले सबसे कम रिज़ॉल्यूशन वाली परत को हमेशा के लिए फिर से तैयार किया जाए, लेकिन यह मुझे सटीक परिशुद्धता की भारी बर्बादी की तरह लगता है और मुझे ऐसा करने के लिए कभी ठोस स्पष्टीकरण नहीं दिया गया है।

उच्च रिज़ॉल्यूशन ग्रिड से मिलान करने के लिए इसे फिर से शुरू करना उचित है और निम्न रिज़ॉल्यूशन की तुलना में इसके निहितार्थ क्या हैं?

मुझे एहसास है कि यह संभावना अत्यधिक स्थिति पर निर्भर है। मैं ज्यादातर सामान्य दिशानिर्देशों की तलाश कर रहा हूं, लेकिन संदर्भ के लिए मेरा विशिष्ट परिदृश्य यहां है:

परिदृश्य: मैं विभिन्न पर्यावरणीय और सामाजिक-आर्थिक परतों के आधार पर भूमि उपयोग की भविष्यवाणी करने वाले एक स्थानिक प्रतिगमन मॉडल का निर्माण करना चाहता हूँ। मेरा भूमि उपयोग नक्शा लैंडसैट व्युत्पन्न है और इसलिए 30 मी संकल्प है। व्याख्यात्मक परतों के उदाहरणों में SRTM DEM (3 चाप-सेकंड, ~ 90 मीटर) और बायोकलीम जलवायु परत (30 चाप-सेकंड, ~ 1 किमी) शामिल हैं।


1
क्या आप कृपया प्रतिगमन मॉडल और कार्यान्वयन की विधि के बारे में अधिक जानकारी प्रदान कर सकते हैं? एक अच्छी तरह से निर्मित, दिलचस्प सवाल के लिए +1!
आरोन

मैं समय में दो बिंदुओं पर वन कवर की तुलना कर रहा हूं और मेरी प्रतिक्रिया के रूप में वनों की कटाई की (बाइनरी) संभावना के साथ एक लॉजिस्टिक रिग्रेशन मॉडल का उपयोग कर रहा हूं। मैं इसे आर। में लागू करूंगा
मैट एसएम

जवाबों:


17

वास्तव में यह सब उस स्थिति पर निर्भर नहीं है और सभी सांख्यिकीय त्रुटि के बारे में है।

जब भी आप किसी उच्च रिज़ॉल्यूशन में फिर से आते हैं, तो आप गलत सटीकता का परिचय दे रहे हैं। संपूर्ण संख्याओं पर केवल पैरों में मापा गया डेटा के एक सेट पर विचार करें। कोई भी दिया गया बिंदु उसके वास्तविक स्थान से +/- 0.5 फीट की दूरी पर हो सकता है। यदि आप निकटतम दसवें में फिर से आते हैं, तो आप कह रहे हैं कि कोई भी संख्या अपने वास्तविक स्थान से +/- 0.1 से अधिक नहीं है। फिर भी आपको पता है कि आपके मूल माप सही नहीं थे, और अब आप त्रुटि के दायरे में काम कर रहे हैं। हालाँकि अगर आप दूसरे रास्ते पर जाते हैं और निचले रिज़ॉल्यूशन के लिए फिर से आते हैं, तो आप जानते हैं कि किसी भी दिए गए बिंदु का मूल्य निश्चित रूप से सटीक है क्योंकि यह बड़े नमूने के मार्जिन के भीतर निहित है।

सांख्यिकीय गणित के बाहर, यह ध्यान में आने वाला पहला स्थान भूमि सर्वेक्षण में है। पुराने सर्वेक्षण केवल निर्दिष्ट आधे मिनट के लिए नीचे की दूरी और एक पैर के दसवें तक की दूरी को निर्दिष्ट करते हैं। इन मापों के साथ एक सीमा पार प्लॉटिंग अक्सर एक मिसकॉल में हो सकता है (शुरुआत बिंदु और अंत बिंदु समान होना चाहिए, लेकिन पैरों में मापा नहीं जाता है)। आधुनिक सर्वेक्षण एक पैर के कम से कम निकटतम दूसरे और hundreth पर जाते हैं। परिशुद्धता में अंतर से व्युत्पन्न मूल्य (जैसे कि बहुत का क्षेत्र) महत्वपूर्ण रूप से प्रभावित हो सकता है। व्युत्पन्न मूल्य को भी अत्यधिक सटीक माना जा सकता है।

आपके विश्लेषण के मामले में, यदि आप उच्च रिज़ॉल्यूशन के लिए फिर से आते हैं तो आपके परिणाम उस डेटा की तुलना में बहुत अधिक सटीकता से होंगे, जिस पर वे आधारित हैं। 90m पर अपने SRTM पर विचार करें। जिस भी विधि से वे ऊँचाई को मापते हैं (औसत / अधिकतम / औसत प्रतिफल), वह सबसे छोटी इकाई (पिक्सेल) जिसे उसके पड़ोसियों से विभेदित किया जा सकता है 90 मी। यदि आप इसे 30 मी के बराबर करते हैं, तो:

  • आप यह मानते हैं कि परिणामी पिक्सेल के सभी नौ समान ऊंचाई वाले हैं जब सत्य में शायद केवल एक ही - केंद्र, या शीर्ष बाएँ (या कोई नहीं!) है।
  • आप पिक्सेल के बीच प्रक्षेपित करते हैं, जिससे व्युत्पन्न मान पहले उपस्थित नहीं होते हैं

इस प्रकार दोनों मामलों में आप झूठी सटीकता का परिचय देते हैं क्योंकि आपके नए उपसमूह वास्तव में मापे नहीं गए थे।

संबंधित प्रश्न: मॉडलिंग भूमि उपयुक्तता के लिए कौन से अभ्यास उपलब्ध हैं?


यह निश्चित रूप से बिंदु डेटा के लिए है। लेकिन मुझे आश्चर्य है कि अगर यह रेखापुंज डेटा के लिए अलग-अलग है जो लगातार बदलती हुई स्थानिक मात्रा का औसत है, जहां स्थान की सटीकता और मापा मात्रा की सटीकता है। साथ ही, विभिन्न मात्राओं में स्थानिक भिन्नता के विभिन्न स्तर होते हैं। उदाहरण के लिए, एक उच्च रिज़ॉल्यूशन के लिए एलीवेशन डेटा को फिर से जमा करना प्रैरीज़ की तुलना में पहाड़ी क्षेत्रों में अधिक त्रुटि का परिचय देना चाहिए।
मैट एसएम

@ मैट यह सभी स्थानिक डेटा का सच है, और मापा मात्रा के सांख्यिकीय त्रुटि से जटिल है। 90m पर अपने SRTM पर विचार करें। जिस भी विधि से वे ऊँचाई को मापते हैं (औसत / अधिकतम / औसत प्रतिफल), सबसे छोटी इकाई (पिक्सेल) जिसे उसके पड़ोसियों से विभेदित किया जा सकता है वह 90 मी। यदि आप इसे 30 मी तक फिर से भेजते हैं, तो आप अब कह रहे हैं कि परिणामी पिक्सेल के सभी 9 समान ऊंचाई वाले हैं जब सत्य में शायद केवल (या कोई नहीं!) है - केंद्र, या शीर्ष बाएँ। या आप पिक्सल के बीच में अंतर करते हैं, जिससे पहले मौजूद मान नहीं बनते हैं, इस प्रकार गलत सटीकता। और हां, मूल्य सीमा संभावित त्रुटि के लिए खेलती है।
क्रिस डब्ल्यू

एक साइड नोट के रूप में, विशेष सुविधाओं में विशिष्ट विशेषताओं को प्रक्षेपित करना संभव है, जहां पैटर्न स्पष्ट रूप से सीमित है - एक, गैर-भौगोलिक, सुविधा जो मन में आती है वह तस्वीरों से नंबर प्लेट की जानकारी का पुनर्निर्माण कर रही है जो पढ़ने के लिए बहुत कम संकल्प है। लेकिन आपको यह जानना होगा कि आप क्या देख रहे हैं, मुझे कुछ ऐसे मामलों की याद है जहाँ नंबर प्लेट का पुनर्निर्माण विफल हो गया क्योंकि प्रश्न में प्लेट अरबी जैसे गैर-यूरोपीय लिपि में थी।
स्टीव बार्न्स

आर्क-आधारित रिज़ॉल्यूशन वाले रैस्टर के बारे में, क्या उनके पास ग्रिड सेल नहीं हैं जो विभिन्न क्षेत्रों / विभिन्न क्षेत्रों में पहलू-अनुपात हो सकते हैं?
CMCDragonkai

@CMCDragonkai मुझे यकीन नहीं है कि आप कैसे पता कर सकते हैं क्योंकि आप डेटा प्रतिनिधित्व बनाम प्रारूप और सिस्टम / अनुमानों का समन्वय कर रहे हैं। हां, एक रेखापुंज में भौगोलिक क्षेत्र आवश्यक रूप से वर्गाकार (या अन्य पहलू अनुपात) पिक्सल के समान नहीं है। कई संतृप्त डेटा स्पेक्स आपको यह बताएंगे (पिक्सेल नादिर में x है और स्वाथ किनारे y)। लेकिन फिर से शुरू करने के मुद्दे अभी भी लागू होते हैं - अगर कुछ भी यह सिर्फ इस मुद्दे को मिलाता है। (और देरी के लिए खेद है, मैं कुछ समय में एसई पर नहीं रहा हूं।)
क्रिस डब्ल्यू
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.