सिंचाई के लिए नमूने की न्यूनतम संख्या प्रक्षेप


19

मुझे कुछ डेटा मिले हैं जिसमें क्रमांकन विधि का उपयोग करके इसे प्रक्षेपित करने के अनुरोध के साथ नमूनों की संख्या है।
कुछ जांच के बाद यह सामने आया कि क्रिंगिंग परिणाम (डिफ़ॉल्ट मापदंडों के साथ आर्कजीआईएस जियोस्टेट्रिक एनालिस्ट में प्रदर्शन) संतोषजनक नहीं हैं। प्रक्षेपित मान माप (विशेष रूप से शीर्ष वाले) से बहुत अलग हैं और सतह विश्वसनीय नहीं लगती है। यहां चित्र है: यहाँ छवि विवरण दर्ज करें
मुझे लगता है कि मुख्य समस्या नमूनों की अपर्याप्त संख्या है।

विश्वसनीय परिणाम प्राप्त करने के लिए हमें कितने बिंदुओं का उपयोग करना चाहिए?
या हो सकता है कि इस तरह के विविध मूल्यों के लिए सिंचाई की विधि उपयुक्त न हो?


आपने कहा कि "हालांकि लोगों ने सफलतापूर्वक सात डेटा पॉइंट (रॉबर्ट जेरनिगन द्वारा एक मोनोग्राफ में यूएस ईपीए द्वारा 1980 के दशक के अंत में प्रकाशित), ..." के रूप में कुछ के रूप में आत्मसात किया है। लेकिन मुझे यह लेख नहीं मिला। क्या आप इस लेख के लिए एक खुला पता दे सकते हैं? धन्यवाद ...
abilici

जवाबों:


30

जब आप "डिफ़ॉल्ट मान" का उपयोग करते हैं, तो आप वास्तव में क्रिपिंग नहीं कर रहे हैं, आप केवल क्रिचिंग एल्गोरिथ्म को लागू कर रहे हैं - जो आपने पाया है, इन डेटा के साथ उपयोग किए जाने पर खराब है।

(मैं एक संक्षिप्त शेख़ी के लिए एक सोपबॉक्स पर कदम रखूँगा: मेरी राय में, कंप्यूटर प्रोग्राम के साथ खराब परिणाम प्राप्त करने का सबसे तेज़ तरीका इसके डिफ़ॉल्ट मापदंडों को स्वीकार करना है। आर्कजीआईएस खराब परिणाम प्राप्त करने के लिए सबसे अमीर, सबसे शक्तिशाली वातावरण में से एक है। तरीका। नैतिक महत्वपूर्ण काम के लिए सॉफ्टवेयर का उपयोग नहीं करता है जब तक कि आप इसे नियंत्रित करने के तरीके को नहीं समझते हैं। अब साबुनबॉक्स से नीचे ...)

काम करने के लिए आपको "वैरोग्राफी" नामक डेटा का गहन प्रारंभिक सांख्यिकीय विश्लेषण करना होगा। यह आखिरकार कितना अच्छा प्रदर्शन करता है, यह डेटा के साथ-साथ आपके भूस्थैतिक कौशल पर भी निर्भर करता है। (पूरी किताबें variography के बारे में लिखा गया है, लाभदायक सहित खनन geostatistics Journel और Huijbregts और द्वारा Variowin Yvan Pannatier से।) हालांकि लोगों को सफलतापूर्वक कुछ के रूप में सात डेटा बिंदुओं के रूप (रॉबर्ट Jernigan द्वारा एक मोनोग्राफ में अमेरिका EPA द्वारा प्रकाशित में kriged है 1980 के दशक के उत्तरार्ध में, और सिद्धांत रूप में आप केवल दो या तीन बिंदुओं का उपयोग करके सिंचाई कर सकते हैं (मैंने एल्गोरिदम को प्रदर्शित करने के लिए ऐसा किया है ), साहित्य में अंगूठे के नियम न्यूनतम 20 अंक से 100 अंक तक और सर्वसम्मति 30 अंक के आसपास प्रतीत होता है।

आपके मामले में - यद्यपि आप डेटा का वर्णन नहीं करते हैं - आपको कुछ स्पष्ट समस्याएं हैं, जिनमें अत्यधिक तिरछी वितरण और स्थिरता के साक्ष्य की एक अलग कमी शामिल है। इन्हें विशेष सांख्यिकीय उपचार या विशेष प्रकार के सिंचाई की आवश्यकता होती है (जैसे एक स्थानिक सामान्यीकृत रैखिक मॉडल)। जब तक आपके पास बहुत बड़ी मात्रा में डेटा नहीं है, तब तक आपको ऐसे डेटा का उपयोग करते हुए अच्छे परिणाम नहीं मिलेंगे।

किंवदंती से पता चलता है कि आप वास्तव में डेटा को प्रक्षेपित करने के बजाय एक घनत्व ग्रिड बनाने की कोशिश कर रहे होंगे : हालाँकि दो प्रक्रियाओं के आउटपुट समान दिख सकते हैं, वे अलग-अलग चीजें करते हैं और अलग-अलग व्याख्याएं करते हैं। जब डेटा कुछ काल्पनिक निरंतर सतह से नमूने माना जाता है, तो आप प्रक्षेपित करते हैं । इंटरपोलेशन ने अपरिचित मूल्यों की भविष्यवाणी की है। मानक उदाहरणों में ऊंचाई माप (जो पृथ्वी की सतह का नमूना है) और तापमान माप शामिल हैं (जो एक "तापमान क्षेत्र" का नमूना है)। जब आप राशि के बारे में पूरी जानकारी रखते हैं तो आप एक घनत्व की गणना करते हैंकुछ और आप प्रति यूनिट क्षेत्र में उस राशि के एक सुचारू संस्करण का प्रतिनिधित्व करना चाहते हैं। (प्रक्षेप के विपरीत, भविष्यवाणी करने के लिए कोई भी अपरिचित मान मौजूद नहीं है।) मानक उदाहरण जनसंख्या घनत्व है: डेटा एक क्षेत्र के भीतर सभी व्यक्तियों की गिनती है ; आउटपुट जनसंख्या घनत्व का एक मानचित्र है।


6
शानदार जवाब @whuber। हालाँकि, क्या अंकों की न्यूनतम संख्या भी आंशिक रूप से स्थानिक डोमेन और पूर्वानुमान के वांछित अनाज पर निर्भर करती है? यदि आप इसे एक नमूनाकरण मुद्दे पर वितरित करते हैं तो यह नमूने में जनसंख्या और स्थानिक भिन्नता को कैप्चर करने का प्रश्न बन जाता है।
जेफरी इवांस

@ जेफ्री यह आंशिक रूप से मामला है। डेटा की मात्रा दो चीजों पर निर्भर करती है: क्रैगिंग प्रीडिक्शन विचरण (जो स्थानिक डोमेन में भिन्न होता है) और सटीकता जिसके साथ ही वैरोग्राम का अनुमान लगाया जा सकता है। उत्तरार्द्ध को अक्सर अनदेखा किया जाता है, विशेष रूप से सिंचाई के पारंपरिक उपचारों में: यह कमरे में एक हाथी की तरह है। यदि आप सही वैरोग्राम को जानते हैं और इसका एक छोटा डला / अनुपात अनुपात और बड़ी सीमा है, जो स्थानिक डोमेन की सीमा के सापेक्ष है, तो आप उल्लेखनीय रूप से कुछ डेटा के साथ सिंचाई कर सकते हैं, खासकर यदि वे पर्याप्त रूप से डेटा मानों की पूरी श्रृंखला का नमूना लेते हैं।
whuber

3
मुझे विश्वास है कि क्रैगिंग का उपयोग करने वाले किसी को भी एक अच्छे भूस्थैतिक पाठ्यक्रम की आवश्यकता होनी चाहिए या एक ठोस जीआईएस / सांख्यिकी पृष्ठभूमि होनी चाहिए। कैसे ठीक से मॉडल करने के लिए एक सेमिवेरियोग्राम के लिए कुछ कौशल की आवश्यकता होती है।
माइक टी

1
अंगूठे का नियम जो मुझे दिया गया है: ऑम्निडायरेक्शनल क्रिंगिंग के लिए 30 अंक और द्विदिश के लिए 100 अंक।
जर्क

1

दो अलग-अलग प्रश्न हैं, पहला वैरोग्राम का अनुमान लगाने / उपयोग करने के लिए डेटा स्थानों की संख्या और दूसरा गैर-डेटा स्थान पर मान को प्रक्षेपित करने के लिए (या औसत मान का अनुमान लगाने के लिए) समीकरणों में उपयोग करने के लिए डेटा स्थानों की संख्या। एक क्षेत्र पर)। यह मानकर कि आप एक चलते हुए खोज पड़ोस का उपयोग कर रहे हैं, पड़ोस के 15-20 से अधिक डेटा स्थान परिणामों की संभावना कम कर देंगे क्योंकि (1) खोज पड़ोस में केवल निकटतम डेटा स्थानों में गैर-शून्य वजन होगा, (2) अधिक डेटा के साथ मैट्रिक्स का आकार उल्टा होने का स्थान बड़ा है और एक बीमार मैट्रिक्स के बढ़ने की संभावना है। सिंचाई के लिए आवश्यक डेटा स्थानों की कुल संख्या प्रक्षेपित होने वाले स्थानों की संख्या और उन बिंदुओं के स्थानिक पैटर्न और डेटा स्थानों की संख्या पर निर्भर है। संक्षेप में,

वेरोग्राम के आकलन / मॉडलिंग के संबंध में यह एक बहुत ही अलग समस्या है, उदाहरण के लिए देखें

1991, मायर्स, डे, पहले इंटर की कार्यवाही में वेरोग्राम अनुमान पर। सम्मेलन। स्टेट। कम्प।, सेस्मे, तुर्की,

30 मार्च -2 अप्रैल 1987, वॉल्यूम II, अमेरिकी विज्ञान प्रेस, 261-281

1987, ए। वरिक और डे मायर्स, वेरियम गणना के लिए नमूना स्थान का अनुकूलन जल संसाधन अनुसंधान 23, 496-500

इन्हें www.u.arizona.edu/~donaldm पर डाउनलोड किया जा सकता है

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.