जब आप सिंचाई कर रहे हैं तो आपको एक वेरोग्राम मॉडल क्यों प्रदान करना है?


9

मैं स्थानिक आंकड़ों के लिए बहुत नया हूं और बहुत सारे ट्यूटोरियल देख रहा हूं,

लेकिन मुझे वास्तव में नहीं मिलता है कि जब आप क्रिग करते हैं तो आपको एक वेरोग्राम मॉडल क्यों प्रदान करना पड़ता है।

मैं आर में gstat पैकेज का उपयोग कर रहा हूं, और यह वह उदाहरण है जो वे देते हैं:

library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)

क्या कोई एक दो लाइनों में समझा सकता है कि आपको सबसे पहले वीजीएम क्यों देना है? और आप पैरामीटर कैसे सेट करते हैं?

आपका अग्रिम में ही बहुत धन्यवाद! कैस्पर


के लिए सरल kriging आकलनकर्ता नीले केवल तभी मतलब और स्थानिक सहप्रसरण समय से आगे जाना जाता है। में साधारण kriging एक डेटा से variogram का अनुमान है और फिर प्रक्षेप करता है। देखें से शब्दचित्र gstatआर पैकेज एक ही मीयूज डेटा की।
एंडी डब्ल्यू

अरे एंडी, आपकी टिप्पणी के लिए धन्यवाद। मुझे विगनेट में पता चला कि आप बिना वैरिएज मॉडल के भी पा सकते हैं। मैंने निम्न कार्य किया: क्रिग (अवशिष्ट ~ 1, टेंप_प्लॉट_स्पेशल, y, nmin = 5, nmax = 10), इसलिए न्यूनतम 5 पड़ोसियों और अधिकतम 10 को देखने के साथ क्रिग करें। क्या इसका कोई मतलब है? परिणाम अच्छा था: dropbox.com/s/7lxvfiyfl7ekhb4/…
कास्पर

मुझे लगता है कि मुझे वैरिएबल मॉडलिंग के साथ एक समस्या है: क्या होगा अगर आप मानते हैं कि सहसंबंध का दूरी के साथ लेकिन निकटतम पड़ोसियों के साथ कोई लेना-देना नहीं है?
कास्पर

"क्या होगा यदि आप मानते हैं कि सहसंबंध का दूरी के साथ लेकिन निकटतम पड़ोसियों के साथ कोई संबंध नहीं है?" - तो, ​​यह नहीं है कि यह knn वर्गीकरण के साथ अधिक इनलाइन है। कोड krige(residuals~1 ,temp_plot_spatial, y, nmin=5, nmax=10)स्थानीय वैरोग्राम का अनुमान लगाता है। उदाहरण के लिए, आपके पास संपूर्ण अध्ययन स्थान पर एक वैरोग्राम नहीं है, लेकिन उस प्रत्येक स्थान के लिए एक नए मॉडल का अनुमान लगाएं जिसकी आप भविष्यवाणी करने की कोशिश कर रहे हैं। स्थानीय मॉडल तब केवल निकटतम 10 मानों को पकड़ता है (जब से आप अधिकतम दूरी निर्दिष्ट नहीं करते हैं, तो इसे हमेशा 10 मानों nminको पकड़ना चाहिए , इसलिए इसे बहुत कम होना चाहिए)।
एंडी डब्ल्यू

1
फिर स्थानीय वेरोग्राम का आकलन करना एक तार्किक बात है। यदि वे मॉडल में अन्य भविष्यवाणियों सहित कुछ विशेषताओं के अनुसार बदलते हैं, तो यह एक विकल्प भी है। आईडीडब्ल्यू को सबसे सरल प्रकार का क्रिंगिंग मॉडल माना जा सकता है - इसलिए आईडीडब्ल्यू को वास्तव में डेटा से वेरोग्राम का अनुमान लगाने से बेहतर नहीं होना चाहिए।
एंडी डब्ल्यू

जवाबों:


9

परिचय और सारांश

टोबलर का भूगोल का नियम मुखर करता है

हर चीज हर चीज से जुड़ी है, लेकिन पास की चीजें दूर की चीजों से ज्यादा संबंधित हैं।

किसिंग उन रिश्तों के एक मॉडल को अपनाता है जिसमें

  • "चीजें" पृथ्वी की सतह (या अंतरिक्ष में) के स्थानों पर संख्यात्मक मान हैं, जिन्हें आमतौर पर यूक्लिडियन विमान के रूप में दर्शाया जाता है।

  • इन संख्यात्मक मूल्यों को यादृच्छिक चर की प्राप्ति माना जाता है

  • "संबंधित" इन यादृच्छिक चर के साधन और सहसंयोजी के रूप में व्यक्त किया गया है।

(अंतरिक्ष में बिंदुओं से जुड़े यादृच्छिक चर का एक संग्रह "स्टोकेस्टिक प्रक्रिया" कहा जाता है)) चर उन covariances की गणना करने के लिए आवश्यक जानकारी प्रदान करता है।

किसिंग है

विशेष रूप से उन स्थानों पर चीजों की भविष्यवाणी करना जहां वे नहीं देखे गए हैं। भविष्यवाणी प्रक्रिया को गणितीय रूप से सुव्यवस्थित बनाने के लिए, क्रिंगिंग संभव मानों को प्रेक्षित मानों के रैखिक कार्य के लिए सीमित करता है । यह समस्या को यह निर्धारित करने के लिए एक परिमित बनाता है कि गुणांक क्या होना चाहिए। ये आवश्यक है कि भविष्यवाणी प्रक्रिया में कुछ गुण हो सकते हैं। सहज रूप से, एक उत्कृष्ट संपत्ति यह है कि भविष्यवक्ता और सच्चे (लेकिन अज्ञात) मूल्य के बीच अंतर छोटा होना चाहिए: अर्थात्, भविष्यवक्ता सटीक होना चाहिए । एक अन्य संपत्ति जो अत्यधिक टाल दी जाती है, लेकिन अधिक संदिग्ध है कि औसतन भविष्यवक्ता को सही मूल्य के बराबर होना चाहिए: यह सटीक होना चाहिए ।

(सही सटीकता पर जोर देने का कारण संदिग्ध है - लेकिन जरूरी नहीं कि यह बुरा है - यह आमतौर पर किसी भी सांख्यिकीय प्रक्रिया को कम सटीक बनाता है: अर्थात, अधिक चर। जब एक लक्ष्य पर शूटिंग आप हिट समान रूप से चारों ओर बिखराव करना पसंद करेंगे। रिम और शायद ही कभी केंद्र से टकराने या आप उन परिणामों को स्वीकार करेंगे, जो अभी-अभी केंद्र के बगल में केंद्रित हैं, लेकिन केंद्र पर ठीक नहीं है; पूर्व सटीक है लेकिन अभेद्य है जबकि उत्तर गलत है लेकिन सटीक है।)

ये धारणाएं और मानदंड - इसका मतलब है और सहसंयोजकता संबंधित मात्रा निर्धारित करने के लिए उपयुक्त तरीके हैं, कि एक रैखिक भविष्यवाणी काम करेगी, और यह है कि भविष्यवक्ता को यथासंभव सटीक विषय होना चाहिए - समीकरणों की एक प्रणाली के लिए नेतृत्व अद्वितीय समाधान प्रदान किया गया है कि सहसंयोजकों को एक सुसंगत तरीके से निर्दिष्ट किया गया है । परिणामी भविष्यवक्ता को इसे "BLUP" कहा जाता है: सर्वश्रेष्ठ रैखिक निष्पक्ष शिकारी

जहां वैरोग्राम आता है

इन समीकरणों को खोजने के लिए केवल वर्णित कार्यक्रम का संचालन करना आवश्यक है। यह भविष्यवक्ता और यादृच्छिक चर के रूप में सोची गई टिप्पणियों के बीच सहसंबंधों को लिखकर किया जाता है सहप्रसरण का बीजगणित kriging समीकरणों में भी डालने की मनाया मूल्यों के बीच सहप्रसरण का कारण बनता है।

इस बिंदु पर हम एक मृत अंत तक पहुँचते हैं, क्योंकि उन सहसंयोजक लगभग हमेशा अज्ञात होते हैं। आखिरकार, अधिकांश अनुप्रयोगों में हमने प्रत्येक यादृच्छिक चर का केवल एक ही एहसास देखा है : अर्थात्, हमारे डेटासेट, जो प्रत्येक अलग स्थान पर सिर्फ एक संख्या का गठन करते हैं। वैरोग्राम दर्ज करें: यह गणितीय फ़ंक्शन हमें बताता है कि किसी भी दो मूल्यों के बीच सहसंयोजक क्या होना चाहिए। यह सुनिश्चित करने के लिए विवश है कि ये सहसंयोजक "सुसंगत" हैं (इस अर्थ में कि यह कभी भी सहसंबंधों का एक सेट नहीं देगा जो गणितीय रूप से असंभव है: "संबंधितता" के संख्यात्मक उपायों के सभी संग्रह वास्तविक सहसंयोजक मैट्रिक्स नहीं बनेंगे )। यही कारण है कि एक वैराग्य Kriging के लिए आवश्यक है।

संदर्भ

क्योंकि तत्काल प्रश्न का उत्तर दिया गया है, मैं यहां रुकूंगा। इच्छुक पाठक यह जान सकते हैं कि जियोग्रोज़ एंड हुइज़ब्रेगेट्स माइनिंग जियोस्टेटिस्टिक्स (1978) या इसाक एंड श्रीवास्तव एप्लाइड जियोस्टेटिस्टिक्स (1989) जैसे अच्छे ग्रंथों से परामर्श करके वेरोगोग्राम का अनुमान और व्याख्या कैसे की जाती है । (ध्यान दें कि आकलन प्रक्रिया "वैरोग्राम" नामक दो वस्तुओं का परिचय देती है: डेटा से प्राप्त एक अनुभवजन्य वैरोग्राम और एक मॉडल वैरोग्राम जो इसके लिए फिट है। इस उत्तर में "वैरोग्राम" के सभी संदर्भ मॉडल के लिए हैं। vgmप्रश्न में कॉल। एक मॉडल वेरोग्राम का कंप्यूटर निरूपण लौटाता है।) अधिक आधुनिक दृष्टिकोण के लिए जिसमें वैरोग्राम आकलन और क्रिंगिंग उचित रूप से संयुक्त हैं, डिगल और देखेंमॉडल-आधारित जियोस्टेटिस्टिक्स (2007) (जो Rपैकेजों के लिए एक विस्तारित मैनुअल भी है GeoRऔर GeoRglm)।


टिप्पणियाँ

संयोग से, चाहे आप भविष्यवाणी या किसी अन्य एल्गोरिथ्म के लिए क्रिंगिंग का उपयोग कर रहे हों, किसी भी भविष्यवाणी प्रक्रिया का आकलन करने के लिए वेरोग्राम द्वारा वहन की जाने वाली संबंधित मात्रा का लक्षण वर्णन उपयोगी है । ध्यान दें कि सभी स्थानिक प्रक्षेप विधियां इस दृष्टिकोण से भविष्यवाणियां हैं - और उनमें से कई रैखिक भविष्यवक्ता हैं, जैसे कि आईडीडब्ल्यू (उलटा दूरी भारित)। किसी भी प्रक्षेप विधि के औसत मूल्य और फैलाव (मानक विचलन) का आकलन करने के लिए वेरोग्राम का उपयोग किया जा सकता है। इस प्रकार इसकी खेती में इसके उपयोग से कहीं अधिक प्रयोज्यता है।


इस विस्तृत उत्तर के लिए धन्यवाद। मैं ऊपर के रूप में एक ही सवाल पूछता हूं, क्या होगा अगर मैं यह अनुमान नहीं लगा सकता कि स्थानिक सहसंबंध स्थान से स्वतंत्र है? क्या यह सही है कि वैरियोग्राम मॉडलिंग तब उपयोगी नहीं है, क्योंकि मुझे सभी स्थानों के लिए वैरोग्राम का एक मॉडल बनाना होगा? क्या फिर IDW का उपयोग करना बेहतर है?
कास्पर

जब आप प्रक्रिया के द्वितीय-क्रम स्थिरता को ग्रहण नहीं कर सकते हैं , तो कई विकल्पों में शामिल हैं (1) प्रक्रिया की कई वास्तविकताओं को इकट्ठा करना (जब यह समय के साथ बदलता रहता है); (2) स्थानीय उपसमूह (जब बहुत अधिक डेटा हो) पर वैरोग्राम का आकलन करना; और (3) एक पैरामीट्रिक मॉडल को संभालने के लिए कि स्थान के साथ वैरोग्राम कैसे बदलता है (जैसा कि 1D प्रक्रियाओं के लिए GARCH मॉडल में)। मेरी पिछली टिप्पणियाँ सीधे IDW जैसी किसी चीज़ पर गिरने की असावधानी को संबोधित करती हैं: आप वेरोग्राम का अनुमान लगा सकते हैं या नहीं , सिद्धांत रूप में यह मौजूद है और इसलिए IDW आमतौर पर उप-रूपी है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.