स्थानिक स्वायत्तता के लिए एक GAM खाते में अक्षांश और देशांतर को शामिल क्यों किया जाता है?


60

मैंने वनों की कटाई के लिए सामान्यीकृत योगात्मक मॉडल का उत्पादन किया है। स्थानिक-निरंकुशता को ध्यान में रखते हुए, मैंने अक्षांश और देशांतर को एक स्मूथ, इंटरैक्शन टर्म (जैसे s (x, y)) के रूप में शामिल किया है।

मैं कई पत्रों को पढ़ने पर आधारित हूं, जहां लेखक कहते हैं कि 'स्थानिक निरंकुशता के लिए खाते में, बिंदुओं के निर्देशांक को स्मूद शब्दों के रूप में शामिल किया गया था' लेकिन उन्होंने कभी यह नहीं बताया कि यह वास्तव में इसके लिए क्यों है। यह काफी निराशाजनक है। मैंने उन सभी पुस्तकों को पढ़ा है जो मैं उत्तर पाने की उम्मीद में GAMs पर पा सकता हूं, लेकिन अधिकांश (उदाहरण के लिए सामान्यीकृत एडिटिव मॉडल, आर, एसएन वुड के साथ एक परिचय) केवल समझाए बिना विषय पर स्पर्श करते हैं।

मैं वास्तव में इसकी सराहना करता हूं कि अगर कोई स्थानिक स्वायत्तता के लिए अक्षांश और देशांतर खातों को शामिल करने की व्याख्या कर सकता है, और इसके लिए 'लेखांकन' का वास्तव में क्या मतलब है - क्या यह बस मॉडल में इसे शामिल करने के लिए पर्याप्त है, या क्या आपको एक मॉडल की तुलना करनी चाहिए s (x, y) में और बिना मॉडल के? और क्या इस शब्द से समझाया गया अवतरण स्थानिक निरंकुशता की सीमा को दर्शाता है?


यदि यह प्रासंगिक है, तो मैंने R. में 'mgcv' पैकेज से 'bam' फंक्शन का इस्तेमाल किया।
gisol

इसके अलावा, मैंने मोरन आई। का उपयोग करके स्थानिक
स्वायत्तता के


3
यहां दिए गए जवाबों को देखते हुए, हम इस के डुप्लिकेट के रूप में अन्य Q @Macro लिंक को फ्लैग कर सकते हैं, जिससे कि आने वाले लोगों को यहां पर उत्तर देखने को मिलते हैं, विशेष रूप से व्हूबर के।
गेविन सिम्पसन

+1 @GavinSimpson - वैसे, ध्यान दें कि आपके पास करीबी वोट डालने की शक्ति है, जिनमें से पर्याप्त दो प्रश्नों को मिला दिया जाएगा।
मैक्रों

जवाबों:


38

किसी भी सांख्यिकीय मॉडल में मुख्य मुद्दा ऐसी धारणाएं हैं जो किसी भी अनुमान प्रक्रिया को रेखांकित करती हैं। आपके द्वारा वर्णित मॉडल के प्रकार में, अवशिष्टों को स्वतंत्र माना जाता है। यदि उनके पास कुछ स्थानिक निर्भरता है और यह मॉडल के sytematic भाग में मॉडल नहीं किया गया है, तो उस मॉडल के अवशेष भी स्थानिक निर्भरता का प्रदर्शन करेंगे, या दूसरे शब्दों में वे स्थानिक रूप से स्वतःसंबंधित होंगे। इस तरह की निर्भरता उस सिद्धांत को अमान्य कर देगी जो उदाहरण के लिए GAM में परीक्षण आँकड़ों से p-मान उत्पन्न करता है; आप पी-मानों पर भरोसा नहीं कर सकते क्योंकि वे स्वतंत्रता की गणना कर रहे थे।

इस तरह के डेटा को संभालने के लिए आपके पास दो मुख्य विकल्प हैं; i) मॉडल के व्यवस्थित भाग में स्थानिक निर्भरता का मॉडल, या ii) स्वतंत्रता की धारणा को शांत करते हैं और अवशिष्टों के बीच संबंध का अनुमान लगाते हैं।

i) मॉडल में स्थानिक स्थानों को सुचारू रूप से शामिल करने का प्रयास किया जा रहा है। ii) सामान्यीकृत कम से कम वर्गों जैसी प्रक्रिया का उपयोग करके मॉडल फिटिंग के दौरान अक्सर अवशिष्ट के सहसंबंध मैट्रिक्स का अनुमान लगाने की आवश्यकता होती है। स्थानिक निर्भरता से निपटने के लिए इन तरीकों में से कितनी अच्छी तरह से स्थानिक निर्भरता की प्रकृति और जटिलता पर निर्भर करेगा और इसे कितनी आसानी से मॉडल किया जा सकता है।

सारांश में, यदि आप टिप्पणियों के बीच स्थानिक निर्भरता को मॉडल कर सकते हैं, तो अवशिष्ट स्वतंत्र यादृच्छिक चर होने की अधिक संभावना है और इसलिए किसी भी हीन प्रक्रिया की मान्यताओं का उल्लंघन नहीं करते हैं।


आपके स्पष्ट उत्तर गेविन के लिए धन्यवाद। मॉडल में शामिल नहीं किए गए किसी भी ढाल से मौलिक रूप से अलग-थलग आटोक्लेररेशन क्या होता है? कहते हैं कि आपका अध्ययन क्षेत्र एक ढलान वाली पहाड़ी पर था, और ब्याज की प्रजातियां कम निवास स्थान से उच्च निवास स्थान को पसंद करती थीं। मॉडल में ऊंचाई को शामिल करने में असफल रहने से अवशिष्टों में एक संरचना निकल जाएगी, क्या ऐसा नहीं होगा? क्या यह सहज है कि स्थानिक निरंकुशता (या थी) के बारे में भूल गया या नहीं माना गया? (पुनश्च शायद यह अव्यवस्था के समावेश के रूप में एक खराब उदाहरण है, लंबे समय तक इस प्रभाव के लिए भी जिम्मेदार होगा)।
गिसोल

4
हाँ। मुझे संदेह है कि आपके द्वारा या तो स्थानिक घटक को देखे गए उदाहरणों में रुचि थी इसलिए स्पष्ट रूप से लैट / लोन की चिकनी के माध्यम से प्रतिरूपित किया गया था या स्थानिक घटक एक उपद्रव शब्द था लेकिन अवशिष्ट आईआईडी को छोड़ने के लिए मॉडलिंग करने की आवश्यकता थी यदि "स्थानिक "घटक को एक अलग चर (उदाहरण के लिए आप टिप्पणी में उत्थान) के माध्यम से बेहतर ढंग से तैयार किया जाता है, फिर स्थानिक स्थानों के बजाय उस चर का एक चिकनी उपयोग किया जाएगा।
गैविन सिम्पसन

1
क्यों सुचारू किया? "स्मूथी" से वास्तव में क्या अभिप्राय है?
जूलियन

1
प्रतिक्रिया के @ यूलियन मान 2 स्थानिक निर्देशांक के संबंध में सुचारू हैं। या एक और तरीका है, स्थानिक प्रभाव एक चिकनी 2-डी फ़ंक्शन के रूप में अनुमानित है। सुचारू रूप से हमारा मतलब है कि स्पेल के एकीकृत स्क्वेरेड दूसरी व्युत्पन्न द्वारा मापी गई कुछ विग्लगनेस है। विगल्गनेस को फिट और मॉडल की जटिलता को संतुलित करने के लिए चुना जाता है। यदि आप यह जानना चाहते हैं कि चिकने कार्य (स्प्लिन) कैसे बनते हैं तो यह एक विशिष्ट प्रश्न पूछने के लायक हो सकता है।
गैविन सिम्पसन

55

"स्थानिक निरंकुशता" का अर्थ है विभिन्न लोगों के लिए विभिन्न चीजें। एक अतिव्यापी अवधारणा, हालांकि, यह है कि स्थानों पर देखी गई एक घटना कुछ निश्चित तरीके से (a) सहसंयोजक, (b) स्थान पर निर्भर हो सकती है, और (c) इसके मान आस-पास के स्थानों पर हो सकते हैं। (जहाँ तकनीकी परिभाषाएँ भिन्न प्रकार के डेटा में मानी जा रही हैं, "निश्चित तरीका" क्या माना जाता है, और "पास" का क्या अर्थ है: इन सभी को आगे बढ़ने के लिए मात्रात्मक बनाना होगा।)z

यह देखने के लिए कि क्या चल रहा है, आइए एक क्षेत्र की स्थलाकृति का वर्णन करने के लिए इस तरह के एक स्थानिक मॉडल का एक सरल उदाहरण पर विचार करें। एक बिंदु पर मापा जाता ऊंचाई करते हो y ( जेड ) । एक संभावित मॉडल यह है कि y , z के निर्देशांक पर कुछ निश्चित गणितीय तरीके से निर्भर करता है , जिसे मैं इस दो-आयामी स्थिति में लिखूंगा ( z 1 , z 2 ) । दे ε (काल्पनिक रूप स्वतंत्र) टिप्पणियों और मॉडल (जो हमेशा की तरह शून्य उम्मीद है करने के लिए ग्रहण कर रहे हैं) के बीच विचलन का प्रतिनिधित्व करते हैं, हम लिख सकते हैंzy(z)yz(z1,z2)ε

y(z)=β0+β1z1+β2z2+ε(z)

एक रेखीय प्रवृत्ति मॉडल के लिए । रैखिक रुझान (द्वारा प्रतिनिधित्व और β 2 गुणांक) विचार कब्जा करने के लिए एक ही रास्ता है कि आसपास के मूल्यों है y ( जेड ) और y ( जेड ' ) , के लिए जेड के पास जेड ' , एक दूसरे के करीब हो जाते हैं चाहिए । हम भी के बीच अंतर के आकार की उम्मीद मूल्य पर विचार करके इस गणना कर सकते हैं y ( जेड ) और y ( जेड ' ) , [ | yβ1β2y(z)y(z)zzy(z)y(z) । यह पता चलता है कि गणितबहुतसरल है यदि हम अंतर के कुछ भिन्न माप का उपयोग करते हैं: इसके बजाय, हम अपेक्षितचुकताअंतरकी गणना करते हैं:E[|y(z)y(z)|]

E[(y(z)y(z))2]=E[(β0+β1z1+β2z2+ε(z)(β0+β1z1+β2z2+ε(z)))2]=E[(β1(z1z1)+β2(z2z2)+ε(z)ε(z))2]=E[(β1(z1z1)+β2(z2z2))2+2(β1(z1z1)+β2(z2z2))(ε(z)ε(z))+(ε(z)ε(z))2]=(β1(z1z1)+β2(z2z2))2+E[(ε(z)ε(z))2]

y(z)y(z)

ε(z)

y(z)=β0+ε(z)

εε(z)ε(z)E[ε(z)ε(z)]εzzC(z,z)y(z)y(z)

ρ(y(z),y(z))=C(z,z)C(z,z)C(z,z).

y

E[(y(z)y(z))2]=(β1(z1z1)+β2(z2z2))2+E[(ε(z)ε(z))2]=(β1(z1z1)+β2(z2z2))2+C1(z,z)+C1(z,z)

zzεC1C

εyzzβ0β1

y

E[(y(z)y(z))2]=E[(β0+ε(z)(β0+ε(z)))2]=E[(ε(z)ε(z))2]=E[ε(z)22ε(z)ε(z)+ε(z)2]=C2(z,z)2C2(z,z)+C2(z,z).

C2(z,z)zzy

E[(y(z)y(z))2](β1(z1z1)+β2(z2z2))22C2(z,z)Ci(z,z)

ε)। व्यवहार में, मॉडल दोनों तरीकों को शामिल करते हैं। आप जो चुनते हैं, वह इस बात पर निर्भर करता है कि आप मॉडल के साथ क्या हासिल करना चाहते हैं और आपके विचार में स्थानिक स्वायत्तता कैसे उत्पन्न होती है - क्या यह अंतर्निहित रुझानों से निहित है या आप यादृच्छिक पर विचार करने के लिए इच्छित विविधता को दर्शाते हैं। न तो हमेशा सही होता है और, किसी भी समस्या में, डेटा का विश्लेषण करने, घटना को समझने और अन्य स्थानों (प्रक्षेप) पर इसके मूल्यों की भविष्यवाणी करने के लिए दोनों प्रकार के मॉडल का उपयोग करना अक्सर संभव होता है ।


2
+1 - स्थानिक निर्भरता से निपटने के लिए दो दृष्टिकोणों के बीच की कड़ी को देखना अच्छा है। शानदार जवाब, व्हीबर!
मैक्रो

बहुत व्यापक, धन्यवाद। मुझे यह सब सोचने में कुछ पल लगेंगे।
गिसोल

6
यदि सभी सांख्यिकीय लेखन इस ilk के थे, तो दुनिया में बहुत अधिक स्पष्ट-सोच वाले सांख्यिकीय कार्य होंगे। खूबसूरती से किया।
अरी बी। फ्रीडमैन

क्या मैं इस उत्तर को सही ढंग से समझता हूं जब मैं इसे प्राप्त करता हूं कि बस किसी भी स्वतंत्र चर के रूप में एक्स / वाई-निर्देशांक जोड़ रहा है (?) मॉडल कुछ हद तक स्थानिक स्वायत्तता के लिए जिम्मेदार होगा?
जूलियन

1
@ जूलियन: हम एक ही डेटा के लिए विभिन्न मॉडलों के निर्माण के बारे में बात कर रहे हैं। यदि आप एक्स और वाई निर्देशांक को व्याख्यात्मक चर के रूप में शामिल करते हैं, लेकिन अन्यथा स्थानिक सहसंबंध के लिए खाता नहीं है, तो "स्थानिक सहसंबंध" इस मॉडल के लिए कोई मतलब नहीं है, इसलिए हमें इस बारे में सावधान रहना चाहिए कि हम "स्थानिक सहसंबंध के लिए खाते" से क्या मतलब है। लेकिन अगर हम यह पूछने के लिए आपके प्रश्न को समझें कि क्या निर्देशांक सहित व्याख्यात्मक चर एक मॉडल के निर्माण के रूप में प्रभावी हो सकते हैं जिसमें स्थानिक सहसंबंध स्पष्ट रूप से दर्शाया गया है, तो मेरा जवाब है "हाँ, अक्सर ऐसा ही होता है।"
whuber

0

अन्य उत्तर अच्छे हैं मैं सिर्फ 'स्थानिक निरंकुशता के लिए लेखांकन' के बारे में कुछ जोड़ना चाहता था। कभी-कभी यह दावा "दृढ़ता से स्वत: सहसंबंध के लिए लेखांकन के द्वारा समझाया जाता है जो कोविरेट्स द्वारा नहीं समझाया गया"।

यह एक भ्रामक तस्वीर पेश कर सकता है जो स्थानिक चिकनी करता है। यह पसंद नहीं है कि संभावना में कुछ क्रमबद्ध कतार है जहां चिकनी चुपचाप पहले जाने के लिए कोवरिएट्स की प्रतीक्षा करता है और फिर चिकनी 'अस्पष्टीकृत' भागों को पिघला देगा। वास्तव में उन सभी को डेटा की व्याख्या करने का मौका मिलता है।

उपयुक्त रूप से नामित शीर्षक वाला यह पेपर वास्तव में इस मुद्दे को स्पष्ट रूप से प्रस्तुत करता है, हालांकि यह एक सीएआर मॉडल के दृष्टिकोण से है जो सिद्धांत जीएएम स्मूथ पर लागू होते हैं।

Spatially-Correlated Errors को जोड़ना आपके द्वारा तय किए गए प्यार को प्रभावित कर सकता है

कागज में 'समाधान' अंतरिक्ष पर चौरसाई करने के बजाय अवशिष्टों को चिकना करना है। इससे आपके कोवरिएट्स को यह समझाने की अनुमति होगी कि वे क्या कर सकते हैं। बेशक, ऐसे कई अनुप्रयोग हैं जिनमें यह एक वांछित समाधान नहीं होगा।


-2

स्थानिक सहसंबंध बस यह है कि कैसे x और y निर्देशांक अंतरिक्ष में परिणामी सतह के परिमाण से संबंधित हैं। तो निर्देशांक के बीच के स्वसंबंध को पड़ोसी बिंदुओं के बीच कार्यात्मक संबंध के रूप में व्यक्त किया जा सकता है।


1
हाय माइकल, प्रतिक्रिया के लिए धन्यवाद। मुझे लगता है कि मैंने समझ लिया है कि आपने क्या कहा है, लेकिन यह स्थानिक स्वत :संबंध का विवरण प्रतीत होता है बजाय इसके कि कैसे समन्वय इसके लिए खातों को शामिल करता है - मुझे आपकी बात याद आ रही होगी। उदाहरण के लिए, मान लें कि मेरे पास 2 मॉडल हैं, पहला (ए) एक ही शब्द के साथ - एक राजधानी शहर की दूरी के एक समारोह के रूप में वनों की कटाई, और दूसरा (बी) पूंजी शहर की अवधि के लिए दूरी के साथ लेकिन साथ ही अव्यक्त और लंबा अवधि। क्या आप इस संदर्भ में अपना उत्तर दोहराएंगे? शायद मैं इसे बेहतर समझ सकता था।
14

1
मुझे लगता है कि अगर मॉडल में कोई बातचीत शब्द नहीं है, तो पड़ोसी बिंदुओं के बीच स्थानिक ऑटोक्रॉलेशन 0. है। जब आपके पास पुनरावृत्ति शब्द होता है, तो यह शब्द स्थानिक ऑटोक्रेलेशन का मूल्य निर्धारित करता है।
माइकल चेरिक

4
@ मिचेल, स्थानिक निरंकुशता का अर्थ है कि बिंदुओं के बीच संबंध उनके स्थानिक स्थानों पर निर्भर करता है। मुझे लगता है कि यह उत्तर अधिक उपयोगी होगा यदि आप बता सकते हैं कि इनपुट के रूप में स्थानिक स्थानों के साथ एक चिकनी फ़ंक्शन अनुमान का उपयोग करना, इसके लिए खाते क्यों हैं। सतह पर, ऐसा लगता है कि चिकनी फ़ंक्शन दृष्टिकोण माडल करता है जबकि स्थानिक ऑटोक्रेलेशन कॉवरियन संरचना को संदर्भित करता है । मुझे पता है कि एक चिकनी प्रक्रिया और सुचारू फ़ंक्शन आकलन के सह-कार्य के बीच एक संबंध है लेकिन, उस संबंध को बनाए बिना, यह उत्तर अधूरा लगता है।
मैक्रो

1
@ मिचेल, निश्चित रूप से आप देख सकते हैं कि लेट / लॉन्ग कोऑर्डिनेट बनाने से माध्य अंतरिक्ष में दो बिंदुओं के बीच के आपसी संबंधों को प्रभावित करने से अलग है ... ओपी ने पूछा कि स्थानिक निरंकुशता को कैसे मॉडल किया जाए और मुझे लगता है कि तर्क का हिस्सा है - वह हिस्सा ठीक से समझाता है कि एक चिकनी स्थानिक सतह को कैसे फिट किया जाता है (जो निर्देशांक में एक सामान्यीकृत एडिटिव मॉडल है) स्थानिक ऑटोक्रेलेशन को मॉडल करता है। गैम्स और कोवरियस फ़ंक्शंस के बीच एक रिश्ता है (मैं अधिक सटीक होने के लिए पर्याप्त नहीं जानता) लेकिन उस रिश्ते के लिए अपील करना ऐसा प्रतीत होता है कि यहां आवश्यक है।
मैक्रों

1
@Marco मैं साइमन वुड की पुस्तक पर एक नज़र डालूंगा यदि आप इसका विवरण दे सकते हैं और प्रासंगिक साहित्य को रैंडम इफेक्ट बिट के रूप में स्मूद पर उद्धृत कर सकते हैं।
गैविन सिम्पसन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.