मोरन के I के लिए मजबूत विकल्प


19

मोरन I , स्थानिक निरंकुशता का एक उपाय, विशेष रूप से मजबूत आँकड़ा नहीं है (यह स्थानिक डेटा विशेषताओं के तिरछा वितरण के लिए संवेदनशील हो सकता है)।

स्थानिक निरंकुशता को मापने के लिए कुछ और मजबूत तकनीकें क्या हैं ? मैं उन समाधानों में विशेष रूप से रुचि रखता हूं जो आर जैसे स्क्रिप्टिंग भाषा में आसानी से उपलब्ध / लागू करने योग्य हैं। यदि समाधान अद्वितीय परिस्थितियों / डेटा वितरण पर लागू होते हैं, तो कृपया अपने उत्तर में उन लोगों को निर्दिष्ट करें।


संपादित करें : मैं कुछ उदाहरणों के साथ सवाल का विस्तार कर रहा हूं (मूल प्रश्न के जवाब / टिप्पणियों के जवाब में)

यह सुझाव दिया गया है कि क्रमपरिवर्तन तकनीक (जहां मोंटे कार्लो प्रक्रिया का उपयोग करके मोरन का I नमूना वितरण उत्पन्न होता है) एक मजबूत समाधान प्रदान करता है। मेरी समझ यह है कि इस तरह के परीक्षण से मोरन के वितरण के बारे में कोई भी धारणा बनाने की आवश्यकता समाप्त हो जाती है (यह देखते हुए कि परीक्षण सांख्यिकीय डेटासेट की स्थानिक संरचना से प्रभावित हो सकता है) लेकिन, मैं यह देखने में विफल रहता हूं कि गैर-सामान्य रूप से क्रमपरिवर्तन तकनीक कैसे ठीक होती है वितरित विशेषता डेटा । मैं दो उदाहरण प्रस्तुत करता हूं: एक जो स्थानीय मोरन के I सांख्यिकी पर तिरछे डेटा के प्रभाव को प्रदर्शित करता है, दूसरा वैश्विक मोरन के I -– यहां तक ​​कि क्रमपरिवर्तन परीक्षणों के तहत भी।

मैं जांग एट अल का उपयोग करूंगा 'एस (2008) पहले उदाहरण के रूप में विश्लेषण करती है। अपने पत्र में, वे स्थानीय मोरन के क्रमपरिवर्तन परीक्षणों (9999 सिमुलेशन) का उपयोग करके डेटा वितरण के प्रभाव को दिखाते हैं । मैंने लेखकों के हॉटस्पॉट परिणामों को लीड (Pb) सांद्रता (5% आत्मविश्वास स्तर पर) के लिए मूल डेटा (बाएं पैनल) और जियोडा में उसी डेटा (राइट पैनल) के लॉग ट्रांसफ़ॉर्मेशन का उपयोग करके पुन: पेश किया है। मूल और लॉग-ट्रांसफ़ॉर्म किए गए Pb सांद्रता के Boxplots भी प्रस्तुत किए जाते हैं। यहां, डेटा के रूपांतरित होने पर महत्वपूर्ण हॉट स्पॉट की संख्या लगभग दोगुनी हो जाती है; इस उदाहरण से पता चलता है स्थानीय आंकड़ा है कि है विशेषता डेटा वितरण के प्रति संवेदनशील होने पर भी - मोंटे कार्लो तकनीक का उपयोग!

यहाँ छवि विवरण दर्ज करें

दूसरा उदाहरण (सिम्युलेटेड डेटा) दर्शाता है कि प्रभाव तिरछा डेटा वैश्विक मोरन के I पर हो सकता है , यहां तक ​​कि अनुमति परीक्षण का उपयोग करते समय भी। R में एक उदाहरण , इस प्रकार है:

library(spdep)
library(maptools)
NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66"))
rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID"))
NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn)
n  <- length(NB)
set.seed(4956)
x.norm <- rnorm(n) 
rho    <- 0.3          # autoregressive parameter
W      <- nb2listw(NB) # Generate spatial weights
# Generate autocorrelated datasets (one normally distributed the other skewed)
x.norm.auto <- invIrW(W, rho) %*% x.norm # Generate autocorrelated values
x.skew.auto <- exp(x.norm.auto) # Transform orginal data to create a 'skewed' version
# Run permutation tests
MCI.norm <- moran.mc(x.norm.auto, listw=W, nsim=9999)
MCI.skew <- moran.mc(x.skew.auto, listw=W, nsim=9999)
# Display p-values
MCI.norm$p.value;MCI.skew$p.value

पी-मूल्यों में अंतर पर ध्यान दें। तिरछा डेटा इंगित करता है कि 5% महत्व स्तर (p = 0.167) पर कोई क्लस्टरिंग नहीं है जबकि सामान्य रूप से वितरित डेटा इंगित करता है कि वहाँ (p = 0.013) है।


चाओशेंग झांग, लिन लुओ, वेइलिन जू, वैलेरी लेडिथ, स्थानीय मोरन I और GIS का उपयोग गैलवे, आयरलैंड की शहरी मिट्टी में Pb के प्रदूषण के आकर्षण के केंद्र की पहचान करने के लिए, कुल पर्यावरण का विज्ञान, वॉल्यूम 398, अंक 1-3, 15 जुलाई 2008 , पेज 212-221


1
क्या आपके पास तिरछे वितरणों की संवेदनशीलता का संदर्भ है)? क्या आप गैर-यादृच्छिक स्थानिक वितरण के वैश्विक परीक्षणों में रुचि रखते हैं या स्थानीय असामान्य विशेषताओं की पहचान कर रहे हैं? ब्याज के परिणाम का वितरण क्या है (सकारात्मक गणना चर?)
एंडी डब्ल्यू

1
एंडीव: 1) टेस्ट की संवेदनशीलता का एक संदर्भ फोर्टिन और डेल का 'स्पेसियल एनालिसिस, ए गाइड टू इकोलॉजिस्ट्स' (पृष्ठ 125), 2) मुझे ग्लोबल और लोकल टेस्ट दोनों के समाधान में दिलचस्पी है, 3) मुझे कुछ खास नहीं लगा। मन में डेटा वितरण।
मन्नीग

1
एंडी, क्योंकि मोरन का I भारित विचरण और सहसंयोजक अनुमानों पर आधारित है, इसमें आउटलेयर्स के लिए उतनी ही संवेदनशीलता होगी जितनी वे अनुमान लगाते हैं, जो (जैसा कि सर्वविदित है) विचारणीय है। यह अंतर्दृष्टि मैनी की समस्या के कई संभावित समाधानों का रास्ता भी बताती है: एक मजबूत भारित सहसंबंध बनाने के लिए फैलाव और एसोसिएशन के अनुमानों के अपने पसंदीदा मजबूत संस्करणों को स्थानापन्न करें और आप बंद और चल रहे हैं।
whuber

1
ऐसा लगता है कि आप यहाँ कई अवधारणाओं का सामना कर रहे हैं, @ और। सबसे पहले, मैनी ऑटोक्रेलेशन को मापना चाहता है ; वह जरूरी नहीं कि एक परिकल्पना परीक्षण आयोजित कर रहा है। दूसरा, परिकल्पना परीक्षण के साथ सवाल को मजबूती के बजाय शक्ति के संदर्भ में सबसे अच्छा माना जाता है। लेकिन (तीसरी) अवधारणाओं का एक संबंध है: एक मजबूत परीक्षण आँकड़ा वितरणीय मान्यताओं के उल्लंघन (जैसे कि आउटलेर द्वारा संदूषण) की एक विस्तृत श्रृंखला के तहत अपनी शक्ति बनाए रखने के लिए होगा, जबकि एक गैर-मजबूत परीक्षण सांख्यिकीय सबसे या सभी को खो सकता है उन स्थितियों में इसकी शक्ति।
whuber

1
@ FC84, मैंने पिछले साल इस मुद्दे पर फिर से विचार किया और एक प्रस्तावित समाधान लिखा । लेकिन इसके लिए पशु चिकित्सक की जरूरत है। मेरी योजना है कि कुछ बिंदु पर एक उत्तर के रूप में उस लेखन के कम (बहुत) संस्करण की पेशकश की जाए। जो कुछ मेरे पास है, उसमें से जो कुछ भी आप कर सकते हैं, उससे मुक्त महसूस करें। लेकिन सावधानी से इसका उपयोग करें!
मान्निग

जवाबों:


2

(यह एक टिप्पणी में बदलने के लिए इस बिंदु पर अभी भी बहुत कमज़ोर है)

यह स्थानीय और वैश्विक परीक्षणों के संबंध में है (ऑटो-सहसंबंध का एक विशिष्ट, नमूना स्वतंत्र माप नहीं)। मैं इस बात की सराहना कर सकता हूं कि विशिष्ट मोरन का मैं माप सहसंबंध का एक पक्षपाती अनुमान है (इसे उसी रूप में उसी रूप में व्याख्यायित करता है जैसे पियर्सन सहसंबंध गुणांक), मैं अभी भी यह नहीं देखता कि कैसे अनुमेय परिकल्पना परीक्षण चर के मूल वितरण के लिए संवेदनशील है ( या तो टाइप 1 या टाइप 2 त्रुटियों के संदर्भ में)।

आपके द्वारा टिप्पणी में प्रदान किए गए कोड को थोड़ा बढ़ाकर (स्थानिक भार colqueenगायब था);

library(spdep)
data(columbus)
attach(columbus)

colqueen <- nb2listw(col.gal.nb, style="W") #weights object was missing in original comment
MC1 <- moran.mc(PLUMB,colqueen,999)
MC2 <- moran.mc(log(PLUMB),colqueen,999)
par(mfrow = c(2,2))
hist(PLUMB, main = "Histogram PLUMB")
hist(log(PLUMB), main = "HISTOGRAM log(PLUMB)")
plot(MC1, main = "999 perm. PLUMB")
plot(MC2, main = "999 perm. log(PLUMB)")

जब कोई क्रमपरिवर्तन परीक्षण करता है (इस उदाहरण में, मैं इसे अंतरिक्ष को जम्बलिंग के रूप में सोचना पसंद करता हूं) वैश्विक स्थानिक ऑटो-सहसंबंध की परिकल्पना परीक्षण को चर के वितरण से प्रभावित नहीं किया जाना चाहिए, क्योंकि सिमुलेशन परीक्षण वितरण सार में बदल जाएगा। मूल चर के वितरण के साथ। संभावना भी इस प्रदर्शन करने के लिए और अधिक दिलचस्प सिमुलेशन के साथ आ सकता है, लेकिन के रूप में आप इस उदाहरण में देख सकते हैं, मनाया परीक्षण के आँकड़े है अच्छी तरह से दोनों मूल के लिए उत्पन्न वितरण के बाहर PLUMBऔर लॉग इन किया PLUMB(जो बहुत करीब एक सामान्य वितरण करने के लिए है) । यद्यपि आप 0 के बारे में समरूपता के करीब शून्य पारियों के तहत लॉग इन PLUMB परीक्षण वितरण देख सकते हैं।

यहाँ छवि विवरण दर्ज करें

मैं इसे एक विकल्प के रूप में वैसे भी सुझाता जा रहा था, वितरण को लगभग सामान्य होने के लिए बदल रहा था। मैं स्थानिक फ़िल्टरिंग (और इसी तरह गेटिस-ऑर्डिन स्थानीय और वैश्विक आँकड़े) पर संसाधनों की तलाश करने का सुझाव देने जा रहा था, हालाँकि मुझे यकीन नहीं है कि यह पैमाना मुक्त माप के साथ मदद करेगा (लेकिन शायद परिकल्पना परीक्षणों के लिए उपयोगी हो सकता है) । मैं ब्याज के संभावित अधिक साहित्य के साथ बाद में वापस पोस्ट करूंगा।


धन्यवाद एंडी आपके विस्तृत खाते के लिए। अगर मैं आपको सही तरीके से समझता हूं, तो आपका मतलब है कि एक क्रमांकन परीक्षण में परीक्षण सांख्यिकीय (मोरन I) परिणामी एमसी वितरण के सापेक्ष नहीं बदलेगा , लेकिन यह मेरी टिप्पणियों से सहमत नहीं है। उदाहरण के लिए, यदि हम एक ही कोलम्बस डेटासेट में HOVAL वैरिएबल का उपयोग करते हैं, तो परिणामस्वरूप MC Moran का I परीक्षण p- मान 0.029 (मूल तिरछी डेटा के साथ) से 0.004 (लॉग परिवर्तित डेटा के साथ) MC के बीच एक चौड़ी खाई का संकेत देता है। वितरण और परीक्षण सांख्यिकीय - महत्वहीन नहीं है अगर हमने 1% पर सीमा निर्धारित की थी।
मन्नीजी

1
हाँ आप मेरी बात को सही ढंग से व्याख्यायित कर रहे हैं। किसी भी विशेष रन को खोजना निश्चित रूप से संभव है जिसमें परिणाम भिन्न होते हैं। यह सवाल बनता है कि विभिन्न परिस्थितियों में त्रुटि दर समान हैं या नहीं।
एंडी डब्ल्यू
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.