मोरन I , स्थानिक निरंकुशता का एक उपाय, विशेष रूप से मजबूत आँकड़ा नहीं है (यह स्थानिक डेटा विशेषताओं के तिरछा वितरण के लिए संवेदनशील हो सकता है)।
स्थानिक निरंकुशता को मापने के लिए कुछ और मजबूत तकनीकें क्या हैं ? मैं उन समाधानों में विशेष रूप से रुचि रखता हूं जो आर जैसे स्क्रिप्टिंग भाषा में आसानी से उपलब्ध / लागू करने योग्य हैं। यदि समाधान अद्वितीय परिस्थितियों / डेटा वितरण पर लागू होते हैं, तो कृपया अपने उत्तर में उन लोगों को निर्दिष्ट करें।
संपादित करें : मैं कुछ उदाहरणों के साथ सवाल का विस्तार कर रहा हूं (मूल प्रश्न के जवाब / टिप्पणियों के जवाब में)
यह सुझाव दिया गया है कि क्रमपरिवर्तन तकनीक (जहां मोंटे कार्लो प्रक्रिया का उपयोग करके मोरन का I नमूना वितरण उत्पन्न होता है) एक मजबूत समाधान प्रदान करता है। मेरी समझ यह है कि इस तरह के परीक्षण से मोरन के वितरण के बारे में कोई भी धारणा बनाने की आवश्यकता समाप्त हो जाती है (यह देखते हुए कि परीक्षण सांख्यिकीय डेटासेट की स्थानिक संरचना से प्रभावित हो सकता है) लेकिन, मैं यह देखने में विफल रहता हूं कि गैर-सामान्य रूप से क्रमपरिवर्तन तकनीक कैसे ठीक होती है वितरित विशेषता डेटा । मैं दो उदाहरण प्रस्तुत करता हूं: एक जो स्थानीय मोरन के I सांख्यिकी पर तिरछे डेटा के प्रभाव को प्रदर्शित करता है, दूसरा वैश्विक मोरन के I -– यहां तक कि क्रमपरिवर्तन परीक्षणों के तहत भी।
मैं जांग एट अल का उपयोग करूंगा । 'एस (2008) पहले उदाहरण के रूप में विश्लेषण करती है। अपने पत्र में, वे स्थानीय मोरन के क्रमपरिवर्तन परीक्षणों (9999 सिमुलेशन) का उपयोग करके डेटा वितरण के प्रभाव को दिखाते हैं । मैंने लेखकों के हॉटस्पॉट परिणामों को लीड (Pb) सांद्रता (5% आत्मविश्वास स्तर पर) के लिए मूल डेटा (बाएं पैनल) और जियोडा में उसी डेटा (राइट पैनल) के लॉग ट्रांसफ़ॉर्मेशन का उपयोग करके पुन: पेश किया है। मूल और लॉग-ट्रांसफ़ॉर्म किए गए Pb सांद्रता के Boxplots भी प्रस्तुत किए जाते हैं। यहां, डेटा के रूपांतरित होने पर महत्वपूर्ण हॉट स्पॉट की संख्या लगभग दोगुनी हो जाती है; इस उदाहरण से पता चलता है स्थानीय आंकड़ा है कि है विशेषता डेटा वितरण के प्रति संवेदनशील होने पर भी - मोंटे कार्लो तकनीक का उपयोग!
दूसरा उदाहरण (सिम्युलेटेड डेटा) दर्शाता है कि प्रभाव तिरछा डेटा वैश्विक मोरन के I पर हो सकता है , यहां तक कि अनुमति परीक्षण का उपयोग करते समय भी। R में एक उदाहरण , इस प्रकार है:
library(spdep)
library(maptools)
NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66"))
rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID"))
NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn)
n <- length(NB)
set.seed(4956)
x.norm <- rnorm(n)
rho <- 0.3 # autoregressive parameter
W <- nb2listw(NB) # Generate spatial weights
# Generate autocorrelated datasets (one normally distributed the other skewed)
x.norm.auto <- invIrW(W, rho) %*% x.norm # Generate autocorrelated values
x.skew.auto <- exp(x.norm.auto) # Transform orginal data to create a 'skewed' version
# Run permutation tests
MCI.norm <- moran.mc(x.norm.auto, listw=W, nsim=9999)
MCI.skew <- moran.mc(x.skew.auto, listw=W, nsim=9999)
# Display p-values
MCI.norm$p.value;MCI.skew$p.value
पी-मूल्यों में अंतर पर ध्यान दें। तिरछा डेटा इंगित करता है कि 5% महत्व स्तर (p = 0.167) पर कोई क्लस्टरिंग नहीं है जबकि सामान्य रूप से वितरित डेटा इंगित करता है कि वहाँ (p = 0.013) है।
चाओशेंग झांग, लिन लुओ, वेइलिन जू, वैलेरी लेडिथ, स्थानीय मोरन I और GIS का उपयोग गैलवे, आयरलैंड की शहरी मिट्टी में Pb के प्रदूषण के आकर्षण के केंद्र की पहचान करने के लिए, कुल पर्यावरण का विज्ञान, वॉल्यूम 398, अंक 1-3, 15 जुलाई 2008 , पेज 212-221