नोट: निम्नलिखित को व्हीबर की टिप्पणी के बाद संपादित किया गया था
आप मोंटे कार्लो दृष्टिकोण अपनाना चाह सकते हैं। यहाँ एक सरल उदाहरण है। मान लें कि आप निर्धारित करना चाहते हैं कि क्या अपराध की घटनाओं का वितरण ए सांख्यिकीय रूप से बी के समान है, तो आप ए और बी की घटनाओं के बीच के आंकड़े को तुलनात्मक रूप से पुन: असाइन किए गए 'मार्कर' के लिए इस तरह के माप के अनुभवजन्य वितरण से तुलना कर सकते हैं।
उदाहरण के लिए, A (श्वेत) और B (नीला) का वितरण,
आप संयुक्त डेटासेट में सभी बिंदुओं पर A और B को यादृच्छिक रूप से पुन: असाइन करते हैं। यह एकल अनुकरण का एक उदाहरण है:
आप इसे कई बार दोहराते हैं (999 बार कहते हैं), और प्रत्येक सिमुलेशन के लिए, आप बेतरतीब ढंग से लेबल किए गए बिंदुओं का उपयोग करके एक आँकड़ा (इस उदाहरण में औसत निकटतम पड़ोसी आँकड़ा) की गणना करते हैं। कोड के स्निपेट्स जो आर में हैं ( स्पैटस्टेट लाइब्रेरी के उपयोग की आवश्यकता है )।
nn.sim = vector()
P.r = P
for(i in 1:999){
marks(P.r) = sample(P$marks) # Reassign labels at random, point locations don't change
nn.sim[i] = mean(nncross(split(P.r)$A,split(P.r)$B)$dist)
}
फिर आप परिणामों की तुलना रेखांकन से कर सकते हैं (लाल खड़ी रेखा मूल सांख्यिकीय है),
hist(nn.sim,breaks=30)
abline(v=mean(nncross(split(P)$A,split(P)$B)$dist),col="red")
या संख्यात्मक रूप से।
# Compute empirical cumulative distribution
nn.sim.ecdf = ecdf(nn.sim)
# See how the original stat compares to the simulated distribution
nn.sim.ecdf(mean(nncross(split(P)$A,split(P)$B)$dist))
ध्यान दें कि औसत निकटतम पड़ोसी आँकड़ा आपकी समस्या के लिए सबसे अच्छा सांख्यिकीय उपाय नहीं हो सकता है। K- फ़ंक्शन जैसी आँकड़े अधिक खुलासा हो सकते हैं (व्ह्यूबर के उत्तर देखें)।
उपरोक्त को आसानी से मॉडलबिल्डर का उपयोग करके आर्कगिस के अंदर लागू किया जा सकता है। एक लूप में, बेतरतीब ढंग से प्रत्येक बिंदु को गुण मान फिर से एक स्थानिक सांख्यिकीय की गणना करते हैं। आपको तालिका में परिणामों को मिलान करने में सक्षम होना चाहिए।