अलग-अलग परत से बिंदुओं के दूसरे सेट के चारों ओर एक सेट के समूहों का पता लगाना?


10

मैं यह देखना चाहता हूं कि क्या किसी अन्य प्रकार की इमारतों (y) के आसपास एक निश्चित प्रकार की इमारतों (x) की क्लस्टरिंग है।

दो बिंदु फाइलें विभिन्न परतों में हैं।

मैं यह पता लगाने के लिए नहीं कर सकता कि मैं ऐसा करने के लिए किस टूल का उपयोग करूंगा।

जवाबों:


9

आर्कगिस (या किसी अन्य जीआईएस, एएफएआईके) में कोई भी आउट-ऑफ-द-बॉक्स उपकरण सही ढंग से काम नहीं करेगा।

इस तरह की समस्या में आपको "क्लस्टरिंग" से जो मतलब होता है उसे परिमाणित करना होगा और फिर आपको यह आकलन करने के लिए संभाव्यता मॉडल प्रस्तुत करना होगा कि क्या क्लस्टरिंग की मापी गई डिग्री आकस्मिक अवसरों द्वारा निर्मित की जा सकती है।

कैसे आगे बढ़ना है, इसका एक उदाहरण के रूप में, आप टाइप x की इमारतों और टाइप y की निकटतम इमारत के बीच विशिष्ट दूरी के संदर्भ में क्लस्टरिंग को मापना चुन सकते हैं । यह एक आसान गणना है: बस अलग-अलग बिंदु परतों द्वारा इमारतों के दोनों सेट का प्रतिनिधित्व करते हैं और एक्स के लिए वाई के एक स्थानिक जुड़ाव का प्रदर्शन करते हैं। विशेषता तालिका, जिसमें अभी भी प्रत्येक प्रकार के x भवन के लिए एक रिकॉर्ड है , अब निकटतम y की दूरी को शामिल करेगा । आप अपने उपाय के रूप में औसत दूरी का उपयोग कर सकते हैं।

परीक्षण यह मौका का परिणाम हो सकता है मुश्किल है। इस सेटिंग की एक प्रशंसनीय व्याख्या यह है कि y प्रकार की इमारतों की पहले की उपस्थिति ने x प्रकार की इमारतों के विकास को प्रोत्साहित किया जो अपेक्षाकृत y के करीब है । अन्यथा, हम अनुमान लगा सकते हैं कि x प्रकार की इमारतों को कहीं भी बनाया जा सकता था कि अन्य इमारतें भी दिखाई दें। यह निम्नलिखित सरल क्रमपरिवर्तन परीक्षण की ओर जाता है । सभी संभावित स्थानों जहां के एक बिंदु परत बनाएं एक्स प्रकार इमारतों सकता है प्रकट होते हैं। यह परत x के समान अवधि के दौरान निर्मित क्षेत्र की सभी इमारतों के स्थान हो सकते हैंइमारतें ( निश्चित रूप से स्वयं एक्स भवन सहित) थीं । स्थानिक रूप से निकटतम वाई प्रकार की इमारत के लिए दूरी प्राप्त करने के लिए y परत में शामिल हों । शेष गणना विशेषता तालिका से काम करती है: भौगोलिक गणना की जाती है। आप क्या करेंगे बार-बार इन सभी इमारतों का एक सरल यादृच्छिक नमूना लेने के लिए एक यादृच्छिक संख्या जनरेटर का उपयोग करें, प्रत्येक नमूने में ठीक उसी तरह के कई तत्व हैं जैसे आपके पास x प्रकार की इमारतें हैं। इस नमूने के लिए औसत दूरी की गणना करें। तब तक दोहराएं जब तक आपके पास कई औसत-दूरी के आंकड़े न हों। यदि लगभग ये सभी बेतरतीब ढंग से प्राप्त औसत दूरी x के लिए मापी गई औसत दूरी से अधिक हैप्रकार की इमारतें, आप यह निष्कर्ष निकाल सकते हैं कि x का संयोग नहीं है: प्रभाव वास्तविक है।

(इस तरह की गणना ऐसे उद्देश्यों के लिए उपयुक्त प्लेटफ़ॉर्म पर प्रोग्राम की जाती है, जैसे `आर ', लेकिन लगभग किसी भी कंप्यूटिंग सॉफ़्टवेयर को सेवा में दबाया जा सकता है, यहां तक ​​कि एक्सेल भी। प्रोग्रामिंग बहुत ही आवश्यक है, लूप लिखने और चयन करने के तरीके जानने की तुलना में बहुत कम। यादृच्छिक पर सरणियों से तत्व।)

यह क्रमपरिवर्तन परीक्षण दृष्टिकोण पूर्व-प्रोग्राम किए गए समाधानों से बेहतर है क्योंकि यह स्पष्ट रूप से इस क्षेत्र में भवन विकास के पैटर्न के लिए जिम्मेदार है। यदि आप ऐसा नहीं करते हैं, तो आपको अक्सर क्लस्टरिंग के "महत्वपूर्ण" सबूत मिल जाएंगे , लेकिन आप इससे कुछ भी उपयोगी नहीं पा सकते हैं, क्योंकि क्लस्टरिंग अन्य कारकों जैसे कि सड़कों के पैटर्न, स्थानों के कारण हो सकता है। विकास के लिए उपयुक्त साइटें, और कई अन्य चीजें।


1
मुझे लगता है कि यह उत्तर थोड़ा सार है। जब मेरे पास अधिक समय होगा तो मैं एक यथार्थवादी चित्रण बनाने की कोशिश करूँगा।
whuber

R का उपयोग करने वालों के लिए, मैं क्लस्टर विश्लेषण के लिए स्पैटस्टैट पैकेज ( cran.r-project.org/web/packages/spatstat/index.html ) देने की सलाह दूंगा
om_henners

2

बेशक, आपकी डेटा विश्लेषण विधि विश्लेषण को प्रेरित करने वाली मूल समस्या पर निर्भर होनी चाहिए।

लेकिन यहाँ कुछ विचार हैं:

ESRI से:

मल्टी-दूरी स्थानिक क्लस्टर विश्लेषण कैसे होता है: रिप्ले का k-function (स्थानिक सांख्यिकी) काम करता है , जहां समीकरण में i और j आपकी इमारतों को x और y दर्शाते हैं। रिप्ले के के-फंक्शन संभावित संभाव्यता प्रदान करेगा।

कंप्यूटर विज्ञान से:

सह-स्थान पैटर्न खोज के लिए जटिल एल्गोरिदम हैं जिन्हें आप Google कर सकते हैं।


"सरल कथानक विचार" दिलचस्प है, लेकिन आपको इसकी तुलना करने के लिए कुछ चाहिए: अपने आप से इसके बारे में उपयोगी जानकारी निकालना मुश्किल है। रिप्ले के के फ़ंक्शन एक उपयोगी उपकरण है, भी, लेकिन दुर्भाग्य से कई मामलों में यह केवल डेटासेट की ज्यामिति को दर्शाता है। उपनगरीय या ग्रामीण क्षेत्र में घरों के साथ, जो रैखिक सुविधाओं (सड़कों) के साथ झूठ बोलते हैं, K फ़ंक्शन स्पष्ट रूप से अकेले इस कारण से "महत्वपूर्ण" क्लस्टरिंग दिखाएगा। जैसे कि यह घरों के बारे में उपयोगी कुछ भी नहीं बताता है कि वे सड़कों के पास बने हैं!
whuber

Rwhley's K फ़ंक्शन की समस्या के स्पष्टीकरण के लिए @whuber 1 धन्यवाद। 2, जब हम समय के साथ स्टॉक की कीमतों का एक प्लॉट देखते हैं, तो हम सामान्य रुझानों को ऊपर या नीचे या यादृच्छिक रूप से देख सकते हैं, साथ ही हम बार-बार यह भी निकाल सकते हैं कि बड़े घट गए थे या बढ़ गए थे और क्यों पूछ रहे थे। इमारतों की एकाग्रता कैसे बदलती है, इसका एक प्लॉट उसी तरह से इस्तेमाल किया जा सकता है। इसका उपयोग एकाग्रता में स्पाइक्स की खोज के लिए किया जा सकता है, जो कि एक यादृच्छिक वितरण के खिलाफ सबूत है, इसका उपयोग उत्सुक स्पिक की आगे की जांच पर ध्यान केंद्रित करने के लिए भी किया जा सकता है।
b_dev

आप सही हे। मेरा कहना है कि अपने आप में यह कथानक हमें क्लस्टरिंग के बारे में कुछ नहीं बताता है । शायद एक अच्छा सादृश्य (स्टॉक की कीमतों के बजाय) अमेरिका में 2000-2010 तक गुर्दे के कैंसर के मामलों की संख्या का कोरोप्लेथ मानचित्र है। वह भी, हमें (भौगोलिक) क्लस्टरिंग के बारे में कुछ नहीं बताता है क्योंकि यह राज्यों के बीच आबादी में भिन्नता के लिए जिम्मेदार नहीं है। इसी तरह, क्रॉस-के प्लॉट को व्याख्या करने के लिए एक उपयुक्त सामान्यीकरण या संदर्भ की आवश्यकता होती है। सामान्य रुझान, स्पाइक आदि, सभी भवन स्थानों के भौगोलिक पैटर्न को दर्शा सकते हैं ।
व्हिबर

@ जब आप सही हो। आपकी उपरोक्त टिप्पणी को पढ़ने के बाद, मैंने फैसला किया है कि मेरा सिंपल प्लॉट आइडिया ज्यादा जानकारी नहीं देगा, कम से कम जैसा कि इसका वर्णन किया गया था, इसलिए मैंने इसे हटा दिया है ताकि लोगों को भ्रमित न करें। मेरा मानना ​​है कि संयुक्त गणना सांख्यिकीय समस्या को हल करने की सबसे सरल विधि है।
b_dev

2

मैंने स्वयं जीआईएस में क्लस्टर विश्लेषण कभी नहीं किया है, लेकिन क्या यह आसान हो सकता है यदि आपने एक्स और / या वाई के दिए गए क्लस्टर का प्रतिनिधित्व करने के लिए अंक / बहुभुज बनाए हैं, उदाहरण के लिए, यदि आपने बिल्डिंग वाई को इंगित करने के लिए अंक बनाए हैं, तो आप तब कर सकते हैं। अपने मूल स्थानों से दिए गए दूरी के भीतर X के निर्माण के सभी बिंदुओं को प्राप्त करने के लिए प्वाइंट डिस्टेंस टूल का उपयोग करें ।

अन्यथा, टाइप Y की इमारतों के चारों ओर एक बफर बनाने और टाइप X की सभी इमारतों का चयन करने पर वही परिणाम प्राप्त होगा यदि आपके पास ArcInfo नहीं है।


0

बिल्डिंग X या Y से है या नहीं इसकी पहचान करने के लिए आप बाइनरी कॉलम (0,1) जोड़कर दोनों परतों को जोड़ सकते हैं।

वहाँ से जियोडा का उपयोग करके आप स्थानीय स्थानिक ऑटो-सहसंबंध (क्लस्टरिंग) की पहचान कर सकते हैं और यह निर्धारित कर सकते हैं कि क्या यह उच्च-निम्न (दूसरी परत के चारों ओर एक परत) कम-उच्च (उलटा) या उच्च-उच्च या निम्न-निम्न (स्व) है क्लस्टरिंग)। उपयोगकर्ता की गाइड यहाँ (.pdf)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.