स्थानिक आँकड़े उपकरण: रेखापुंज डेटा पर क्लस्टरिंग विश्लेषण


9

मैं एक स्पष्ट रूप से सरल समस्या है, लेकिन मैं उपयोग करने के लिए एक स्पष्ट कार्यप्रणाली नहीं ढूँढ सकता।

मुझे CIESIN से विश्व डाटासेट की ग्रिडिड आबादी का उपयोग करते हुए, वेक्टर उत्तल बहुभुज द्वारा "शहरी क्षेत्रों" को परिसीमित करने का काम सौंपा गया है

यह डेटासेट पूरी दुनिया में एक रस्टर फ़ाइल के रूप में जनसंख्या घनत्व मान प्रदान करता है। समस्या यह है, जैसा कि आप पहले ही अनुमान लगा चुके हैं, कि घनत्व मूल्य बहुत बदल रहे हैं, और "शहरी" की परिभाषा काफी सापेक्ष है।

मैंने एक शास्त्रीय दृष्टिकोण का उपयोग करने की कोशिश की है और ढलानों की गणना की है जैसे कि घनत्व मूल्य ऊंचाई थे, लेकिन ढलान मूल्य भी बहुत ही असमान और स्थानिक रूप से जटिल, जटिल थे।

मैंने आर्किटिस और जियोडा के साथ स्थानिक क्लस्टरिंग एल्गोरिदम, एलआईएसए उपकरण (स्थानिक संघ के स्थानीय संकेतक) में देखा है, लेकिन मैं बहुत विशिष्ट उपकरणों के बीच खो गया हूं। कुछ विधियां केवल वेक्टर आकृतियों पर काम कर रही हैं, इसलिए एक पुनर्वर्गीकरण और एक वेक्टरकरण की आवश्यकता है (लंबी गणना)।

क्या आप उपयोग करने के तरीकों और उपकरणों के सेट को परिष्कृत करने में मेरी मदद कर सकते हैं? धन्यवाद !


2
वास्तव में क्या है "शहरी" की अपनी परिभाषा? BTW, मैं सभी शहरी क्षेत्रों को उत्तल बहुभुज द्वारा पर्याप्त रूप से वर्णित किए जाने की उम्मीद नहीं करूंगा । कई में भौगोलिक विशेषताओं द्वारा नियंत्रित आकृतियाँ हैं - पहाड़, तटरेखा, और नदियाँ - जो अत्यधिक गैर-उत्तल हैं।
whuber

परिभाषा नहीं दी गई है, स्थिर नहीं है। मुझे लगता है कि लक्ष्य उनके पर्यावरण के संबंध में काफी अधिक घने क्षेत्रों को खोजना है, जो भिन्न होता है। तो स्थानिक आंकड़ों और लिसा के बारे में विचार। आप उत्तलता के बारे में सही हैं, मुझे लिखना चाहिए था "आत्म-प्रतिच्छेद नहीं करना चाहिए और अन्य बहुभुजों को प्रतिच्छेद नहीं करना चाहिए"।
लॉरेंट जेगौ

एक पूरक के रूप में, मैंने एक पूरे आर मॉड्यूल को स्थानिक समूह के उपकरण के लिए समर्पित पाया: spdep।
लॉरेंट जेगौ

जवाबों:


4

मैं अपने एमएससी के लिए इस पर कुछ काम किया है http://ian01.geog.psu.edu/papers/mscthesis.pdf - मूल रूप से मैं ढाल परिवर्तन पर काम किया लेकिन चर्चा इसमें सहायता कर सकते हैं।


धन्यवाद, मैं इसे जल्द ही
पढ़ूंगा

मैंने डबल सॉबल 2 व्युत्पन्न विधि की कोशिश की है जो आप एक सीमित परीक्षण क्षेत्र पर थीसिस में वर्णन करते हैं, और यह बहुत दिलचस्प है! स्पष्ट शहरी कर्नेल अलग-थलग हैं, बहुत अलग घनत्व मूल्य हैं। बहुत धन्यवाद :) वैसे मैंने एक मुफ्त और ओपनसोर्स सॉफ़्टवेयर का उपयोग किया, जो संकल्प और रेखापुंज गणित की गणना करने के लिए: ऑप्टिक्स।
लॉरेंट जेगौ

कृत्रिम प्रकाश का एक उपाय शहरी परिस्थितियों के लिए एक अच्छा प्रॉक्सी होगा। एक Google खोज को उदाहरण अध्ययन करना चाहिए।
b_dev

@indiehacker - मैंने इसे देखा, लेकिन यह सांस्कृतिक रूप से निर्भर है, उदाहरण के लिए फ्रांस ब्रिटेन की तुलना में बहुत गहरा है।
इयान Turton

6

जनसंख्या घनत्व के दृष्टिकोण से, "शहरी क्षेत्र" को आमतौर पर केवल कुछ स्वयंसिद्ध मानदंडों को पूरा करने के लिए चाहिए :

  1. इसकी सीमा में इसके आंतरिक के अधिकतम घनत्व की तुलना में (अपेक्षाकृत) उच्च घनत्व के किसी भी बिंदु को शामिल नहीं किया जाना चाहिए।

  2. यह बस जुड़ा होना चाहिए (कोई "छेद" नहीं)।

  3. इसकी औसत जनसंख्या घनत्व कुछ निर्धारित सीमा से अधिक होनी चाहिए।

Axiom (1) सबसे स्वाभाविक है: यदि एक सीमा बिंदु पर उच्च घनत्व था, तो हम शहरी क्षेत्र के भीतर उस बिंदु को शामिल करने के लिए सीमा से बाहर की ओर बढ़ेंगे। मैं सुझाव देना चाहूंगा कि "सापेक्ष" का अर्थ अधिकतम के अनुपात के रूप में है, जैसे कि एक-दसवां या एक-सौवां या जो भी हो। Axiom (2) पार्कों और अन्य कम घनत्व वाले क्षेत्रों को छोड़कर बचता है जो स्वाभाविक रूप से शहरों में होते हैं। Axiom (3) , क्योंकि यह एक सीमा पर निर्भर करता है, कुछ हद तक मनमाना है, छोटे कॉम्पैक्ट गांवों को समाप्त करता है।

दरअसल, मनमानी का कम से कम एक अन्य तत्व है: जनसंख्या घनत्व का कोई भी ग्रिड नक्शा स्थानीय पड़ोस (कुछ मामलों में एक सेल के बराबर और कर्नेल घनत्व अनुमानों के लिए कर्नेल त्रिज्या के बराबर) पर अनुमानित औसत आबादी है। आइए इस अंतर्निहित पड़ोस के आकार को स्वीकार करें (जिसे मूल घनत्व नक्शे पर पहले चलने वाले फोकल साधनों या अन्य कर्नेल चिकनी द्वारा बदला जा सकता है), यह जनसंख्या सीमा और स्वयंसिद्ध 1 में "अपेक्षाकृत उच्च" की भावना उपयोगकर्ता-बसने योग्य मापदंडों के रूप में है जो नियंत्रण करते हैं परिणाम।

ये स्वयंसिद्ध स्वाभाविक रूप से काफी सरल एल्गोरिथ्म का नेतृत्व करते हैं : किसी को स्थानीय मैक्सिमा का पता लगाना चाहिए, अपने पड़ोस में देखना चाहिए जब तक कि एक्सिओम (1) को संतुष्ट करने के लिए एक सीमा नहीं मिलती है, तब तक किसी भी छेद में भरें एक्सिओम (2) को संतुष्ट करने के लिए, और फिर सभी उम्मीदवार क्षेत्रों को स्क्रीन करें। के अनुसार (3)। यह अग्रानुसार होगा:

  1. वैकल्पिक रूप से, घनत्व मानचित्र को चिकना करें।

  2. घनत्व-संबंधित मानचित्र पर "भरण" एल्गोरिदम का प्रदर्शन करें (नीचे देखें)।

  3. रीजनग्रुप रिजल्ट।

  4. रीजनरेटेड पॉलीगॉन से छेद निकालें।

  5. भरे हुए बहुभुजों पर जनसंख्या घनत्व का आंचलिक संस्कार करें।

  6. आबादी (घनत्व) सीमा से नीचे किसी भी बहुभुज को सम (या सघनता) से हटा दें।

जो बचा है वह आपका समाधान है।

मुझे स्टेप (1) के बारे में थोड़ा और बताना चाहिए, जो महत्वपूर्ण है। एक भरण एल्गोरिथ्म "सिंक" की पहचान करता है और उन्हें "ऊँचाई" से एक निरंतर राशि तक भरता है। यह ठीक वैसा ही है जैसा कि Axiom (1) हमें करने के लिए कहता है, बशर्ते (ए) हम "सिंक" बना सकते हैं "स्थानीय अधिकतम" की भूमिका निभाते हैं और (बी) "निरंतर राशि ऊपर" बनाते हैं जो "निरंतर अंश " की भूमिका निभाते हैं। " ऐसा करने का तरीका घनत्व के नकारात्मक लघुगणक को भरने से हैघनत्व के बजाय ही। (घनत्व में पहले एक छोटा सा स्थिरांक जोड़ें - मान लें, लॉग लेने से पहले लगभग 0.1 व्यक्ति प्रति वर्ग किलोमीटर - ताकि शून्य वाले किसी भी सेल को समस्या न हो।) नकारात्मक लॉग घनत्व में "झीलों" उम्मीदवार की पहचान करता है। शहरी क्षेत्र। आपके पास खेलने के लिए अभी भी तीन स्वतंत्र पैरामीटर हैं (चरण 0, 1, और 5 में प्रवेश करना); उन्हें स्थापित करने के लिए "शहरी क्षेत्र" के साथ-साथ कुछ प्रयोग के बारे में आपके विचार के बारे में कुछ विचार करने की आवश्यकता होगी।


आपके विस्तृत उत्तर के लिए धन्यवाद। मैं नकारात्मक लॉग के साथ भरने के एल्गोरिथ्म का परीक्षण करने के लिए सही सॉफ्टवेयर टूल (या उन्हें प्रोग्राम) खोजने की कोशिश करूंगा, जो एक अच्छा लीड लगता है।
लॉरेंट जेगौ
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.