भौगोलिक रूप से भारित प्रतिगमन विश्लेषण में अशक्त मूल्य


12

मेरे कुछ व्याख्यात्मक चर में कुछ बहुभुजों के लिए कुछ अशक्त मूल्य हैं।

क्या भौगोलिक रूप से भारित प्रतिगमन विश्लेषण इन्हें संभाल सकता है, या मुझे पूरे बहुभुज और सभी डेटा (उस विशेष बहुभुज के लिए आश्रित और स्वतंत्र चर) को हटा देना चाहिए?


ये नल क्या दर्शाते हैं? यह मान लागू नहीं है या यह मौजूद नहीं है लेकिन अज्ञात है? यदि उत्तरार्द्ध, यह अज्ञात क्यों है? (मुख्य चिंता यह है कि क्या मूल्य अज्ञात होने का कारण किसी भी तरह से मूल्य से संबंधित है; उदाहरण के लिए, यदि आप जल विज्ञान का अध्ययन कर रहे हैं और एक व्याख्यात्मक चर के रूप में भूमि कवर का उपयोग कर रहे हैं, तो यदि बाढ़ के कारण भूमि कवर अज्ञात है, कि महत्वपूर्ण जानकारी और साधन भी बहुत कुछ एक मात्र लापता मूल्य से है)।
whuber

1
शुक्रिया, आप में से कुछ nulls डेटा का प्रतिनिधित्व करते हैं जो एकत्रीकरण की छोटी इकाइयों के कारण गोपनीयता के लिए छोड़ा गया था, अन्य बस उपलब्ध नहीं थे, लेकिन अन्य वैरिएबल को प्रभावित करने वाले व्याख्यात्मक चर के परिणाम के रूप में नहीं। मेरे पास सही शून्य मान हैं, जिससे शून्य उस विशेष बहुभुज के लिए कोई घटना / दर का प्रतिनिधित्व नहीं करता है और मेरे पास कुछ शून्य मान भी हैं जहां डेटा गायब है। चूँकि मेरे पास लगभग 29 व्याख्यात्मक चरों के साथ शुरुआत करने के लिए है, अगर मैं पॉलीगॉन को बाहर निकालता हूँ, जहाँ नलियों वाली पंक्तियों के लिए, मैं 279 में से 8 पॉलीगोन खो रहा हूँ और मुझे उम्मीद थी कि मुझे नहीं करना होगा। धन्यवाद!
मैं हार्ट

मुझे खुशी है कि आपके पास गुमशुदगी के बारे में जानकारी और सिद्धांत हैं। आप उन छोटी इकाइयों के बारे में थोड़ा सतर्क रहना चाह सकते हैं, क्योंकि किसी भी चर के बारे में केवल मान ही उस क्षेत्र के आकार से संबंधित हो सकता है, जिससे लापता होने के पैटर्न में एक संभावित पूर्वाग्रह पैदा होता है।
whuber

2
आप उनकी उपस्थिति को इंगित करने के लिए चर का परिचय देकर नल को शामिल कर सकते हैं और सभी मूल अशक्त परिणामों को एक सामान्य मूल्य (जो मूल्य आप चुनते हैं वह वास्तव में मायने नहीं रखता है) के साथ एन्कोडिंग है। आपको प्रत्येक चर के लिए एक अलग संकेतक की आवश्यकता होगी जिसमें कोई नल हो। आप जो कुछ भी करते हैं, शून्य को शून्य (या किसी अन्य स्थिर) द्वारा प्रतिस्थापित न करें! शून्य का मतलब शून्य से पूरी तरह से अलग है।
whuber

1
@whuber ऐसा लगता है कि इस पर एक उत्तर लिखने के लिए आपकी टिप्पणियों में पर्याप्त हो सकता है।
PolyGeo

जवाबों:


1

आप आसपास के डेटा से 'अशक्त' मूल्यों का अनुमान लगाने की कोशिश कर सकते हैं। उन्हें छोड़ने से बेहतर होगा, क्योंकि आप डेटा खो देंगे। बेशक आपको मूल्यों का अनुमान लगाने में सावधानी बरतनी होगी। क्योंकि यदि आपका अनुमान पक्षपाती है, तो आपका मॉडल भी होगा।

इसे भी देखें: http://handbook.cochrane.org/chapter_16_1_2_general_principles_for_dealing_with_missing_data.htm

तथा:

सावधान:

जब भी शेपफाइल्स का उपयोग करते हैं, तो ध्यान रखें कि वे अशक्त मूल्यों को संचित नहीं कर सकते हैं। उपकरण या अन्य प्रक्रियाएं जो नॉनशेपफाइल इनपुट से आकारफाइल बनाती हैं, परिणामस्वरूप शून्य मानों को स्टोर कर सकती हैं या कुछ बहुत छोटे नकारात्मक संख्या के रूप में (-DBL_MAX = -1.7976931348623158e [308)। इससे अप्रत्याशित परिणाम हो सकते हैं। इसे भी देखें: शेपफाइल आउटपुट के लिए जियोप्रोसेसिंग विचार ( http://desktop.arcgis.com/en/arcmap/10.3/tools/spatial-statistics-toolbox/geographically-weighted-regression.htm )

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.