जनसंख्या घनत्व आकलन के लिए मॉडल


14

(जनसंख्या, क्षेत्र, आकार) का एक डेटाबेस जनसंख्या घनत्व को मैप करने के लिए प्रत्येक आकार (जो कि एक जनगणना ब्लॉक, ट्रैक्ट, काउंटी, राज्य, जो भी है) जैसे एक बहुभुज (जैसे बहुभुज है) का निरंतर मान निर्दिष्ट करके उपयोग किया जा सकता है। आबादी आमतौर पर समान रूप से उनके बहुभुज के भीतर वितरित नहीं की जाती है। डासिमेट्रिक मैपिंग सहायक डेटा के माध्यम से इन घनत्व अनुमानों को परिष्कृत करने की प्रक्रिया है। सामाजिक विज्ञानों में यह एक महत्वपूर्ण समस्या है क्योंकि यह हालिया समीक्षा इंगित करती है।

मान लीजिए, फिर, कि हमारे पास भूमि कवर (या किसी अन्य असतत कारक) का एक सहायक मानचित्र उपलब्ध है। सरलतम मामले में हम स्पष्ट रूप से निर्जन क्षेत्रों का उपयोग कर सकते हैं जैसे जल-प्रपात, जहाँ आबादी नहीं है और जहाँ तक शेष आबादी को शेष क्षेत्रों के लिए आवंटित करना है। आम तौर पर, प्रत्येक जनगणना इकाई को भागों में तराशा जाता है जिसमें सतह क्षेत्र , । इस प्रकार हमारे डेटासेट को tuples की सूची में बदल दिया गया हैk x j i i = 1 , 2 , , kjkxjii=1,2,,k

(yj,xj1,xj2,,xjk)

जहां यूनिट में जनसंख्या (त्रुटि के बिना मापी गई) है और यद्यपि यह सख्ती से मामला नहीं है - हम मान सकते हैं कि हर भी बिल्कुल मापा जाता है। इन शब्दों में, उद्देश्य प्रत्येक को एक राशि में विभाजित करना है j x j i y jyjjxjiyj

yj=zj1+zj2++zjk

जहां प्रत्येक और भूमि कवर वर्ग में रहने वाली इकाई भीतर जनसंख्या का अनुमान लगाता है । अनुमानों का निष्पक्ष होना आवश्यक है। यह विभाजन, घनत्व को घनत्व घनत्व को करते हुए को जनगणना बहुभुज और कवर करके वर्ग को दर्शाता है। । जेड जे मैं जे मैं जेड जे मैं / एक्स जे मैं j वें मैं वेंzji0zjijizji/xjijthith

यह समस्या सामयिक तरीकों में मानक प्रतिगमन सेटिंग्स से भिन्न होती है:

  1. प्रत्येक का विभाजन सटीक होना चाहिए। yj
  2. हर विभाजन के घटक गैर-नकारात्मक होने चाहिए।
  3. किसी भी डेटा में कोई त्रुटि नहीं है (धारणा के अनुसार): सभी जनसंख्या और सभी क्षेत्रों को सही है। x j iyjxji

एक समाधान के कई दृष्टिकोण हैं, जैसे कि " बुद्धिमान डायसिमेट्रिक मैपिंग " विधि, लेकिन मैंने उन सभी के बारे में पढ़ा है जिनके पास तदर्थ तत्व और पूर्वाग्रह के लिए एक स्पष्ट क्षमता है। मैं रचनात्मक, कम्प्यूटेशनल रूप से ट्रैक्टेबल सांख्यिकीय तरीकों का सुझाव देने वाले उत्तरों की तलाश कर रहा हूं। तत्काल आवेदन सी के संग्रह की चिंता करता है - 40 लोगों की औसत जनगणना इकाइयाँ (हालांकि एक बड़े हिस्से में 0 लोग हैं) और लगभग एक दर्जन लैंड कवर क्लासेस हैं। १० 105106


स्वरूपण मुद्दा अब ठीक किया गया। यह एक बग था।
रोब हाइंडमैन

@Rob धन्यवाद, और उन सभी लोगों को धन्यवाद जिन्होंने इसे देखा: मैंने आपकी टिप्पणियों को हटाने से पहले देखा और आपके प्रयासों के लिए आभारी हूं।
whuber

1
यह भी एक: पी। ए ज़ैंडर्बेन और डी। ए इग्निज़ियो, "लघु-क्षेत्र जनसंख्या अनुमानों के लिए डासिमेट्रिक मैपिंग तकनीकों की तुलना" कार्टोग्राफी और भौगोलिक सूचना विज्ञान 37, नं। 3 (2010): 199-214। ingentaconnect.com/content/acsm/cagis/2010/00000037/00000003/… जो सम्मिश्रण के लिए पुकार लगता है।
fgregg

1
यह पेपर उपयोगी हो सकता है: ह्वावान किम और शियाओबाई याओ, "पाइकोनोफिलेक्टिक प्रक्षेप पुन: परित्याग: डायसिमेट्रिक-मैपिंग विधि के साथ एकीकरण," इंटरनेशनल जर्नल ऑफ रिमोट सेंसिंग 31, सं। 21 (2010): 5657. Informaworld.com/10.1080/01431161.2010.496805
fgregg

1
आप जानते हैं, डैसिमेट्रिक मैपिंग अंततः पारिस्थितिक संक्रमण समस्या के रूप में होती है। के। इमाई का हालिया कार्य सहायक हो सकता है: pan.oxfordjournals.org/content/16/1/41.abstract
fgregg

जवाबों:


4

आप dasymetric मैपिंग पर Mitchel Langford के काम की जाँच करना चाह सकते हैं ।

वह वेल्स के जनसंख्या वितरण का प्रतिनिधित्व करने वाली आपदाओं का निर्माण करते हैं और उनके कुछ पद्धतिगत दृष्टिकोण यहां उपयोगी हो सकते हैं।

अद्यतन: आप जेरेमी मेनिस के काम पर भी नज़र डाल सकते हैं (विशेषकर ये दो लेख)।


2
धन्यवाद। यह कार्य डैसिमेट्रिक मैपिंग पर हाल के शोध के एक वेब में एक संकेतक प्रदान करता है।
व्हिबर

2

दिलचस्प सवाल। यहां एक सांख्यिकीय कोण से इस तक पहुंचने के लिए एक अस्थायी स्टैब है। मान लीजिए कि हम प्रत्येक क्षेत्र लिए जनसंख्या गणना निर्दिष्ट करने का एक तरीका लेकर आए हैं । इस संबंध को निम्नानुसार निरूपित करें:xji

zji=f(xji,β)

स्पष्ट रूप से, हम जो भी कार्यात्मक रूप पर लगाते हैं, वह वास्तविक संबंध के लिए सबसे अच्छा सन्निकटन होगा और इस प्रकार उपरोक्त समीकरण में त्रुटि को शामिल करने की आवश्यकता है। इस प्रकार, उपरोक्त बन जाता है:f(.)

zji=f(xji,β)+ϵji

कहाँ पे,

ϵjiN(0,σ2)

वितरण त्रुटि त्रुटि पर चित्रण प्रयोजनों के लिए है। यदि आवश्यक हो तो हम इसे उपयुक्त रूप में बदल सकते हैं।

हालाँकि, हमें सटीक अपघटन की आवश्यकता है । इस प्रकार, हमें त्रुटि शर्तों और फ़ंक्शन पर नीचे के रूप में एक बाधा डालने की आवश्यकता है :yjif(.)

iϵji=0

if(xji,β)=yj

की खड़ी वेक्टर दिखाता है द्वारा और की खड़ी नियतात्मक शर्तों द्वारा । इस प्रकार, हमारे पास:zjizjf(xji,β)fj

zjN(fj,σ2I)I(fje=yj)I((zjfj)e=0)

कहाँ पे,

e उपयुक्त आयामों में से एक वेक्टर है।

पहला संकेतक बाधा इस विचार को पकड़ता है कि नियतात्मक शब्दों का योग बराबर होना चाहिए और दूसरा इस विचार को कैप्चर करता है कि त्रुटि अवशेषों का योग 0 होना चाहिए।yj

मॉडल का चयन पेचीदा है क्योंकि हम देखे गए ठीक से कर रहे हैं। शायद, मॉडल चयन के लिए एक तरीका है उस मॉडल को चुनना जो सबसे कम त्रुटि वाले संस्करण को जन्म देता है यानी, वह जो सबसे कम का सबसे कम अनुमान देता है ।yjσ2

संपादित करें 1

कुछ और सोचने से उपरोक्त सूत्रीकरण को सरल बनाया जा सकता है क्योंकि इसमें आवश्यकता से अधिक अवरोध हैं।

zji=f(xji,β)+ϵji

कहाँ पे,

ϵjiN(0,σ2)

की खड़ी वेक्टर दिखाता है द्वारा और की खड़ी नियतात्मक शर्तों द्वारा । इस प्रकार, हमारे पास: जेड j ( एक्स जे मैं , β ) jzjizjf(xji,β)fj

zjN(fj,σ2I)I(zje=yj)

कहाँ पे,

e उपयुक्त आयामों में से एक वेक्टर है।

पर बाधा एक सटीक अपघटन सुनिश्चित करती है।zj


2
@ श्रीकांत धन्यवाद मैं इसी तरह की पंक्तियों के साथ सोच रहा था जब मैंने सवाल उठाया था और तब से एक जीएलएम ( रैखिक लिंक के साथ पॉसन वितरण ) और साथ ही कुछ अन्य मॉडलों का परीक्षण किया है । दुर्भाग्य से, यह अब किसी भी मॉडल की तरह दिखता है जो केवल लैंड कवर प्रकार पर आधारित है और अनुपात अच्छी तरह से काम नहीं करेगा: इन आंकड़ों का एक नमूना बताता है कि जनसंख्या पैटर्न एक बड़े स्थानिक संदर्भ पर निर्भर करता है। कम से कम, तो, हमें एक रैखिक मॉडल में स्थानिक रूप से पिछड़े हुए कोवरिएट्स को शामिल करना होगा।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.