गैरी किंग का काम, विशेष रूप से उनकी पुस्तक "ए सॉल्यूशन टू द इकोलॉजिकल इंफ़ेक्शन प्रॉब्लम" (पहले दो अध्याय यहाँ उपलब्ध हैं ), रुचि का होगा (साथ ही साथ वह सॉफ्टवेयर जो वह पारिस्थितिक इंजेक्शन के लिए उपयोग करता है)। राजा अपनी पुस्तक में दिखाते हैं कि कैसे समग्र डेटा का उपयोग करके प्रतिगमन डेटा के अनुमानों में सुधार किया जा सकता है जो उपलब्ध समुच्चय के आधार पर निचले स्तर के समूहीकरणों की जाँच करते हैं। यह तथ्य कि आपके डेटा ज्यादातर श्रेणीबद्ध समूह हैं, उन्हें इस तकनीक के लिए उत्तरदायी बनाता है। (हालांकि मूर्ख मत बनो, यह उतना सर्वव्यापी समाधान नहीं है जितना कि आप उम्मीद कर सकते हैं कि शीर्षक दिया गया है!) अधिक वर्तमान काम मौजूद है, लेकिन किंग्स बुक शुरू करने के लिए सबसे अच्छी जगह है।
एक और संभावना सिर्फ डेटा के संभावित सीमा (नक्शे या ग्राफ़ में) का प्रतिनिधित्व करने के लिए होगी। इसलिए उदाहरण के लिए, आप कुल स्तर (5,000 पुरुष और 5,000 महिलाएं) पर बताए गए यौन वितरण हो सकते हैं, और आप जानते हैं कि यह कुल स्तर 9,000 और 1,000 व्यक्तियों की 2 अलग-अलग छोटी क्षेत्र इकाइयों को सम्मिलित करता है। आप इसके बाद फ़ॉर्म की आकस्मिक तालिका के रूप में इसका प्रतिनिधित्व कर सकते हैं;
Men Women
Unit1 ? ? 9000
Unit2 ? ? 1000
5000 5000
यद्यपि आपके पास निचले स्तर के एकत्रीकरण के लिए कक्षों में जानकारी नहीं है, सीमांत योगों से हम प्रत्येक सेल के लिए न्यूनतम या अधिकतम संभावित मूल्यों का निर्माण कर सकते हैं। तो, इस उदाहरण में Men X Unit1
सेल केवल 4,000 और 5,000 में मान ले सकता है (कभी-कभी सीमांत वितरण अधिक असमान होते हैं जितना संभव हो कोशिकाओं के अंतराल छोटे होते हैं)। जाहिरा तौर पर मेज की सीमा प्राप्त करना मेरे द्वारा अपेक्षित होने से ज्यादा कठिन है ( डोबरा और फेनबर्ग, 2000 ), लेकिन ऐसा प्रतीत होता है कि एक फ़ंक्शन eiPack
आर में पुस्तकालय में उपलब्ध है ( लाउ एट अल।, 2007, पृष्ठ 43 )।
समग्र स्तर के डेटा के साथ बहुभिन्नरूपी विश्लेषण मुश्किल है, क्योंकि इस प्रकार के डेटा के साथ एकत्रीकरण पूर्वाग्रह अनिवार्य रूप से होता है। (संक्षेप में, मैं सिर्फ एकत्रीकरण पूर्वाग्रह का वर्णन करूंगा कि कई अलग-अलग व्यक्तिगत स्तर की डेटा जनरेटिंग प्रक्रियाएँ कुल स्तर के संघों में परिणत हो सकती हैं) अमेरिकन सोशियोलॉजिकल रिव्यू में लेखों की एक श्रृंखला 1970 में विषयों के लिए मेरे पसंदीदा संदर्भों में से कुछ हैं (फायरबाख, 1978; हैमोंड, 1973; हन्नान और बुरुस्टीन, 1974) हालांकि इस विषय पर कैनोनिकल स्रोत हो सकते हैं (Fotheringham & Wong, 1991; ओपिनशॉ, 1984; रॉबिन्सन, 1950) । मुझे लगता है कि संभावित सीमाओं का प्रतिनिधित्व करना जो डेटा ले सकता है संभावित रूप से भयावह हो सकता है, हालांकि आप बहुभिन्नरूपी विश्लेषण के संचालन के लिए कुल डेटा की सीमाओं से बहुत प्रभावित हैं। हालांकि सामाजिक विज्ञानों में इसे करने से किसी को नहीं रोका जाता है, हालांकि (बेहतर या बदतर के लिए!)
नोट, (जैसा कि चार्ली ने टिप्पणियों में कहा था) कि राजा के "समाधान" ने क्रिटिसिज्म (एंसलिन एंड चो, 2002; फ्रीडमैन एट अल।, 1998) की उचित मात्रा में राहत पाई है। यद्यपि ये क्रिटिसिज्म किंग्स मैथड के गणित के बारे में नहीं कहे जाते हैं, लेकिन उन स्थितियों के संबंध में जो किंग की पद्धति अभी भी एग्रीगेशन बायस के लिए जिम्मेदार नहीं है (और मैं फ्रीडमैन और एंसलिन दोनों से सहमत हूं कि डेटा के लिए किन स्थितियों में सामाजिक विज्ञान अभी भी संदिग्ध है कि राजा की मान्यताओं को पूरा करने वाले लोगों की तुलना में कहीं अधिक सामान्य हैं)। यह आंशिक रूप से यही कारण है कि मैं बस सीमा की जांच करने का सुझाव देता हूं (इसमें कुछ भी गलत नहीं है), लेकिन ऐसे डेटा से व्यक्तिगत स्तर के सहसंबंधों के बारे में अनुमान लगाने से विश्वास की अधिक छलांग लगती है जो अंततः अधिकांश स्थितियों में अनुचित हैं।
उद्धरण
- एनसेलिन, एल। और डब्ल्यूकेटी चो (2002)। स्थानिक प्रभाव और पारिस्थितिक इंजेक्शन। राजनीतिक विश्लेषण 10 (3): 276-297।
- डोबरा ए। और एसई फ़ेनबर्ग (2000)। सीमांत योगों और डीकोप्रोजेक्टिव ग्राफ दिए गए आकस्मिक तालिकाओं में सेल प्रविष्टियों के लिए सीमा। नेशनल एकेडमी ऑफ साइंसेज 97 (22) की कार्यवाही : 11885-11892
- फायरबाघ, जी। (1978)। कुल डेटा से व्यक्तिगत संबंधों को संदर्भित करने के लिए एक नियम। अमेरिकन सोशियोलॉजिकल रिव्यू 43 (4): 557-572
- Fotheringham, AS & DW वोंग (1991)। बहुभिन्नरूपी सांख्यिकीय विश्लेषण में परिवर्तनीय क्षेत्रीय इकाई समस्या। पर्यावरण और योजना A 23 (7): 1025-1044
- फ्रीडमैन, डीए, एसपी क्लेन, एम। ओस्टलैंड, और एमआर रॉबर्ट्स (1998)। समीक्षा की गई रचनाएँ: जी। किंग द्वारा पारिस्थितिक संक्रमण की समस्या का समाधान। जर्नल ऑफ़ द अमेरिकन स्टैटिस्टिकल एसोसिएशन 93 (444): 1518-1522। ( यहां पीडीएफ )
- हैमंड, जेएल (1973) पारिस्थितिक सहसंबंधों में त्रुटि के दो स्रोत। अमेरिकन सोशियोलॉजिकल रिव्यू 38 (6): 764-777
- हन्नान, एमटी और एल। बर्टस्टीन (1974)। समूहीकृत टिप्पणियों से अनुमान। अमेरिकन सोशियोलॉजिकल रिव्यू 39 (3): 374-392
- किंग जी। (1997)। पारिस्थितिक हस्तक्षेप समस्या का समाधान: एग्रीगेट डेटा से व्यक्तिगत व्यवहार का पुनर्निर्माण । प्रिंसटन: प्रिंसटन यूनिवर्सिटी प्रेस।
- लाउ ओ।, आरटी मूर और एम। केलरमैन (2007)। eiPack: RXC पारिस्थितिक आविष्कार और उच्च-आयाम डेटा प्रबंधन। आर न्यूज़ 7 (2): 43-47
- ओपेनशॉ, एस। (1984)। परिवर्तनीय क्षेत्रीय इकाई समस्या । नॉर्विच: जियो बुक्स। ( यहां पीडीएफ )
- रॉबिन्सन, डब्ल्यूएस (1950)। पारिस्थितिक सहसंबंध और व्यक्तियों का व्यवहार। अमेरिकन सोशियोलॉजिकल रिव्यू 15 (3): 351-357। ( यहां पीडीएफ )