शास्त्रीय डेटा विश्लेषण समस्या पर विचार करें जहां आपके पास एक परिणाम और यह किस तरह से कई भविष्यवक्ताओं । यहां ध्यान में रखने वाला मूल प्रकार यह है
कुछ समूह-स्तरीय परिणाम हैं जैसे शहर में अपराध दर ।
भविष्यवक्ताओं इस तरह शहर के जनसांख्यिकीय सुविधाओं के रूप में समूह स्तर विशेषताएं हैं ।
मूल लक्ष्य एक प्रतिगमन मॉडल फिट करना है (शायद यादृच्छिक प्रभावों के साथ लेकिन अभी के लिए भूल जाओ):
क्या कुछ तकनीकी कठिनाई उत्पन्न होती है जब भविष्यवक्ताओं में से एक (या अधिक) एक सर्वेक्षण का परिणाम होता है जिसमें प्रत्येक इकाई के लिए अलग-अलग नमूना आकार होते हैं? उदाहरण के लिए, मान लीजिए शहर के लिए एक सारांश स्कोर है उस शहर से व्यक्तियों के उदाहरण से औसत प्रतिक्रिया है लेकिन नमूना आकार इन औसत पर आधारित थे बेतहाशा अलग हैं:
चूंकि भविष्यवक्ता चर सभी का एक ही अर्थ नहीं है, कुछ अर्थों में, प्रत्येक शहर के लिए, मुझे डर है कि एक प्रतिगमन मॉडल में इन चरों पर कंडीशनिंग के रूप में हालांकि वे सभी "समान बनाए गए" कुछ भ्रामक इनफ़ॉर्मेशन पैदा कर सकते हैं।
क्या इस प्रकार की समस्या का कोई नाम है? यदि हां, तो क्या इस पर शोध किया जाना है?
मेरा विचार है कि इसे त्रुटि के साथ मापा गया एक पूर्वसूचक चर के रूप में समझो और इन पंक्तियों के साथ कुछ करो लेकिन माप त्रुटियों में विषमता है, ताकि यह बहुत जटिल हो। मैं इस गलत तरीके के बारे में सोच सकता था या इसे इससे अधिक जटिल बना सकता था लेकिन यहां कोई भी चर्चा उपयोगी होगी।