यह मुद्दा हर समय अपने बदसूरत सिर को पीछे करने के लिए लगता है, और मैं इसे आंकड़ों और विवेक की अपनी समझ के लिए इसे खत्म करने की कोशिश कर रहा हूं!)।
सामान्य रैखिक मॉडल (टी-टेस्ट, एनोवा, प्रतिगमन आदि) की धारणाओं में "सामान्यता की धारणा" शामिल है, लेकिन मैंने पाया है कि यह शायद ही कभी स्पष्ट रूप से वर्णित है।
मैं अक्सर आँकड़ों की पाठ्यपुस्तकों / मैनुअल / इत्यादि के बारे में बताता हूं कि "सामान्यता की धारणा" प्रत्येक समूह (यानी, श्रेणीबद्ध एक्स चर) पर लागू होती है , और हमें प्रत्येक समूह के लिए सामान्यता से प्रस्थान की जांच करनी चाहिए ।
प्रश्न :
क्या धारणा Y के मूल्यों या Y के अवशेषों को संदर्भित करती है ?
किसी विशेष समूह के लिए , क्या वाई मूल्यों के एक दृढ़ता से गैर-सामान्य वितरण (जैसे, तिरछा) होना संभव है, लेकिन वाई के अवशेषों का लगभग (या कम से कम अधिक सामान्य) वितरण ?
अन्य स्रोतों का वर्णन है कि धारणा मॉडल के अवशेषों से संबंधित है (ऐसे मामलों में जहां समूह हैं, जैसे टी-टेस्ट / एनोवा), और हमें इन अवशेषों की सामान्यता के प्रस्थान की जांच करनी चाहिए (यानी, केवल QQ प्लॉट / परीक्षण चलाने)।
के लिए बच गया की सामान्य करता है मॉडल के लिए बच गया की सामान्य मतलब समूहों ? दूसरे शब्दों में, क्या हमें केवल मॉडल अवशिष्ट (कई ग्रंथों में निर्देशों के विपरीत) की जांच करनी चाहिए?
इसे एक संदर्भ में रखने के लिए, इस काल्पनिक उदाहरण पर विचार करें:
- मैं दो आबादी (एक्स) के बीच पेड़ की ऊंचाई (वाई) की तुलना करना चाहता हूं।
- एक आबादी में वाई का वितरण सही ढंग से तिरछा है (यानी, अधिकांश पेड़ छोटे, बहुत कम), जबकि दूसरा वस्तुतः सामान्य है
- सामान्य रूप से वितरित जनसंख्या में ऊँचाई कुल मिलाकर अधिक है (सुझाव है कि 'वास्तविक' अंतर हो सकता है)।
- डेटा के परिवर्तन से पहली आबादी के वितरण में पर्याप्त सुधार नहीं होता है।
सबसे पहले, क्या यह अलग-अलग ऊंचाई के वितरण को देखते हुए समूहों की तुलना करने के लिए वैध है?
मैं यहां "सामान्यता की धारणा" कैसे कर सकता हूं? याद रखें कि एक जनसंख्या में ऊँचाई सामान्य रूप से वितरित नहीं होती है। क्या मैं दोनों आबादी के लिए अलग-अलग या मॉडल (टी-टेस्ट) के लिए अवशेषों की जांच करता हूं ?
कृपया उत्तरों में संख्या के अनुसार प्रश्नों का संदर्भ दें, अनुभव ने मुझे दिखाया है कि लोग खो गए हैं या आसानी से टूट गए हैं (विशेषकर मुझे!)। ध्यान रखें मैं कोई सांख्यिकीविद् नहीं हूँ; हालांकि मेरे पास एक उचित वैचारिक (यानी, तकनीकी नहीं!) आंकड़ों की समझ है।
पुनश्च, मैंने अभिलेखागार की खोज की है और निम्नलिखित सूत्र पढ़े हैं जिन्होंने मेरी समझ को मजबूत नहीं किया है:
- ANOVA धारणा सामान्यता / अवशिष्टों का सामान्य वितरण
- अवशेष बनाम नमूना डेटा की सामान्यता; टी-टेस्ट के बारे में क्या?
- क्या सामान्यता परीक्षण 'अनिवार्य रूप से बेकार' है?
- परीक्षण सामान्यता
- वितरण की सामान्यता का आकलन करना
- अवशेषों को सामान्य रूप से वितरित किए जाने की पुष्टि करने के लिए मैं किन परीक्षणों का उपयोग करता हूं?
- जब कोलमोगोरोव-स्मिर्नोव परीक्षण पैरामीट्रिक परीक्षण के अवशेषों के लिए महत्वपूर्ण है, लेकिन तिरछापन और कुर्तोसिस सामान्य दिखते हैं तो क्या करें?