क्या मैं लॉग ऑन लिंक फ़ंक्शन के साथ जीएलएम सामान्य वितरण का उपयोग कर सकता हूं DV जो पहले ही लॉग ट्रांसफ़ॉर्म हो चुका है?
हाँ; यदि मान्यताओं को उस पैमाने पर संतुष्ट किया जाता है
क्या प्रसरण समरूपता परीक्षण सामान्य वितरण का उपयोग करने के लिए पर्याप्त है?
विचरण की समानता सामान्यता क्यों होगी?
क्या अवशिष्ट जाँच प्रक्रिया लिंक फ़ंक्शन मॉडल को सही ठहराने के लिए सही है?
आपको अपनी मान्यताओं की उपयुक्तता की जांच करने के लिए हिस्टोग्राम और फिट टेस्ट दोनों का उपयोग करने से सावधान रहना चाहिए:
1) सामान्यता का आकलन करने के लिए हिस्टोग्राम का उपयोग करने से सावधान रहें । (इसके अलावा यहां )
संक्षेप में, कुछ के रूप में सरलता पर निर्भर करता है कि आप अपने विकल्प के रूप में चुन सकते हैं, या यहाँ तक कि केवल बिन सीमा के स्थान पर, डेटा के आकार के काफी भिन्न इंप्रेशन प्राप्त करना संभव है:
यह एक ही डेटा सेट के दो हिस्टोग्राम हैं। कई अलग-अलग द्वैध का उपयोग करना यह देखने में उपयोगी हो सकता है कि क्या छाप उसके प्रति संवेदनशील है।
2) यह निष्कर्ष निकालने के लिए फिट परीक्षणों की अच्छाई का उपयोग करने से सावधान रहें कि सामान्यता की धारणा उचित है। औपचारिक परिकल्पना परीक्षण वास्तव में सही प्रश्न का उत्तर नहीं देते हैं।
उदाहरण के लिए आइटम 2 के तहत लिंक देखें । यहां
विचरण के बारे में, जो समान डेटासेट का उपयोग करते हुए कुछ पत्रों में उल्लेख किया गया था "क्योंकि वितरण में सजातीय संस्करण थे एक जीएसएम के साथ एक गौसियन वितरण का उपयोग किया गया था"। यदि यह सही नहीं है, तो मैं वितरण का औचित्य या निर्णय कैसे कर सकता हूं?
सामान्य परिस्थितियों में, सवाल यह नहीं है कि क्या मेरी त्रुटियां (या सशर्त वितरण) सामान्य हैं? - वे नहीं होंगे, हमें जांचने की भी जरूरत नहीं है। एक और अधिक प्रासंगिक सवाल है 'गैर-सामान्यता की डिग्री कितनी बुरी तरह से मेरे प्रभाव को प्रभावित करती है? "
मैं एक कर्नेल घनत्व अनुमान या सामान्य QQplot (अवशिष्ट बनाम सामान्य स्कोर की साजिश) का सुझाव देता हूं। यदि वितरण यथोचित सामान्य लगता है, तो आपको चिंता करने की जरूरत नहीं है। वास्तव में, यहां तक कि जब यह स्पष्ट रूप से गैर-सामान्य है, तब भी यह बहुत ज्यादा मायने नहीं रखता है, आप जो करना चाहते हैं उसके आधार पर (सामान्य भविष्यवाणी अंतराल वास्तव में सामान्यता पर निर्भर करेगा, उदाहरण के लिए, लेकिन कई अन्य चीजें बड़े नमूना आकारों पर काम करेंगी )
बड़े नमूनों में, पर्याप्त रूप से, सामान्य रूप से सामान्यता कम और कम महत्वपूर्ण हो जाती है (पीआई के अलावा जैसा कि ऊपर उल्लेख किया गया है), लेकिन सामान्यता को अस्वीकार करने की आपकी क्षमता अधिक से अधिक हो जाती है।
संपादित करें: विचरण की समानता के बारे में बात यह है कि वास्तव में बड़े नमूनों के आकार में भी आपके इंफ़ेक्शन को प्रभावित किया जा सकता है । लेकिन आप शायद इस बात का आकलन न करें कि परिकल्पना परीक्षणों द्वारा या तो। विचरण धारणा को गलत करना एक ऐसा मुद्दा है जो आपके ग्रहण किए गए वितरण का है।
मैंने पढ़ा है कि एक अच्छे फिट के लिए मॉडल के लिए स्केलेड डेवलेपमेंट Np के आसपास होना चाहिए?
जब आप एक सामान्य मॉडल को फिट करते हैं, तो इसका एक पैमाना पैरामीटर होता है, इस स्थिति में यदि आपका वितरण सामान्य नहीं होता है, तो भी यह एनपीपी के बारे में होगा।
आपकी राय में लॉग लिंक के साथ सामान्य वितरण एक अच्छा विकल्प है
यह जानने की निरंतर अनुपस्थिति में कि आप क्या माप रहे हैं या आप किस चीज के लिए प्रयोग कर रहे हैं, मैं अभी भी न्याय नहीं कर सकता कि क्या GLM के लिए एक और वितरण का सुझाव देना है, और न ही आपके संदर्भों के लिए सामान्यता कितनी महत्वपूर्ण हो सकती है।
हालाँकि, यदि आपकी अन्य धारणाएँ भी वाजिब हैं (रैखिकता और समानता की समानता को कम से कम जांचा जाना चाहिए और निर्भरता के संभावित स्रोतों पर विचार किया जाना चाहिए), तो ज्यादातर परिस्थितियों में मैं CI का उपयोग करने और गुणांक या विपरीत परिणामों पर परीक्षण करने जैसी चीजों को करने में बहुत सहज होगा। - उन अवशेषों में तिरछापन की केवल बहुत कम छाप है, जो कि, भले ही यह एक वास्तविक प्रभाव है, उन प्रकार के अनुमानों पर कोई ठोस प्रभाव नहीं होना चाहिए।
संक्षेप में, आपको ठीक होना चाहिए।
(जबकि एक अन्य वितरण और लिंक फ़ंक्शन फिट के संदर्भ में थोड़ा बेहतर कर सकता है, केवल प्रतिबंधित परिस्थितियों में वे भी अधिक समझ में आने की संभावना होगी।)