जब मॉडल की संभावना शून्य से काफी अधिक नहीं होती है तो महत्व (GAM) प्रतिगमन गुणांक


10

मैं आर पैकेज गैंल्स का उपयोग करके एक जीएएम -आधारित प्रतिगमन चला रहा हूं और डेटा का शून्य-फुलाया बीटा वितरण मान रहा हूं । मेरे पास अपने मॉडल में केवल एक ही व्याख्यात्मक चर है, इसलिए यह मूल रूप से है mymodel = gamlss(response ~ input, family=BEZI):।

एल्गोरिथ्म मुझे माध्य ( ) में व्याख्यात्मक चर के प्रभाव के लिए गुणांक और लिए संबद्ध मान देता है , कुछ इस तरह है:μ(इनपुट)=0

Mu link function:  logit                                               
Mu Coefficients:                                                      
              Estimate  Std. Error  t value   Pr(>|t|)                  
(Intercept)  -2.58051     0.03766  -68.521  0.000e+00                  
input        -0.09134     0.01683   -5.428  6.118e-08

जैसा कि आप ऊपर दिए गए उदाहरण में देख सकते हैं, की परिकल्पना उच्च आत्मविश्वास के साथ खारिज कर दी गई है।(इनपुट)=0

मैं फिर अशक्त मॉडल चलाता हूं: null = gamlss(response ~ 1, family=BEZI)और एक संभावना-अनुपात परीक्षण का उपयोग करके संभावना की तुलना करें:

p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)).

कई मामलों में, मुझे तब भी मिलता है जब इनपुट पर गुणांक अत्यधिक महत्वपूर्ण होने की सूचना दी जाती है (ऊपर के रूप में)। मुझे यह काफी असामान्य लगता है - कम से कम यह मेरे अनुभव में कभी भी रैखिक या लॉजिस्टिक रिग्रेशन के साथ नहीं हुआ (वास्तव में, यह भी कभी नहीं हुआ जब मैं गेम के साथ शून्य-समायोजित गामा का उपयोग कर रहा था)।पी>0.05

मेरा सवाल है: क्या अब भी प्रतिक्रिया और इनपुट के बीच निर्भरता पर भरोसा कर सकता हूं जब यह मामला है?

जवाबों:


1

मुझे कोई तात्कालिक कारण नहीं दिखता कि यह GAM से संबंधित क्यों होना चाहिए। तथ्य यह है कि आप एक ही चीज के लिए दो परीक्षणों का उपयोग कर रहे हैं। चूंकि आंकड़ों में कोई पूर्ण निश्चितता नहीं है, इसलिए एक को एक महत्वपूर्ण परिणाम देना बहुत संभव है और दूसरे को नहीं।

शायद दो परीक्षणों में से एक बस अधिक शक्तिशाली है (लेकिन फिर शायद कुछ और मान्यताओं पर निर्भर करता है), या शायद एक महत्वपूर्ण एक आपकी एक-बीस प्रकार की त्रुटि है।

एक अच्छा उदाहरण परीक्षणों के लिए है कि क्या नमूने समान वितरण से आते हैं: आपके पास इसके लिए बहुत पैरामीट्रिक परीक्षण हैं (टी-टेस्ट एक है जिसका उपयोग इसके लिए किया जा सकता है: यदि साधन अलग-अलग हैं, तो वितरण होना चाहिए), और गैर-पैरामीटर भी लोगों: ऐसा हो सकता है कि पैरामीट्रिक एक महत्वपूर्ण परिणाम देता है और गैर-पैरामीटर एक नहीं करता है। यह हो सकता है क्योंकि पैरामीट्रिक परीक्षण की मान्यताओं, झूठे हैं, क्योंकि डेटा (मैं टाइप) बस असाधारण है, या क्योंकि नमूने का आकार पर्याप्त nonparametric परीक्षण अंतर को लेने के लिए के लिए नहीं है, या, अंत में, क्योंकि पहलू की आप वास्तव में क्या परीक्षण करना चाहते हैं (अलग-अलग वितरण) जो अलग-अलग परीक्षणों द्वारा जांचा जाता है, बस अलग-अलग होता है (अलग-अलग साधन <-> "उच्चतर" होने की संभावना)।

यदि एक परीक्षा परिणाम महत्वपूर्ण परिणाम दिखाता है, और दूसरा केवल थोड़ा गैर-महत्वपूर्ण है, तो मुझे बहुत चिंता नहीं होगी।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.