आर में परिणाम औसत मॉडल की व्याख्या


11

मैं आर में मॉडल औसत का उपयोग करके कुछ डेटा के अपने विश्लेषण से रिपोर्ट करने और समझने की कोशिश कर रहा हूं।

मैं दिए गए चर पर माप की विधि के प्रभाव का विश्लेषण करने के लिए निम्नलिखित स्क्रिप्ट का उपयोग कर रहा हूं: यहां डेटासेट है: https://www.dropbox.com/s/u9un273gzw9o30u/VMT4.csv?dl=0

फिट किया जाने वाला मॉडल:

LM.1 <- gls(VMTf ~ turn+sex+method, na.action="na.fail", method = "ML",VMT4)

ड्रेजेज फुल मॉडल

require(MuMIn)
d=dredge(LM.1)
print(d)
coefficients(d)

पैरामीटर अनुमान प्राप्त करने के लिए सभी मॉडलों की सारांश जानकारी प्राप्त करें

summary(model.avg(d))

मुझे पता है कि या तो सभी मॉडल औसत (पूर्ण मॉडल औसत) हो सकते हैं या उनमें से केवल एक सबसेट (सशर्त औसत) हो सकता है। अब, मैं यह जानना चाहूंगा: जब पूर्ण या सशर्त औसत का उपयोग करना बेहतर होता है, तो इनफ़ेक्शन बनाने के लिए। वैज्ञानिक लेख के लिए मुझे इस सब की क्या रिपोर्ट करनी चाहिए? स्थिति औसत मॉडल के लिए Z मान और संबद्ध p का क्या अर्थ है?

मेरे सवालों की कल्पना करना आसान बनाने के लिए। यहाँ परिणाम तालिका है,

> summary(model.avg(d))# now, there are effects

Call:
model.avg(object = d)

Component model call: 
gls(model = VMT ~ <8 unique rhs>, data = VMT4, method = ML, na.action = 
 na.fail)

Component models: 
       df  logLik   AICc delta weight
1       4 -247.10 502.52  0.00   0.34
12      5 -246.17 502.83  0.31   0.29
13      5 -246.52 503.52  1.01   0.20
123     6 -245.60 503.88  1.36   0.17
(Null)  2 -258.62 521.33 18.81   0.00
3       3 -258.38 522.95 20.43   0.00
2       3 -258.60 523.39 20.88   0.00
23      4 -258.36 525.05 22.53   0.00

Term codes: 
method    sex   turn 
     1      2      3 

Model-averaged coefficients:  
(full average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)            42.63521    0.37170     0.37447 113.856  < 2e-16 ***
methodlight chamber    -1.05276    0.36098     0.36440   2.889  0.00386 ** 
methodthermal gradient -1.80567    0.36103     0.36445   4.955    7e-07 ***
sex2                    0.19023    0.29403     0.29548   0.644  0.51970    
turn                    0.05005    0.10083     0.10141   0.494  0.62165    

(conditional average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)             42.6352     0.3717      0.3745 113.856  < 2e-16 ***
methodlight chamber     -1.0528     0.3609      0.3643   2.890  0.00386 ** 
methodthermal gradient  -1.8058     0.3608      0.3642   4.958  7.1e-07 ***
sex2                     0.4144     0.3089      0.3119   1.328  0.18402    
turn                     0.1337     0.1264      0.1276   1.047  0.29492    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Relative variable importance: 
                     method sex  turn
Importance:          1.00   0.46 0.37
N containing models:    4      4    4

जवाबों:


5

ग्रुबर एट अल देखें। २०११, "पारिस्थितिकी और विकास में बहुउद्देशीय निष्कर्ष: चुनौतियां और समाधान" विकासवादी जीवविज्ञान २४: ६ ९९ -od११।

यह वास्तव में लक्ष्यों पर निर्भर करता है कि क्या आप पूर्ण या सशर्त डेटा का उपयोग करना चाहते हैं। मेरे क्षेत्र में हम मानदंड का उपयोग करेंगे, जैसे कि एआईसीसी यह निर्धारित करने के लिए कि कौन से मॉडल सबसे अधिक समर्थित हैं, फिर उन्हें अपने सशर्त सबसेट के रूप में उपयोग करें। फिर यह जानकारी दी जाएगी। उदाहरण के लिए, आपके पहले चार मॉडल एक दूसरे के 2 एआईसी इकाइयों के भीतर हैं, इसलिए वे सभी आपके सबसेट में शामिल होंगे। अन्य वहाँ से बाहर हैं (उच्च एआईसी) तो उनमें से जानकारी सहित वास्तव में आपके बीटा अनुमानों की गुणवत्ता को कम करेगा।


2
हालांकि आपके सुझाए गए उदाहरण में भी, कुछ ऐसे शब्द होंगे जो शायद चार "सर्वश्रेष्ठ" मॉडल में से दो में दिखाई देंगे। क्या आप उन दो गुणांक मानों, या दो मॉडल के लिए दो शून्य मान और दो शून्य मान लेते हैं जहां वे दिखाई नहीं देते हैं?
user2390246

5

मुझे लगता है कि पूर्ण और सशर्त औसत के बीच अंतर के बारे में आधार गलत है। एक औसत है जिसमें शून्य (पूर्ण) शामिल है और एक में शून्य (सशर्त) शामिल नहीं है। model.avg () कमांड के लिए मदद फ़ाइल से:

ध्यान दें

'सबसेट' (या 'सशर्त') केवल उन मॉडलों पर औसत होता है जहां पैरामीटर दिखाई देता है। एक विकल्प, 'पूर्ण' औसत मानता है कि प्रत्येक मॉडल में एक चर शामिल है, लेकिन कुछ मॉडल में संबंधित गुणांक (और इसके संबंधित संस्करण) शून्य पर सेट है। 'सब्मिट औसत' के विपरीत, इसमें मूल्य को शून्य से दूर करने की प्रवृत्ति नहीं है। 'पूर्ण' औसत एक प्रकार का संकोचन अनुमानक है और प्रतिक्रिया के लिए कमजोर संबंध वाले चरों के लिए वे 'सबसेट' अनुमानकों से छोटे हैं।

यदि आप केवल मॉडलों के सबसेट का उपयोग करना चाहते हैं (उदाहरण के लिए डेल्टा AIC के आधार पर), तो model.avg () में सबसेट तर्क का उपयोग करें। आप अभी भी सशर्त और पूर्ण अनुमान प्राप्त करेंगे, जब तक कि शामिल मॉडल में से कुछ में कुछ चर गायब होते हैं जो दूसरों के पास हैं।


हाँ। मैं सहमत हूँ। यही उचित व्याख्या है।
ecologist1234
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.