बायेसियन glm में -values ​​को समझने में मेरी मदद करें


13

मैं यहां डेटा पर बायेसियन लॉग चलाने की कोशिश कर रहा हूं । मैं उपयोग कर रहा हूँ bayesglm()में armआर कोडिंग में पैकेज सीधा पर्याप्त है:

df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T)
library(arm)
model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df)

summary(model) निम्नलिखित आउटपुट देता है:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  0.10381    0.10240   1.014    0.311    
SEXMale      0.02408    0.09363   0.257    0.797    
HIGH        -0.27503    0.03562  -7.721 1.15e-14 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 2658.2  on 1999  degrees of freedom
Residual deviance: 2594.3  on 2000  degrees of freedom
AIC: 2600.3

कृपया मुझे इसके माध्यम से चलो। मैं समझता हूं कि यह कोड बहुत कमजोर पूर्व का उपयोग करता है (चूंकि मैं पूर्व साधनों को निर्दिष्ट नहीं कर रहा हूं) इसलिए आउटपुट व्यावहारिक रूप से वही होने वाला है यदि मैं glm()इसके बजाय उपयोग करता हूं bayesglm()। लेकिन आउटपुट अभी भी बायेसियन स्पिरिट में होना चाहिए, है ना? यहाँ -values ​​और -values क्या हैं ? क्या ये लगातार आक्रमण उपकरण नहीं हैं? क्या उनकी व्याख्या यहाँ अलग है?जेडpz


यह एक टिप्पणी है और एक उत्तर नहीं है, लेकिन यह वह है जो मुझे कुछ समझ में आएगा। आप अनुमान प्राप्त करते हैं कि संभवतः वे मान हैं जिनके लिए पश्च वितरण अधिकतम है। यह भी संभव हो सकता है कि वे सिर्फ पीछे के साधन हैं? यदि आप कर सकते हैं, तो बाहर की जाँच करें। लेकिन कोई भी बात नहीं है कि सटीक विवरण क्या हैं, एक बार जब आपके पास कुछ अनुमान होते हैं तो आप उन्हें सामान्य अनुमान / एसटीडी द्वारा परीक्षण कर सकते हैं। त्रुटि -> z- स्कोर प्रक्रिया जो काम करती है यदि पीछे का भाग एक सामान्य के करीब है (यह कुछ शर्तों के तहत एक सामान्य तक जाता है जो आमतौर पर पकड़ में आता है)।
एरिक

एरिक ... आप सही हैं: गुणांक वास्तव में पश्च घनत्व के साधन हैं। मेरा प्रश्न p- और z- मूल्यों के बारे में है। वे यहां क्या प्रतिनिधित्व करते हैं?
user3671

ठीक है। यदि आपके पास एक घनत्व है जो लगभग सामान्य रूप से वितरित किया जाता है, तो आप परीक्षण कर सकते हैं कि क्या इसका मतलब शून्य है = वितरण का औसत = मानक विचलन और मानक सामान्य वितरण के साथ तुलना करके। तब आप देखते हैं कि मानक सामान्य वितरण -> p- मान के तहत आपका मान या बड़ा मान कितना अयोग्य होगा। विवरण के लिए विकिपीडिया पर z- स्कोर देखें।
एरिक

सही है। लेकिन एक Bayesian सेटिंग में ऐसा करने से क्यों परेशान हैं? बेइज़ियन अनुमान में, यादृच्छिक पैरामीटर के बारे में बिंदु अनुमान मेरा सबसे अच्छा अनुमान है, इसलिए इसका परीक्षण करने की कोई आवश्यकता नहीं है। सबसे अधिक, मैं एक "विश्वसनीय अंतराल" को शामिल कर सकता हूं, जो लगातार "आत्मविश्वास अंतराल" के बराबर है, लेकिन जिसकी सांख्यिकीय व्याख्या बहुत अलग है। यह सारांश () आउटपुट के बारे में भ्रमित करने वाला हिस्सा है। आत्मा बायेसियन है, लेकिन आउटपुट अक्सरवादी है?
user3671

एक बिंदु यह है कि आपके द्वारा प्राप्त अनुमान अलग होगा, क्योंकि आपने पहले उपयोग किया था। और जबकि बिंदु अनुमान "सबसे अच्छा अनुमान" है यदि आप बायेसियन तरीके से दिखाना चाहते हैं कि किसी चीज का प्रभाव है तो आप यह दिखाने की कोशिश करेंगे कि विश्वसनीय अंतराल में शून्य नहीं है। जब आप एक समान माध्य और sd (asymptotically correct) के साथ एक सामान्य से पश्च को अनुमानित करते हैं तो (1-p / 2) विश्वसनीयता अंतराल शून्य से युक्त सबसे बड़ा सममित विश्वसनीयता अंतराल है, इसलिए आपका उत्तर मूल रूप से एक ही है। पी को ऊपर बताया गया है।
एरिक

जवाबों:


16

बड़ा अच्छा सवाल! यद्यपि बायेसियन पी मूल्यों , और हाथ पैकेज के लेखकों में से एक एक वकील है, जो आप अपने उत्पादन में देख रहे है नहीं एक बायेसियन पी-मूल्य। की कक्षा की जाँच करेंmodel

class(model)
"bayesglm" "glm"      "lm" 

और आप देख सकते हैं कि वर्ग बाइसग्लम चमक से विरासत में मिला है। इसके अलावा, बांह पैकेज की जांच एक बेज़लग्म ऑब्जेक्ट के लिए कोई विशिष्ट सारांश विधि नहीं दिखाती है। तो जब आप करते हैं

summary(model)

तुम वास्तव में कर रहे हो

summary.glm(model)

और परिणामों की लगातार व्याख्या हो रही है । यदि आप अधिक बायेसियन परिप्रेक्ष्य चाहते हैं तो भुजा में कार्य हैdisplay()


+1 शानदार जवाब! यह आर के साथ परेशानी है, बहुत सारे उच्च बुद्धिमान सांख्यिकीविद् हैं जो भयानक कोड लिखते हैं जो इस तरह के बारूदी सुरंगों को चारों ओर झूठ बोलते हैं।
बोगदानोविस्ट

यह डिजाइनरों के हिस्से पर एक जानबूझकर पसंद की तरह लगता है , बजाय एक निरीक्षण के।
एटिरेटू -

लिंक पढ़ने के बाद मैं इरादे से सहमत हूं, लेकिन उस मामले में सारांश () को केवल कॉल प्रदर्शन () को चेतावनी के बिना बकवास परिणाम देने के बजाय फिर से लागू किया जाना चाहिए था। जिस व्यक्ति ने यह प्रश्न पूछा है वह आर कोड के लिए फंस गया है जिसने आर के लिए उपयोगकर्ता मॉडल को तोड़ दिया है जो कि उनके द्वारा उपयोग की जाने वाली प्रत्येक अन्य वस्तु द्वारा स्थापित किया गया है। यह भयानक प्रोग्रामिंग अभ्यास है।
बोगदानोववादी

2
बहुत धन्यवाद, एटिरेटू। इससे एक और सवाल उठता है। प्रदर्शन () और सारांश () के बीच अंतर क्या है? यह मुझे लगता है कि पूर्व से आउटपुट केवल बाद वाले, कम दो कॉलम से आउटपुट है, और 2 अंकों तक गोल है। ऐसा प्रतीत होता है, गेलमैन के पद से आप ऊपर लिंक कर चुके हैं।
user3671

हाँ, और एंड्रयू जेलमैन के ब्लॉग पर चर्चा से ऐसा लगता है कि वे इसे हाथ के पैकेज के भविष्य के संस्करणों में ठीक कर देंगे।
एटिरेटू -
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.