आर के साथ लगे एक नकारात्मक द्विपद प्रतिगमन में थीटा क्या है?


26

मुझे एक नकारात्मक द्विपद प्रतिगमन के विषय में एक प्रश्न मिला है: मान लीजिए कि आपके पास निम्नलिखित आदेश हैं:

require(MASS)
attach(cars)
mod.NB<-glm.nb(dist~speed)
summary(mod.NB)
detach(cars)

(ध्यान दें कि कारें एक डेटासेट है जो R में उपलब्ध है, और मुझे वास्तव में कोई परवाह नहीं है अगर यह मॉडल समझ में आता है।)

जो मैं जानना चाहता हूं वह यह है: मैं चर की व्याख्या कैसे कर सकता हूं theta(जैसा कि कॉल के नीचे दिया गया है summary)। क्या यह नेगबिन वितरण का आकार पैरामीटर है और क्या इसे तिरछेपन के माप के रूप में व्याख्या करना संभव है?


जवाबों:


17

हां, thetaनकारात्मक द्विपद वितरण का आकार पैरामीटर है, और नहीं, आप वास्तव में इसे तिरछेपन के माप के रूप में व्याख्या नहीं कर सकते। ज्यादा ठीक:

  • तिरछा मूल्य पर निर्भर करेगा theta, लेकिन यह भी मतलब पर
  • इसका कोई मूल्य नहीं है thetaकि आपको तिरछेपन की कमी की गारंटी होगी

यदि मैंने इसे गड़बड़ नहीं किया, तो नकारात्मक द्विपद प्रतिगमन में उपयोग किए जाने वाले mu/ thetaपैरामीरिजेशन में तिरछापन है

Skew(NB)=θ+2μθμ(θ+μ)=1+2μθμ(1+μθ)

इस संदर्भ में, आमतौर पर प्वासों बंटन के संबंध में overdispersion का एक उपाय के रूप में व्याख्या की है। नकारात्मक द्विपद का विचरण μ हैθ , तो θ वास्तव में अतिरिक्त परिवर्तनशीलता (जो होगा प्वासों की तुलना में नियंत्रित करता है μ ), और तिरछा नहीं।μ+μ2/θθμ


अब तक धन्यवाद! यह अच्छी मदद है ... लेकिन: मैं थीटा के उच्च या (निम्न) मूल्यों की व्याख्या कैसे कर सकता हूं? मैककौला की किताबों में सामान्यीकृत रैखिक मॉडल हैं जो किस्क की व्याख्या करने के लिए anscombe से इस पेपर का लिंक है। लेकिन दुर्भाग्य से मैं वास्तव में यह नहीं मिलता है। पेपर क्लारेमोंटमकेन.नेडू
मैथ /

आपको सिर्फ पहला पेज पढ़ना है। तो थीटा (या anscombe में k) नेगबिन वितरण का आकार पैरामीटर है और यह प्रबंधन करता है, यदि वितरण गामा (k -> 0) या पोइसन (k -> अनंत) के करीब है। लेकिन फिट होने का क्या मतलब है? मैं कारों के अनुमान के लिए थीटा की व्याख्या कैसे कर सकता हूं?
मार्कडॉलर

33

मुझे अपने मॉडलिंग काउंट डेटा कोर्स में मेरे एक छात्र द्वारा इस साइट पर भेजा गया था । नकारात्मक द्विपद मॉडल के बारे में बहुत गलत जानकारी है, और विशेष रूप से फैलाव सांख्यिकीय और फैलाव पैरामीटर के संबंध में लगता है।

फैलाव आँकड़ा, जो गणना मॉडल को अतिरिक्त फैलाव का संकेत देता है, पियरसन सांख्यिकी है जिसे डीईएफ़ द्वारा विभाजित किया गया है। स्थान या आकार पैरामीटर है। गणना मॉडल के लिए, स्केल पैरामीटर 1 पर सेट है। R औरμglmglm.nb θ

glm.nbऔर glmअसामान्य हैं कि वे फैलाव पैरामीटर को कैसे परिभाषित करते हैं। विचरण के रूप में दिया जाता है बजायμμ+μ2θμ+αμ2glm.nbglmglm.nbजाहिरा तौर पर मैक्कुलग एंड नेल्डर से अप्रत्यक्ष संबंध लिया, लेकिन नेल्डर (जो 1972 में GLM के सह-संस्थापक थे) ने 1993 में जेनस्टैट में अपना kk सिस्टम ऐड-ऑन लिखा था जिसमें उन्होंने तर्क दिया था कि सीधा संबंध पसंद किया जाता है। वह और उसकी पत्नी एरिज़ोना में हर दूसरे वर्ष के बारे में मुझे और मेरे परिवार को 1993 से पहले शुरू करते थे, जब तक वह मर नहीं गया। हमने इस पर पूरी तरह से चर्चा की, क्योंकि मैंने 1992 में स्टाटा और एक्सप्लोर सॉफ्टवेयर के लिए, और 1994 में एसएएस मैक्रो के लिए लिखे गए glm प्रोग्राम में सीधा संबंध रखा था।

nbinomialαθnbinomial


2
ϕcov(β^)=ϕ(XTŴ^X)1θμθ"आकार" -इसके बाद जो मुझे अनुचित नहीं लगता क्योंकि यह निश्चित रूप से आकार को प्रभावित करता है।
मोमो

थीटा की सीमा क्या है? क्या थीटा का एक से अधिक मूल्य होना जरूरी है?
News_is_Selection_Bias

2

ग्लैमर संदर्भ नकारात्मक द्विपद: यहाँ छवि विवरण दर्ज करें

विकिपीडिया नकारात्मक द्विपद 'r' glm का 'थीटा' है जिसका अर्थ है कि glm 'थीटा' आकार का पैरामीटर है। सरल शब्दों में, glm की 'थीटा' विफलताओं की संख्या है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.