नकारात्मक-द्विपद जीएलएम बनाम लॉग-ट्रांसफ़ॉर्मिंग काउंट डेटा: बढ़ी हुई टाइप I त्रुटि दर


18

आप में से कुछ ने इस अच्छे पेपर को पढ़ा होगा:

ओ'हारा आरबी, कोटज़ डीजे (2010) गिनती डेटा लॉग-ट्रांसफ़ॉर्म न करें। पारिस्थितिकी और विकास में विधियाँ 1: 118–122। klick

अनुसंधान के अपने क्षेत्र में (इकोटॉक्सीकोलॉजी) हम खराब प्रतिकृति प्रयोगों के साथ काम कर रहे हैं और जीएलएम व्यापक रूप से उपयोग नहीं किए जाते हैं। इसलिए मैंने ओ'हारा और कोटेज़ (2010) के समान अनुकरण किया, लेकिन पारिस्थितिक विषैले डेटा की नकल की।

पावर सिमुलेशन :

मैंने एक नियंत्रण समूह ( ) और 5 उपचार समूहों ( μ 1 - 5 ) के साथ एक भाज्य डिजाइन से डेटा का अनुकरण किया । उपचार 1 में बहुतायत नियंत्रण के समान था ( μ 1 = μ c ), उपचार में बहुतायत 2-5 नियंत्रण में बहुतायत का आधा था ( μ 2 - 5 = 0.5 μ c )। सिमुलेशन के लिए मैं नमूना आकार (3,6,9,12) और नियंत्रण समूह (2, 4, 8, ..., 1024) में प्रचुरता। नियत फैलाव पैरामीटर ( 91 = 3.91) के साथ बहुतायत एक नकारात्मक द्विपद वितरण से तैयार की गई थीμसीμ1-5μ1=μसीμ2-5=0.5μसीθ=3.91)। एक नकारात्मक द्विपद जीएलएम और एक गाऊसी जीएलएम + लॉग-ट्रांसफ़ॉर्म डेटा का उपयोग करके 100 डेटासेट उत्पन्न और विश्लेषण किए गए थे।

परिणाम अपेक्षित हैं: जीएलएम में अधिक शक्ति है, खासकर जब कई जानवरों का नमूना नहीं लिया गया था। यहाँ छवि विवरण दर्ज करें कोड यहाँ है।

टाइप I एरर :

आगे मैंने टाइप वन एरर को देखा। ऊपर के रूप में सिमुलेशन किया गया था, हालांकि सभी समूहों में समान बहुतायत थी ( )।μसी=μ1-5

हालांकि, परिणाम उम्मीद के यहाँ छवि विवरण दर्ज करें मुताबिक नहीं हैं: नकारात्मक द्विपद जीएलएम ने एलएम + परिवर्तन की तुलना में अधिक टाइप-आई त्रुटि दिखाई। उम्मीद के मुताबिक अंतर बढ़ते नमूने के आकार के साथ गायब हो गया। कोड यहाँ है।

सवाल:

Lm + परिवर्तन की तुलना में टाइप-आई त्रुटि क्यों बढ़ी है?

यदि हमारे पास खराब डेटा (छोटा नमूना आकार, कम बहुतायत (कई शून्य)) है, तो क्या हमें lm + परिवर्तन का उपयोग करना चाहिए? छोटे नमूने आकार (2-4 प्रति उपचार) ऐसे प्रयोगों के लिए विशिष्ट हैं और इन्हें आसानी से नहीं बढ़ाया जा सकता है।

हालांकि, नकारात्मक। बिन। GLM को इस डेटा के लिए उचित माना जा सकता है, lm + परिवर्तन हमें टाइप 1 त्रुटियों से बचा सकता है।


1
आपके मुख्य प्रश्न का उत्तर नहीं, लेकिन पाठकों के लिए कुछ ध्यान देने योग्य: जब तक आप वास्तविक प्रकार I त्रुटि को दो प्रक्रियाओं के बराबर नहीं बनाते हैं, शक्ति की तुलना करने से कोई मतलब नहीं है; मैं हमेशा अपने टाइप I एरर को उठाकर लोअर वन (इस मामले में लो लॉग्स और नॉर्मल एक को फिट करने के लिए) को उच्चतर बना सकता हूं। दूसरी ओर, यदि आप विशेष स्थिति (नमूना आकार, बहुतायत) निर्दिष्ट करते हैं, तो आप टाइप कर सकते हैं I त्रुटि दर (उदाहरण के लिए अनुकरण), और इसलिए वांछित प्रकार I त्रुटि दर को प्राप्त करने के लिए परीक्षण करने के लिए नाममात्र दर क्या है। , इसलिए उनकी शक्ति तुलनीय हो जाती है।
Glen_b -Reinstate Monica

क्या 100 प्लॉट सेट में आपके प्लॉट्स में y- एक्सिस वैल्यू औसत है?
छायाकार

मुझे अपनी टिप्पणी स्पष्ट करनी चाहिए: उस मामले में जहां आँकड़े स्वाभाविक रूप से असतत हैं, आपके पास टाइप I त्रुटि दर का सही नियंत्रण नहीं है, लेकिन आप आम तौर पर टाइप I त्रुटि दरों को काफी करीब कर सकते हैं। ऐसी स्थितियों में जहाँ आप उन्हें एक साथ तुलना करने के लिए पर्याप्त रूप से पास नहीं कर सकते हैं, उन्हें तुलना करने का एकमात्र तरीका यादृच्छिक परीक्षणों के साथ है।
Glen_b -Reinstate Monica

@ssdecontrol: नहीं, यह केवल डेटासेट का अनुपात (100 में से) है जहां p < α
EDi

1
दो मुद्दे हैं: (i) यह है कि सन्निकटन विषम हैं लेकिन अनन्तता नहीं है, इसलिए सन्निकटन सिर्फ इतना है कि, एक सन्निकटन - यह एक मुद्दा होगा कि क्या कोई असंगति थी या नहीं, और एक महत्व का स्तर होगा नाममात्र एक के अलावा (लेकिन अगर यह निरंतर है तो यह कुछ ऐसा है जिसे आप समायोजित कर सकते हैं); (ii) इसमें असुविधा का मुद्दा है, जो आपको इसके लिए समायोजित करने पर सटीक महत्व स्तर प्राप्त करने से रोकता है। n
Glen_b -Reinstate Monica

जवाबों:


17

यह एक अत्यंत रोचक समस्या है। मैंने आपके कोड की समीक्षा की और तुरंत कोई स्पष्ट टाइपो नहीं मिला।

मैं आपको इस सिमुलेशन को फिर से देखना चाहूंगा लेकिन समूहों के बीच विषमता के बारे में अनुमान लगाने के लिए अधिकतम संभावना परीक्षण का उपयोग करूंगा । यह एक अशक्त मॉडल refitting शामिल है, ताकि आप के अनुमान प्राप्त कर सकते हैं समूहों के बीच दरों में एकरूपता की रिक्त परिकल्पना के तहत। मुझे लगता है कि यह आवश्यक है, क्योंकि नकारात्मक द्विपद मॉडल है नहीं एक रेखीय मॉडल (दर रैखिक parameterized है, लेकिन θ रों नहीं हैं)। इसलिए मुझे यकीन नहीं है कि तर्क सही अनुमान प्रदान करता है।θθdrop1

लीनियर मॉडल के अधिकांश परीक्षणों में आपको अशक्त परिकल्पना के तहत मॉडल को फिर से स्थापित करने की आवश्यकता नहीं होती है। ऐसा इसलिए है क्योंकि आप ज्यामितीय ढलान (स्कोर परीक्षण) की गणना कर सकते हैं और पैरामीटर अनुमानों का अनुमान लगाकर चौड़ाई (वाल्ड टेस्ट) का अनुमान लगा सकते हैं और केवल वैकल्पिक परिकल्पना के तहत अनुमानित सहसंयोजक।

चूंकि नकारात्मक द्विपद रैखिक नहीं है, मुझे लगता है कि आपको एक अशक्त मॉडल फिट करने की आवश्यकता होगी।

संपादित करें:

मैंने कोड संपादित किया और निम्नलिखित मिला: यहाँ छवि विवरण दर्ज करें

यहां संपादित कोड: https://github.com/aomidpanah/simulations/blob/master/negativeBinomialML.r


लेकिन मुझे लगता है कि drop1() यह आंतरिक रूप से अशक्त मॉडल को फिर से फिट करता है ...
बेन बोल्कर

4
glm.nbθ रों ईएम कलन विधि का उपयोग का अनुमान है। drop1नकारात्मक द्विपद के लिए कोई डिफ़ॉल्ट विधि नहीं है। हालाँकि, logLikफ़ंक्शन करता है (देखें getS3method('logLik', 'negbin')। मैंने ओपी का कोड तय किया है और दिखाया है कि ऐसा करने से यह अनुमान लगता है कि यह नल के नीचे पॉइज़न मॉडल के समान है (जो अभी भी अन्य समस्याओं के कारण एक महत्वपूर्ण अंशांकन मुद्दा है)।
एडम

फिर से +1 करना चाहते हैं लेकिन मैं नहीं कर सकता। अच्छा लगा।
बेन बोल्कर

धन्यवाद! मैं तो बस दोनों के कोड देखा drop1()और lrtest()। आप सही हैं, drop1.glmउपयोग करता है glm.fitजो गलत अवतरण देता है। पता नहीं था कि हम के drop1()साथ उपयोग नहीं कर सकते हैं glm.nb()!
ईडीआई

तो नकारात्मक द्विपद मॉडल में विशिष्ट स्कोर और वाल्ड परीक्षण अमान्य हैं?
छायाकार

8

ओ'हारा और कोटेज़ पेपर (मेथड्स इन इकोलॉजी एंड एवोल्यूशन 1: 118–122) चर्चा के लिए एक अच्छा शुरुआती बिंदु नहीं है। मेरी सबसे गंभीर चिंता सारांश के बिंदु 4 में दावा है:

हमने पाया कि परिवर्तनों ने खराब प्रदर्शन किया, सिवाय इसके। । .. क्वासी-पॉइसन और नकारात्मक द्विपद मॉडल ... [दिखाया गया] थोड़ा पूर्वाग्रह।

मतलब λθλ कि जांच की थी, अत्यधिक सकारात्मक तिरछा है। फिट किए गए सामान्य वितरण के साधन लॉग (y + c) (c ऑफसेट ऑफ़ है) के पैमाने पर हैं, और अनुमान E (लॉग (y + c)) हैं। यह वितरण, y के वितरण की तुलना में सममित के बहुत करीब है। ।

λ

निम्नलिखित आर कोड बिंदु दिखाता है:

x <- rnbinom(10000, 0.5, mu=2)  
## NB: Above, this 'mu' was our lambda. Confusing, is'nt it?
log(mean(x+1))
[1] 1.09631
log(2+1)  ## Check that this is about right
[1] 1.098612

mean(log(x+1))
[1] 0.7317908

या कोशिश करें

log(mean(x+.5))
[1] 0.9135269
mean(log(x+.5))
[1] 0.3270837

जिस पैमाने पर मापदंडों का अनुमान लगाया जाता है वह बहुत मायने रखता है!

λ मानक सामान्य सिद्धांत का उपयोग करते हुए मॉडलिंग लॉग (y + 1) के लिए शायद 10 या अधिक के क्रम का है।

ध्यान दें कि मानक निदान लॉग (x + c) के पैमाने पर बेहतर काम करते हैं। सी की पसंद बहुत ज्यादा मायने नहीं रखती है; अक्सर 0.5 या 1.0 का मतलब होता है। साथ ही यह बॉक्स-कॉक्स ट्रांसफॉर्मेशन या बॉक्स-कॉक्स के यो-जॉनसन वेरिएंट की जांच के लिए एक बेहतर शुरुआती बिंदु है। [यो, आई और जॉनसन, आर। (2000)]। आर के कार पैकेज में पावरट्रेनफॉर्म () के लिए सहायता पृष्ठ देखें। R का गेमल्स पैकेज नकारात्मक द्विपद प्रकार I (सामान्य किस्म) या II, या अन्य वितरण को फिट करने के लिए संभव बनाता है जो फैलाव को मॉडल करता है, साथ ही 0 (= लॉग, अर्थात, लॉग लिंक) के पावर ट्रांसफ़ॉर्म लिंक के साथ या अधिक । फिट्स हमेशा अभिसार नहीं कर सकते हैं।

उदाहरण: मृत्यु बनाम आधार क्षति डेटा अटलांटिक तूफान के नाम के लिए हैं जो अमेरिकी मुख्य भूमि तक पहुंच गए हैं। R के लिए DAAG पैकेज के हालिया रिलीज़ से डेटा उपलब्ध है (नाम hurricNamed )। डेटा के लिए मदद पृष्ठ में विवरण है।

रोबॉस्टिक लॉगलाइनियर बनाम नकारात्मक द्विपद फिट

ग्राफ एक मजबूत रेखीय मॉडल फिट का उपयोग करके प्राप्त की गई एक फिट लाइन की तुलना करता है, ग्राफ पर लॉग-इन के लिए उपयोग किए गए लॉग (गिनती + 1) पैमाने पर लॉग लिंक के साथ एक नकारात्मक द्विपद फिट द्वारा परिवर्तित वक्र के साथ प्राप्त होता है। (ध्यान दें कि एक समान (ग्राफ + सी) पैमाने पर कुछ का उपयोग करने के लिए पॉजिटिव सी के साथ, एक ही ग्राफ पर नकारात्मक द्विपद फिट से अंक और फिट "लाइन" दिखाने के लिए।) बड़े पूर्वाग्रह पर ध्यान दें। लॉग पैमाने पर नकारात्मक द्विपद फिट के लिए स्पष्ट। मजबूत रेखीय मॉडल फिट इस पैमाने पर बहुत कम पक्षपाती है, अगर कोई गिनती के लिए एक नकारात्मक द्विपद वितरण मानता है। एक रेखीय मॉडल फिट शास्त्रीय सामान्य सिद्धांत मान्यताओं के तहत निष्पक्ष होगा। मैंने पूर्वाग्रह को चकित कर दिया जब मैंने पहली बार बनाया था जो कि उपरोक्त ग्राफ में अनिवार्य रूप से था! एक वक्र बेहतर डेटा फिट होगा, लेकिन अंतर सांख्यिकीय परिवर्तनशीलता के सामान्य मानकों की सीमा के भीतर है। मजबूत रेखीय मॉडल फिट पैमाने के निचले छोर पर गिनती के लिए एक खराब काम करता है।

नोट --- RNA-Seq Data के साथ अध्ययन: जीन अभिव्यक्ति प्रयोगों से गणना डेटा के विश्लेषण के लिए मॉडल की दो शैलियों की तुलना रुचि की रही है। निम्न कागज एक मजबूत रैखिक मॉडल के उपयोग की तुलना करता है, लॉग (काउंट + 1) के साथ काम करते हुए, नकारात्मक द्विपद फिट के उपयोग के साथ ( बायोकॉनटोर पैकेज किनारे के रूप में) ) के उपयोग के साथ। मुख्य रूप से ध्यान में रखते हुए, आरएनए-सेक एप्लिकेशन में अधिकांश मायने रखते हैं, जो पर्याप्त रूप से वजन वाले लॉग-लीनियर मॉडल फिट होते हैं जो बहुत अच्छी तरह से काम करते हैं।

कानून, सीडब्ल्यू, चेन, वाई, शि, डब्ल्यू, स्माइथ, जीके (2014)। वूम: सटीक वेट आरएनए-सीक रीड काउंट के लिए लीनियर मॉडल एनालिसिस टूल्स को अनलॉक करता है। जीनोम जीवविज्ञान 15, R29।http://genomebiology.com/2014/15/2/R29

एनबी भी हाल ही में कागज:

Schurch NJ, Schofield P, Gierli Mski M, Cole C, Sherstnev A, Singh V, Wrobel N, Gharbi K, Simpson GG, Owen-Hughes T, Blaxter M, Barton GJ (2016)। आरएनए-सेक् प्रयोग में कितने जैविक प्रतिकृति की आवश्यकता होती है और आपको किस अंतर अभिव्यक्ति उपकरण का उपयोग करना चाहिए? आरएनए http://www.rnajournal.org/cgi/doi/10.1261/rna.053959.115

यह दिलचस्प है कि रैखिक मॉडल लिम्मा पैकेज (जैसे कि WEHI समूह से किनारा ) का उपयोग करके फिट बैठता है , बहुत अच्छी तरह से (पूर्वाग्रह के छोटे सबूत दिखाने के अर्थ में) खड़े होते हैं, कई प्रतिकृति के साथ परिणाम के सापेक्ष, प्रतिकृति की संख्या के रूप में कम किया हुआ।

ऊपर दिए गए ग्राफ़ के लिए R कोड:

library(latticeExtra, quietly=TRUE)
hurricNamed <- DAAG::hurricNamed
ytxt <- c(0, 1, 3, 10, 30, 100, 300, 1000)
xtxt <- c(1,10, 100, 1000, 10000, 100000, 1000000 )
funy <- function(y)log(y+1)
gph <- xyplot(funy(deaths) ~ log(BaseDam2014), groups= mf, data=hurricNamed,
   scales=list(y=list(at=funy(ytxt), labels=paste(ytxt)),
           x=list(at=log(xtxt), labels=paste(xtxt))),
   xlab = "Base Damage (millions of 2014 US$); log transformed scale",
   ylab="Deaths; log transformed; offset=1",
   auto.key=list(columns=2),
   par.settings=simpleTheme(col=c("red","blue"), pch=16))
gph2 <- gph + layer(panel.text(x[c(13,84)], y[c(13,84)],
           labels=hurricNamed[c(13,84), "Name"], pos=3,
           col="gray30", cex=0.8),
        panel.text(x[c(13,84)], y[c(13,84)],
           labels=hurricNamed[c(13,84), "Year"], pos=1, 
           col="gray30", cex=0.8))
ab <- coef(MASS::rlm(funy(deaths) ~ log(BaseDam2014), data=hurricNamed))

gph3 <- gph2+layer(panel.abline(ab[1], b=ab[2], col="gray30", alpha=0.4))
## 100 points that are evenly spread on a log(BaseDam2014) scale
x <- with(hurricNamed, pretty(log(BaseDam2014),100))
df <- data.frame(BaseDam2014=exp(x[x>0])) 
hurr.nb <- MASS::glm.nb(deaths~log(BaseDam2014), data=hurricNamed[-c(13,84),])
df[,'hatnb'] <- funy(predict(hurr.nb, newdata=df, type='response'))
gph3 + latticeExtra::layer(data=df,
       panel.lines(log(BaseDam2014), hatnb, lwd=2, lty=2, 
           alpha=0.5, col="gray30"))    

2
आपकी टिप्पणी के लिए धन्यवाद श्री मेनडॉनल्ड। पिछले दो वर्षों में कुछ और पेपर भी हुए (परिकल्पना परीक्षण पर अधिक ध्यान देते हुए, फिर पूर्वाग्रह पर): इव्स 2015, वार्टन एट अल 2016, स्ज़ोक 2015
ईडीआई

हो सकता है कि यह चर्चा के लिए एक अच्छा शुरुआती बिंदु है, भले ही यह विशेष बिंदु समस्याग्रस्त हो? (मैं अधिक आम तौर पर यह तर्क दूंगा कि यह बहुत अधिक पूर्वाग्रह पर ध्यान केंद्रित नहीं करने का एक कारण है, बल्कि आरएमएसई जैसे कुछ पर विचार करना है ... [अस्वीकरण, मैंने इन पत्रों को हाल ही में फिर से प्रकाशित नहीं किया है, और मैंने केवल अमूर्त पढ़ा है द वार्टन पेपर ...]
बेन बोल्कर

1
वार्टन एट अल (2016) बिंदु, कि डेटा गुण चुनाव के लिए आधार होना चाहिए, महत्वपूर्ण है। फिट्स के विवरण की तुलना करने के लिए क्वांटाइल-क्वांटाइल प्लॉट एक अच्छा तरीका है। विशेष रूप से एक या दूसरे या दोनों चरम पर फिट कुछ अनुप्रयोगों के लिए महत्वपूर्ण हो सकता है। शून्य-स्पंदित या बाधा मॉडल जीरो काउंट सही होने के लिए एक प्रभावी शोधन हो सकता है। ऊपरी चरम पर, चर्चा के तहत किसी भी मॉडल को गंभीर रूप से समझौता किया जा सकता है। वार्टन एट अल करते हैं, सराहनीय रूप से, इसका एक उदाहरण है। मैं पारिस्थितिक डेटा सेटों की एक विस्तृत श्रृंखला में तुलना देखना चाहता हूं।
जॉन मेनडोनाल्ड

लेकिन पारिस्थितिक डेटासेट में प्रजातियां निचले हिस्से (= दुर्लभ प्रजाति) में दिलचस्प नहीं हैं? कुछ पारिस्थितिक डेटासेट को संकलित करने और तुलना करने के लिए बहुत कठिन नहीं होना चाहिए ...
ईडी

दरअसल, यह नुकसान की श्रेणी के कम अंत के लिए है जो कि नकारात्मक द्विपद मॉडल लगता है, तूफान से होने वाली मौतों के आंकड़ों के लिए, कम से कम संतोषजनक होना चाहिए। R के गेमल्स पैकेज में एक फ़ंक्शन होता है जो डेटा के केंद्रित के साथ सज्जित वितरण के सेंटील्स की तुलना करना आसान बनाता है:
जॉन मेनडॉनल्ड

6

मूल पोस्ट टोनी इव्स के पेपर को दर्शाता है: इवेस (2015) । यह स्पष्ट है कि महत्व परीक्षण पैरामीटर आकलन के लिए अलग-अलग परिणाम देता है।

जॉन मेनडॉनल्ड बताते हैं कि अनुमान पक्षपाती क्यों हैं, लेकिन उनकी पृष्ठभूमि की अज्ञानता कष्टप्रद है - वह हमें यह दिखाने के लिए आलोचना करते हैं कि एक विधि जिसे हम सभी सहमत हैं त्रुटिपूर्ण है। बहुत सारे इकोलॉजिस्ट नेत्रहीन रूप से ट्रांसफॉर्म करते हैं, और हम ऐसा करने के साथ समस्याओं को इंगित करने की कोशिश कर रहे थे।

यहाँ एक अधिक बारीक चर्चा है: वार्टन (2016)

इवेस, एआर (2015), प्रतिगमन गुणांक के महत्व का परीक्षण करने के लिए, आगे बढ़ो और गिनती डेटा लॉग-ट्रांसफ़ॉर्म करें। विधियाँ इकोल इवॉल, 6: 828–835। डोई: 10.1111 / 2041-210X.12386

वार्टन, डीआई, लियोन, एम।, स्टोक्लोसा, जे और इव्स, एआर (2016), गिनती डेटा के लिए एलएम या जीएलएम टेस्ट चुनते समय विचार करने के लिए तीन बिंदु। विधियाँ इकोल इवोल। डोई: 10.1111 / 2041-210X.12552


सीवी में आपका स्वागत है। सहायक होते हुए, यह प्रतिक्रिया अधिकतर "लिंक-ओनली" प्रकार के उत्तर में होती है। लिंक परिवर्तन और डी-लिंक करते हैं। यदि आप प्रत्येक में प्रमुख बिंदुओं पर विस्तार करना चाहते हैं तो यह CV के लिए अधिक उपयोगी होगा।
माइक हंटर

जवाब के लिए धन्यवाद। मुझे लगता है कि वार्टन एट अल का पेपर। चर्चा की वर्तमान स्थिति के सिक्के।
ईडी

धन्यवाद आपका स्वागत है! मैंने संदर्भों को पूर्ण रूप से जोड़ने की स्वतंत्रता ली है।
Scortchi - को पुनः स्थापित मोनिका

1
कृपया नए संदर्भों में किए जा रहे मुख्य बिंदुओं की रूपरेखा तैयार करें, और जहां यह समझ में आता है, उन्हें मूल प्रश्न से भी संबंधित करें। यह एक मूल्यवान योगदान है, लेकिन वर्तमान में इस सवाल के जवाब की तुलना में एक और उत्तर पर एक टिप्पणी के करीब है ( उदाहरण के लिए लिंक के लिए संदर्भ प्रदान करना चाहिए )। संदर्भ के कुछ अतिरिक्त वाक्य पोस्ट को काफी हद तक मदद करेंगे।
Glen_b -Reinstate मोनिका

3
विशेष रूप से, मेरी टिप्पणी ओ'हारा और कोटेज़ पेपर में अंक 4 को दर्शाती है: "हमने पाया कि परिवर्तनों ने अलग-अलग प्रदर्शन किए, सिवाय इसके। .. क्वासी-पॉइसन और नकारात्मक द्विपद मॉडल ... [दिखाया गया है] थोड़ा पूर्वाग्रह।" सिमुलेशन अत्यधिक सकारात्मक तिरछा वितरण के लिए, y (y + c) के पैमाने पर अपेक्षित माध्य (बनाम) के पैमाने पर अपेक्षित माध्य के बीच तुलना पर एक टिप्पणी है। नकारात्मक द्विपद पैरामीटर लैंबडा y के पैमाने पर निष्पक्ष है, जबकि लॉग-सामान्य माध्य निष्पक्ष (उस पैमाने पर सामान्यता के तहत) लॉग (y + c) के पैमाने पर है।
जॉन मेनडॉनाल्ड
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.