एक असंभव अनुमान समस्या?


17

सवाल

एक नकारात्मक द्विपद (NB) वितरण का विचरण हमेशा अपने मतलब से अधिक होता है। जब किसी नमूने का माध्य उसके विचरण से अधिक होता है, तो अधिकतम संभावना के साथ या पल के आकलन के साथ NB के मापदंडों को फिट करने की कोशिश विफल हो जाएगी (परिमित मापदंडों के साथ कोई समाधान नहीं है)।

हालांकि, यह संभव है कि एनबी वितरण से लिया गया एक नमूना विचरण से अधिक हो। यहाँ आर में एक प्रतिलिपि प्रस्तुत करने योग्य उदाहरण है।

set.seed(167)
x = rnbinom(100, size=3.2, prob=.8);
mean(x) # 0.82
var(x) # 0.8157576

एक गैर-शून्य संभावना है कि एनबी एक नमूना का उत्पादन करेगा जिसके लिए मापदंडों का अनुमान नहीं लगाया जा सकता है (अधिकतम संभावना और पल के तरीकों से)।

  1. क्या इस नमूने के लिए अच्छे अनुमान दिए जा सकते हैं?
  2. जब अनुमानक सभी नमूनों के लिए परिभाषित नहीं होते हैं, तो अनुमान सिद्धांत क्या कहता है?

उत्तर के बारे में

@MarkRobinson और @Yves के जवाबों ने मुझे एहसास दिलाया कि पैराडाइजेशन मुख्य मुद्दा है। एनबी की संभावना घनत्व आमतौर पर लिखा जाता है

P(X=k)=Γ(r+k)Γ(r)k!(1p)rpk
या as
P(X=k)=Γ(r+k)Γ(r)k!(rr+m)r(mr+m)k.

पहले पैराट्राइज़ेशन के तहत, अधिकतम संभावना अनुमान है जब भी नमूने का विचरण मतलब से छोटा होता है, इसलिए बारे में कुछ भी उपयोगी नहीं कहा जा सकता है । दूसरे के तहत, यह , इसलिए हम का एक उचित अनुमान दे सकते हैं । अंत में, @MarkRobinson शो हम का उपयोग करके अनंत मूल्यों की समस्या को हल कर सकते हैं कि के बजाय ।पी ( , ˉ एक्स ) मीटर आर(,0)p(,x¯)m आरr1+rr

निष्कर्ष में, इस आकलन समस्या के साथ मौलिक रूप से कुछ भी गलत नहीं है, सिवाय इसके कि आप हमेशा हर नमूने पर और की सार्थक व्याख्या नहीं दे सकते । निष्पक्ष होने के लिए, विचार दोनों उत्तरों में मौजूद हैं। मैंने @MarkRobinson को उनके द्वारा दिए गए कंपल्स के लिए सही चुना।पीrp


यह बताना गलत है कि ऐसे मामले में अधिकतम संभावना विफल हो जाती है। केवल क्षण विधियों से कठिनाइयों का सामना करना पड़ सकता है।
शीआन

@ शीआन क्या आप विस्तार कर सकते हैं? इस नमूने की संभावना डोमेन में अधिकतम नहीं है ( उदाहरण के लिए यह भी देखें )। क्या मैं कुछ भूल रहा हूँ? किसी भी घटना में, यदि आप इस मामले के लिए मापदंडों का एमएल अनुमान दे सकते हैं तो मैं प्रश्न को अपडेट करूंगा। (0,)×(0,1)
gui11aume 10

1
संभावना इसकी अधिकतम दूरी पर और । इसी तरह की समस्या लेकिन सरल निदान के साथ लोमैक्स वितरण के लिए है : यह ज्ञात है कि आकार का एमएल अनुमान अनंत है जब नमूना में भिन्नता का गुणांक होता है । फिर भी इस घटना की संभावना किसी भी नमूने के आकार के लिए सकारात्मक है, और , और लिए काफी मजबूत है । r CV < 1 α = 20 n = 200p0rCV<1α=20n=200
यवस

@ इस अन्य उदाहरण के लिए धन्यवाद (जिसके बारे में मुझे जानकारी नहीं थी)। इस मामले में लोग क्या करते हैं?
gui11aume

2
लोमैक्स उदाहरण में, कुछ लोगों को घातीय वितरण, जिसके लिए सीमा नहीं है का उपयोग करने के लिए चुना जाएगा और λ / अल्फा θ > 0 । यह एक अनंत एमएल अनुमान को स्वीकार करने के लिए उबलता है। पुन: पैरामीटर द्वारा आक्रमण के लिए, मेरा मानना ​​है कि अनंत पैरामीटर कुछ मामलों में समझ में आ सकते हैं। आपके NB उदाहरण के लिए, वही होता है, जब हमने r p / ( 1 - p ) λ से उत्पन्न Poisson वितरण का उपयोग करने के लिए चुना । αλ/αθ>0rp/(1p)λ
यवस

जवाबों:


11

यहाँ छवि विवरण दर्ज करेंमूल रूप से, आपके नमूने के लिए, आकार पैरामीटर का अनुमान पैरामीटर स्थान की सीमा पर है। कोई भी पुनर्मूल्यांकन पर विचार कर सकता है जैसे कि d = size / (size + 1); जब आकार = 0, डी = 0, जब आकार अनंत तक जाता है, डी दृष्टिकोण 1. यह पता चला है कि, आपके द्वारा दिए गए पैरामीटर सेटिंग्स के लिए, अनंत का आकार अनुमान (डी 1 के करीब) लगभग 13% समय के लिए होता है। कॉक्स-रीड समायोजित प्रोफाइल संभावना (एपीएल) अनुमान, जो एनबी के लिए एमएलई अनुमानों का एक विकल्प है (उदाहरण यहां दिखाया गया है) । माध्य पैरामीटर (या 'प्रोब') के अनुमान ठीक प्रतीत होते हैं (चित्र देखें, नीली रेखाएं सही मान हैं, लाल बिंदु आपके बीज = 167 नमूने के लिए अनुमान है)। एपीएल सिद्धांत पर अधिक विवरण यहां दिए गए हैं

इसलिए, मैं 1 से कहूंगा। डिसेंट पैरामीटर का अनुमान लगाया जा सकता है .. आकार = अनन्तता या फैलाव = 0 नमूना दिया गया एक उचित अनुमान है। एक अलग पैरामीटर स्पेस पर विचार करें और अनुमान परिमित होगा।


मेरे सवाल का जवाब देने के लिए साइट से जुड़ने के लिए धन्यवाद! कॉक्स-रीड समायोजित प्रोफाइल संभावना का विस्तार बहुत आशाजनक लगता है।
gui11aume

8

p0rΘ:=(0,1)×(0,)λ>0[p,r]Θp0rrp/(1p)λ

CV<1>0.3α=20n=200

एमएल गुण एक बड़े नमूने के आकार के लिए होते हैं: नियमितता की शर्तों के तहत, एक एमएल अनुमान मौजूद है, अद्वितीय होने के लिए और सच्चे पैरामीटर के लिए रुझान दिखाया गया है। फिर भी किसी दिए गए परिमित नमूने के आकार के लिए, एमएल अनुमान डोमेन में मौजूद नहीं हो सकता है, उदाहरण के लिए क्योंकि सीमा पर अधिकतम पहुंच है। यह एक ऐसे डोमेन में भी मौजूद हो सकता है जो अधिकतम उपयोग के लिए उपयोग किए जाने वाले से बड़ा हो।

αλ/αθ>0GPD(σ,ξ)ξ>0ξ^<0ξ^=0

पुन: पैरामीटर द्वारा आक्रमण के लिए, मेरा मानना ​​है कि अनंत पैरामीटर कुछ मामलों में समझ में आ सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.