अनुमान करने वाले


11

दो दिए गए पूर्णांकों लिए अनुमानित का सबसे अच्छा तरीका क्या है जब आप , विचरण , और असतत वितरण अतिरिक्त का पता करते हैं। , और यह आकृति ( और ) के (गैर-शून्य) उपायों से कि एक सामान्य सन्निकटन उचित नहीं है?मीटर , एन μ σ 2 γ 1 γ 2 एक्स γ 1 γ 2Pr[nXm]m,nμσ2γ1γ2Xγ1γ2

आमतौर पर, मैं पूर्णांक सुधार के साथ एक सामान्य सन्निकटन का उपयोग करेगा ...

Pr[(n½)X(m+½)]=Pr[(n½)μσZ(m+½)μσ]=Φ((m+½)μσ)Φ((n½)μσ)

... अगर तिरछापन और अतिरिक्त कुर्तोसिस 0 के करीब थे, लेकिन यहाँ ऐसा नहीं है।

मुझे अलग-अलग असतत वितरणों के लिए अलग-अलग वितरण करने होंगे, जिनमें और विभिन्न मूल्य । इसलिए मुझे यह पता लगाने में दिलचस्पी है कि क्या कोई ऐसी प्रक्रिया है जो सामान्य सन्निकटन से बेहतर सन्निकटन का चयन करने के लिए और का उपयोग करती है ।γ 2 γ 1 γ 2γ1γ2γ1γ2

जवाबों:


4

यह एक दिलचस्प सवाल है, जिसका वास्तव में एक अच्छा समाधान नहीं है। इस समस्या से निपटने के कुछ अलग तरीके हैं।

  1. एक अंतर्निहित वितरण और मैच के क्षणों को मान लें - जैसा कि @ivant और @onestop द्वारा उत्तर दिया गया है। एक नकारात्मक पक्ष यह है कि बहुभिन्नरूपी सामान्यीकरण अस्पष्ट हो सकता है।

  2. सैडलपॉइंट का अनुमान। इस कागज़ पे:

    गिलेस्पी, सीएस और रेनशॉ , ई। एक बेहतर काठी बिंदु सन्निकटन। गणितीय बायोसाइंसेस , 2007।

    हम केवल पहले कुछ क्षण दिए जाने पर एक pdf / pmf पुनर्प्राप्त करने पर ध्यान देते हैं। हमने पाया कि यह दृष्टिकोण तब काम करता है जब तिरछापन बहुत बड़ा नहीं होता है।

  3. लैगुएरे विस्तार:

    मुस्तफा, एच। और दिमित्राकोपलोसा, आर। बहुस्तरीय संभाव्यता घनत्व के सामान्यीकृत लैगुएरे विस्तार क्षणों के साथकंप्यूटर और गणित अनुप्रयोगों के साथ , 2010।

    इस पत्र के परिणाम अधिक आशाजनक प्रतीत होते हैं, लेकिन मैंने उन्हें कोडित नहीं किया है।


4

पहले चार क्षणों का उपयोग करके डेटा के वितरण को ठीक करना, कार्ल पियर्सन ने पीरसन परिवार को निरंतर संभाव्यता वितरण के लिए तैयार किया (अधिकतम संभावना इन दिनों पाठ्यक्रम के बहुत अधिक लोकप्रिय है)। उस परिवार के संबंधित सदस्य को फिट करने के लिए सीधा होना चाहिए, फिर उसी प्रकार की निरंतरता सुधार का उपयोग करें जैसा कि आप सामान्य वितरण के लिए ऊपर देते हैं।

मुझे लगता है कि आपके पास वास्तव में बहुत बड़ा नमूना आकार होना चाहिए? अन्यथा तिरछापन और विशेष रूप से कुर्तोसिस के नमूना अनुमान अक्सर निराशाजनक रूप से प्रभावित होते हैं, साथ ही आउटलेर्स के प्रति अत्यधिक संवेदनशील होते हैं। किसी भी मामले में, मैं अत्यधिक अनुशंसा करता हूं कि आप एल-मोन्स पर एक विकल्प के रूप में एक नज़र डालें जो कि साधारण से अधिक कई फायदे हैं जो हो सकते हैं डेटा वितरित करने के लिए फायदेमंद है।


2

आप तिरछे सामान्य वितरण का उपयोग करने की कोशिश कर सकते हैं और यह देख सकते हैं कि आपके विशेष डेटा सेट के लिए अतिरिक्त कुर्तोसिस दिए गए तिरछेपन के लिए वितरण के अतिरिक्त कुर्तोसिस के काफी करीब है या नहीं। यदि यह है, तो आप संभावना का अनुमान लगाने के लिए तिरछा सामान्य वितरण cdf का उपयोग कर सकते हैं। यदि नहीं, तो आपको तिरछे सामान्य वितरण के लिए उपयोग की जाने वाली समान / तिरछी pdf में परिवर्तन के साथ आना होगा, जो आपको तिरछापन और अतिरिक्त कुर्तोसिस दोनों पर नियंत्रण देगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.