मेरे पास स्पष्ट रूप से मूल्यों का वितरण है, जिसे मैं फिट करना चाहता हूं। डेटा को 2 सामान्य कार्यों (बिमोडल) या 3 सामान्य कार्यों के साथ अच्छी तरह से फिट किया जा सकता है। इसके अतिरिक्त, डेटा को 3 के साथ फिट करने के लिए एक प्रशंसनीय भौतिक कारण है।
जितने अधिक पैरामीटर पेश किए जाते हैं, फिट उतना ही सही होगा, क्योंकि पर्याप्त स्थिरांक के साथ, एक " एक हाथी को फिट कर सकता है "।
यहाँ वितरण, 3 सामान्य (गाऊसी) वक्रों के योग के साथ फिट है:
ये प्रत्येक फिट के लिए डेटा हैं। मुझे यकीन नहीं है कि फिट का निर्धारण करने के लिए मुझे यहां क्या परीक्षण करना चाहिए। डेटा में 91 अंक होते हैं।
1 सामान्य समारोह:
- RSS: 1.06231
- एक्स ^ 2: 3.1674
- F.Test: 0.3092
2 सामान्य कार्य:
- RSS: 0.010939
- एक्स ^ 2: 0.053896
- F.Test: 0.97101
3 सामान्य कार्य:
- RSS: 0.00536
- एक्स ^ 2: 0.02794
- F.Test: 0.99249
सही सांख्यिकीय परीक्षण क्या है जो यह निर्धारित करने के लिए लागू किया जा सकता है कि इन 3 फिट में से कौन सा सबसे अच्छा है? जाहिर है, 1 सामान्य कार्य फिट अपर्याप्त है। तो मैं 2 और 3 के बीच भेदभाव कैसे कर सकता हूं?
जोड़ने के लिए, मैं ज्यादातर एक्सेल और थोड़ा पायथन के साथ ऐसा कर रहा हूं; मेरे पास अभी तक R या अन्य सांख्यिकीय भाषाओं से परिचित नहीं है।
R
मार्ग पर जाने का निर्णय लेंगे )। इस उत्तर में कुछ मॉडल चयन मानदंडों का उल्लेख किया गया है । अंत में, आप पहनावे के तरीकों पर विचार करना चाह सकते हैं , जिसे मैंने संक्षेप में इस उत्तर में शामिल किया है , जिसमें पायथन-केंद्रित जानकारी का लिंक भी है। आप इस उत्तर में मॉडल चयन और औसत पर अधिक जानकारी पा सकते हैं ।