हमने कुछ प्रकार के सांख्यिकीय परिकल्पना परीक्षण को लागू किया है, जिनमें से एक ची स्क्वायर उपयुक्त मॉडल परीक्षण है - दिए गए प्रायिकता वितरण के उलटा सीडीएफ से निर्धारित डिब्बे में नमूनों की संख्या का ची वर्ग परीक्षण। इसलिए, उदाहरण के लिए, कॉची वितरण नमूना पीढ़ी का परीक्षण करने के लिए, मैं कुछ ऐसा चलाता हूं
with(Statistics):
infolevel[Statistics] := 1:
distribution := CauchyDistribution(2, 3):
sample := Sample(distribution, 10^6):
ChiSquareSuitableModelTest(sample, distribution, 'bins' = 100, 'level' = 0.001);
क्योंकि मैं जितना चाहे उतना बड़ा नमूना तैयार कर सकता हूं, मैं बहुत छोटा बना सकता हूं ।α
परिमित क्षणों के वितरण के लिए, मैं एक ओर कई नमूना क्षणों की गणना करता हूं, और दूसरी ओर, मैं प्रतीकात्मक रूप से संबंधित वितरण क्षणों और उनके मानक त्रुटि की गणना करता हूं। इसलिए उदाहरण के लिए बीटा वितरण:
with(Statistics):
distribution := BetaDistribution(2, 3):
distributionMoments := Moment~(distribution, [seq(1 .. 10)]);
standardErrors := StandardError[10^6]~(Moment, distribution, [seq(1..10)]);
evalf(distributionMoments /~ standardErrors);
यह संख्याओं की घटती सूची दिखाता है, जिनमें से अंतिम 255.1085766 है। तो 10 वें पल के लिए भी, पल का मूल्य नमूने के लिए नमूना क्षण के मानक त्रुटि के मूल्य से 250 गुना से अधिक है । इसका मतलब यह है कि मैं एक परीक्षण लागू कर सकता हूं जो निम्न प्रकार से चलता है:106
with(Statistics):
sample := Sample(BetaDistribution(2, 3), 10^6):
sampleMoments := map2(Moment, sample, [seq(1 .. 10)]);
distributionMoments := [2/5, 1/5, 4/35, 1/14, 1/21, 1/30, 4/165, 1/55, 2/143, 1/91];
standardErrors :=
[1/5000, 1/70000*154^(1/2), 1/210000*894^(1/2), 1/770000*7755^(1/2),
1/54600*26^(1/2), 1/210000*266^(1/2), 7/5610000*2771^(1/2),
1/1567500*7809^(1/2), 3/5005000*6685^(1/2), 1/9209200*157366^(1/2)];
deviations := abs~(sampleMoments - distributionMoments) /~ standardErrors;
इसमें नंबर पहले नंबर से आते हैं distributionMoments
और standardErrors
ऊपर आते हैं। अब यदि नमूना पीढ़ी सही है, तो विचलन में संख्या अपेक्षाकृत कम होनी चाहिए। मुझे लगता है कि वे लगभग सामान्य रूप से वितरित किए जाते हैं (जो कि वे वास्तव में नहीं हैं, लेकिन यह काफी करीब आता है - याद रखें कि ये नमूने के क्षणों के स्केल किए गए संस्करण हैं, न कि नमूने खुद) और इस तरह मैं उदाहरण के लिए, ऐसे मामले को चिह्नित कर सकता हूं जहां विचलन है 4 से अधिक - एक नमूना पल के समान जो वितरण क्षण से मानक त्रुटि से चार गुना से अधिक विचलन करता है। यदि नमूना पीढ़ी अच्छी है, तो यह यादृच्छिक रूप से होने की बहुत संभावना नहीं है। दूसरी ओर, यदि पहले 10 नमूना क्षण वितरण के क्षणों को आधे प्रतिशत से कम के भीतर मेल खाते हैं, तो हमारे पास वितरण का काफी अच्छा अनुमान है।