सार
डेटा की गिनती से अधिक है 3.5 अज्ञात संभावना के साथ एक द्विपद वितरण है p। इसका द्विपद परीक्षण करने के लिए उपयोग करेंp=1/2 विकल्प के खिलाफ p≠1/2।
इस पोस्ट के बाकी अंतर्निहित मॉडल की व्याख्या करता है और दिखाता है कि गणना कैसे करें। यह R
उन्हें बाहर ले जाने के लिए कार्य कोड प्रदान करता है। अंतर्निहित परिकल्पना परीक्षण सिद्धांत का एक विस्तारित विवरण मेरे जवाब में प्रदान किया गया है "सांख्यिकीय परीक्षणों में पी-मूल्यों और टी-मूल्यों का क्या अर्थ है?" ।
सांख्यिकीय मॉडल
मानों को यथोचित रूप से विविध (कुछ संबंधों के साथ) 3.5), तो आपके शून्य परिकल्पना के तहत, किसी भी बेतरतीब ढंग से नमूना मूल्य एक है 1/2=50% से अधिक का मौका 3.5 (जबसे 3.5आबादी के मध्य मूल्य के रूप में विशेषता है)। सभी को मान लिया250 मूल्यों को बेतरतीब ढंग से और स्वतंत्र रूप से नमूना लिया गया था, उनमें से अधिक संख्या 3.5 इसलिए एक द्विपद होगा(250,1/2)वितरण। आइए हम इस संख्या को "गिनती" कहते हैंk।
दूसरी ओर, यदि जनसंख्या औसत से भिन्न होती है 3.5बेतरतीब ढंग से नमूना मूल्य से अधिक का मौका 3.5 से अलग होगा 1/2। यह वैकल्पिक परिकल्पना है।
एक उपयुक्त परीक्षण ढूँढना
अशक्त स्थिति को उसके विकल्पों से अलग करने का सबसे अच्छा तरीका है मूल्यों के बारे में देखना kकि नल के नीचे सबसे अधिक संभावना है और विकल्पों के तहत कम संभावना है। ये पास के मान हैं1/2 का 250, के बराबर 125। इस प्रकार, आपके परीक्षण के लिए एक महत्वपूर्ण क्षेत्र में अपेक्षाकृत दूर के मूल्य शामिल हैं125: पास में 0 या के करीब है 250। लेकिन कितनी दूर है125 क्या उन्हें महत्वपूर्ण सबूतों का गठन करना चाहिए? 3.5 जनसंख्या औसत नहीं है?
आपके महत्व के मानक पर निर्भर करता है: इसे परीक्षण आकार कहा जाता है, जिसे अक्सर कहा जाता हैα। अशक्त परिकल्पना के तहत, पास होना चाहिए - लेकिन इससे अधिक नहीं - एα मौका है कि क महत्वपूर्ण क्षेत्र में होगा।
आमतौर पर, जब हमारे पास कोई पूर्व धारणा नहीं होती है कि कौन सा विकल्प लागू होगा - एक औसत से अधिक या उससे कम 3.5हम महत्वपूर्ण क्षेत्र का निर्माण करने की कोशिश करते हैं ताकि उस अवसर का आधा हिस्सा हो, α / 2, उस क कम है और अन्य आधा है, α / 2, उस कऊंचा है। क्योंकि हम इसका वितरण जानते हैंक अशक्त परिकल्पना के तहत, यह जानकारी महत्वपूर्ण क्षेत्र को निर्धारित करने के लिए पर्याप्त है।
तकनीकी रूप से, गणना करने के दो सामान्य तरीके हैं: द्विपद संभावनाओं की गणना या उन्हें सामान्य वितरण के साथ अनुमानित करें।
द्विपद संभावनाओं के साथ गणना
प्रतिशत बिंदु (मात्रात्मक) फ़ंक्शन का उपयोग करें। में R
, उदाहरण के लिए, इस में कहा जाता है qbinom
और इस तरह लागू किया जाएगा
alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)
के लिए उत्पादन α = 0.05 है
109 141
इसका अर्थ है कि महत्वपूर्ण क्षेत्र में सभी निम्न मूल्य शामिल हैं k (और सहित) 0 तथा 109के सभी उच्च मूल्यों के साथ k (और सहित) 141 तथा 250। एक जाँच के रूप में, हम R
उस मौके की गणना करने के लिए कह सकते हैं k
जो उस क्षेत्र में निहित है जब अशक्त सही है:
pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))
आउटपुट है 0.0497के बहुत करीब - लेकिन - से अधिक नहींαअपने आप। क्योंकि महत्वपूर्ण क्षेत्र को पूर्ण संख्या में समाप्त होना चाहिए, यह आमतौर पर इस वास्तविक परीक्षण आकार को नाममात्र परीक्षण आकार के बराबर बनाना संभव नहीं हैα, लेकिन इस मामले में दोनों मूल्य वास्तव में बहुत करीब हैं।
सामान्य सन्निकटन के साथ गणना
एक द्विपद का मतलब(250,1/2) वितरण है 250×1/2=125 और इसका विचरण है 250×1/2×(1−1/2)=250/4, इसके मानक विचलन को समान बनाता है 250/4−−−−−√≈7.9। हम द्विपद वितरण को सामान्य वितरण से बदल देंगे। मानक सामान्य वितरण हैα/2=0.05/2 इसकी संभावना से कम है −1.95996, जैसा कि R
कमांड द्वारा गणना की जाती है
qnorm(alpha/2)
क्योंकि सामान्य वितरण सममित हैं, यह भी है ०.०५ / २ इसकी संभावना से अधिक है + 1.95996। इसलिए महत्वपूर्ण क्षेत्र में मूल्यों का समावेश हैक से अधिक हैं १.९५,९९६ मानक विचलन से दूर 125। इन थ्रेसहोल्ड की गणना करें: वे बराबर हैं125 140 7.9 × 1.96 .5 109.5 , 140.5। गणना के रूप में एक झपट्टा में किया जा सकता है
250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)
जबसे क एक पूरी संख्या होनी चाहिए, हम देखते हैं कि जब यह महत्वपूर्ण क्षेत्र में आएगा 109 या कम या 141और अधिक से अधिक। यह उत्तर सटीक द्विपद गणना का उपयोग करके प्राप्त किए गए के समान है। यह आमतौर पर मामला है जबपी निकट है 1 / 2 की तुलना में यह है 0 या 1नमूना आकार बड़े (दसियों या अधिक) के लिए मध्यम है, और α बहुत छोटा नहीं है (कुछ प्रतिशत)।
यह परीक्षण, क्योंकि यह आबादी के बारे में कुछ भी नहीं मानता है (सिवाय इसके कि इसके माध्यिका पर ध्यान केंद्रित करने की बहुत संभावना नहीं है), अन्य परीक्षणों की तरह शक्तिशाली नहीं है जो आबादी के बारे में विशिष्ट धारणा बनाते हैं। यदि परीक्षण फिर भी शून्य को अस्वीकार करता है, तो शक्ति की कमी के बारे में चिंतित होने की कोई आवश्यकता नहीं है। अन्यथा, आपको उन लोगों के बीच कुछ नाजुक व्यापार करना होगा जो आप मानने को तैयार हैं और आप आबादी के बारे में क्या निष्कर्ष निकाल सकते हैं ।