जनसंख्या के मध्यमान का परीक्षण कैसे करें?


9

मेरे पास 250 इकाइयों का एक नमूना है। वितरण असममित है। मैं एक परिकल्पना का परीक्षण करना चाहता हूं कि आबादी का औसत 3.5 से भिन्न है, इसलिए मुझे लगता है कि एक-नमूना परीक्षण उचित होगा। मुझे पता है कि विल्कोक्सन रैंक परीक्षण उचित नहीं है क्योंकि वितरण सममित नहीं है। क्या साइन टेस्ट का उपयोग करना उचित है? यदि यह नहीं है तो क्या कोई किसी अन्य परीक्षण की सिफारिश कर सकता है?


3
आपने मुझे कई कारणों से पहली पंक्ति में खो दिया। (1) एक नमूना में गॉसियन वितरण नहीं हो सकता है (लेकिन इसमें लगभग एक हो सकता है)। (2) सभी गौसियन वितरणों की एक विशेषता (और इसलिए उनके लिए सन्निकटन) समरूपता है । आपने खुद को प्रतिवाद किया है। सांख्यिकीय शब्दजाल के बजाय, अपने डेटा को अपनी शर्तों में वर्णित करके, आप अपने पास मौजूद चीज़ों से बेहतर संवाद करेंगे। क्या आप यह भी बता सकते हैं कि जितना संभव हो उतना सादा तरीके से, आप वास्तव में अपने डेटा के साथ क्या हासिल करना चाहते हैं? आपको देने के लिए किस तरह की जानकारी "माध्यिका पर आधारित नमूना परीक्षण" है?
whuber

1
नमूने का माध्यिका जो कुछ भी है; यह परीक्षण करने की कोई आवश्यकता नहीं होगी। शायद आप यह परीक्षण करना चाहते हैं कि क्या जनसंख्या का माध्य (जिससे नमूना प्राप्त किया गया है) बराबर है3.5? यदि हां, तो यह जानना महत्वपूर्ण है कि इसका मूल्य कैसे है3.5विकसित किया गया था। क्या यह कुछ अन्य डेटासेट का सारांश है, शायद? या क्या यह कुछ पूर्व निर्धारित संख्या है, जैसे गुणवत्ता मानक?
whuber

1
यह एक पूर्व निर्धारित संख्या है
LeonRupnik

2
" वितरण असममित है, इसलिए मैं एक परिकल्पना का परीक्षण करना चाहता हूं कि अगर किसी आबादी का एक माध्य 3.5 से अलग है ..." - एक नमूना प्रभाव में असममितता क्या परिकल्पना दिलचस्प है?" क्या एक साइन टेस्ट का उपयोग करना उचित है? " - निश्चित, लेकिन (मूल रूप में कम से कम) यह निरंतरता पर निर्भर करता है - यदि आपके चर असतत है (तो आप यह नहीं कहते हैं कि आपके डेटा में क्या है) ।
Glen_b -Reinstate मोनिका

डेटा निरंतर है
लियोन रुपेनिक

जवाबों:


8

सार

डेटा की गिनती से अधिक है 3.5 अज्ञात संभावना के साथ एक द्विपद वितरण है p। इसका द्विपद परीक्षण करने के लिए उपयोग करेंp=1/2 विकल्प के खिलाफ p1/2

इस पोस्ट के बाकी अंतर्निहित मॉडल की व्याख्या करता है और दिखाता है कि गणना कैसे करें। यह Rउन्हें बाहर ले जाने के लिए कार्य कोड प्रदान करता है। अंतर्निहित परिकल्पना परीक्षण सिद्धांत का एक विस्तारित विवरण मेरे जवाब में प्रदान किया गया है "सांख्यिकीय परीक्षणों में पी-मूल्यों और टी-मूल्यों का क्या अर्थ है?"

सांख्यिकीय मॉडल

मानों को यथोचित रूप से विविध (कुछ संबंधों के साथ) 3.5), तो आपके शून्य परिकल्पना के तहत, किसी भी बेतरतीब ढंग से नमूना मूल्य एक है 1/2=50% से अधिक का मौका 3.5 (जबसे 3.5आबादी के मध्य मूल्य के रूप में विशेषता है)। सभी को मान लिया250 मूल्यों को बेतरतीब ढंग से और स्वतंत्र रूप से नमूना लिया गया था, उनमें से अधिक संख्या 3.5 इसलिए एक द्विपद होगा(250,1/2)वितरण। आइए हम इस संख्या को "गिनती" कहते हैंk

दूसरी ओर, यदि जनसंख्या औसत से भिन्न होती है 3.5बेतरतीब ढंग से नमूना मूल्य से अधिक का मौका 3.5 से अलग होगा 1/2। यह वैकल्पिक परिकल्पना है।

एक उपयुक्त परीक्षण ढूँढना

अशक्त स्थिति को उसके विकल्पों से अलग करने का सबसे अच्छा तरीका है मूल्यों के बारे में देखना kकि नल के नीचे सबसे अधिक संभावना है और विकल्पों के तहत कम संभावना है। ये पास के मान हैं1/2 का 250, के बराबर 125। इस प्रकार, आपके परीक्षण के लिए एक महत्वपूर्ण क्षेत्र में अपेक्षाकृत दूर के मूल्य शामिल हैं125: पास में 0 या के करीब है 250। लेकिन कितनी दूर है125 क्या उन्हें महत्वपूर्ण सबूतों का गठन करना चाहिए? 3.5 जनसंख्या औसत नहीं है?

आपके महत्व के मानक पर निर्भर करता है: इसे परीक्षण आकार कहा जाता है, जिसे अक्सर कहा जाता हैα। अशक्त परिकल्पना के तहत, पास होना चाहिए - लेकिन इससे अधिक नहीं - एα मौका है कि महत्वपूर्ण क्षेत्र में होगा।

आमतौर पर, जब हमारे पास कोई पूर्व धारणा नहीं होती है कि कौन सा विकल्प लागू होगा - एक औसत से अधिक या उससे कम 3.5हम महत्वपूर्ण क्षेत्र का निर्माण करने की कोशिश करते हैं ताकि उस अवसर का आधा हिस्सा हो, α/2, उस कम है और अन्य आधा है, α/2, उस ऊंचा है। क्योंकि हम इसका वितरण जानते हैं अशक्त परिकल्पना के तहत, यह जानकारी महत्वपूर्ण क्षेत्र को निर्धारित करने के लिए पर्याप्त है।

तकनीकी रूप से, गणना करने के दो सामान्य तरीके हैं: द्विपद संभावनाओं की गणना या उन्हें सामान्य वितरण के साथ अनुमानित करें।

द्विपद संभावनाओं के साथ गणना

प्रतिशत बिंदु (मात्रात्मक) फ़ंक्शन का उपयोग करें। में R, उदाहरण के लिए, इस में कहा जाता है qbinomऔर इस तरह लागू किया जाएगा

alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)

के लिए उत्पादन α=0.05 है

109 141

इसका अर्थ है कि महत्वपूर्ण क्षेत्र में सभी निम्न मूल्य शामिल हैं k (और सहित) 0 तथा 109के सभी उच्च मूल्यों के साथ k (और सहित) 141 तथा 250। एक जाँच के रूप में, हम Rउस मौके की गणना करने के लिए कह सकते हैं kजो उस क्षेत्र में निहित है जब अशक्त सही है:

pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))

आउटपुट है 0.0497के बहुत करीब - लेकिन - से अधिक नहींαअपने आप। क्योंकि महत्वपूर्ण क्षेत्र को पूर्ण संख्या में समाप्त होना चाहिए, यह आमतौर पर इस वास्तविक परीक्षण आकार को नाममात्र परीक्षण आकार के बराबर बनाना संभव नहीं हैα, लेकिन इस मामले में दोनों मूल्य वास्तव में बहुत करीब हैं।

सामान्य सन्निकटन के साथ गणना

एक द्विपद का मतलब(250,1/2) वितरण है 250×1/2=125 और इसका विचरण है 250×1/2×(11/2)=250/4, इसके मानक विचलन को समान बनाता है 250/47.9। हम द्विपद वितरण को सामान्य वितरण से बदल देंगे। मानक सामान्य वितरण हैα/2=0.05/2 इसकी संभावना से कम है 1.95996, जैसा कि Rकमांड द्वारा गणना की जाती है

qnorm(alpha/2)

क्योंकि सामान्य वितरण सममित हैं, यह भी है 0.05/2 इसकी संभावना से अधिक है +१.९५,९९६। इसलिए महत्वपूर्ण क्षेत्र में मूल्यों का समावेश है से अधिक हैं १.९५,९९६ मानक विचलन से दूर 125। इन थ्रेसहोल्ड की गणना करें: वे बराबर हैं125±7.9×1.96109.5,140.5। गणना के रूप में एक झपट्टा में किया जा सकता है

250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)

जबसे एक पूरी संख्या होनी चाहिए, हम देखते हैं कि जब यह महत्वपूर्ण क्षेत्र में आएगा 109 या कम या 141और अधिक से अधिक। यह उत्तर सटीक द्विपद गणना का उपयोग करके प्राप्त किए गए के समान है। यह आमतौर पर मामला है जबपी निकट है 1/2 की तुलना में यह है 0 या 1नमूना आकार बड़े (दसियों या अधिक) के लिए मध्यम है, और α बहुत छोटा नहीं है (कुछ प्रतिशत)।


यह परीक्षण, क्योंकि यह आबादी के बारे में कुछ भी नहीं मानता है (सिवाय इसके कि इसके माध्यिका पर ध्यान केंद्रित करने की बहुत संभावना नहीं है), अन्य परीक्षणों की तरह शक्तिशाली नहीं है जो आबादी के बारे में विशिष्ट धारणा बनाते हैं। यदि परीक्षण फिर भी शून्य को अस्वीकार करता है, तो शक्ति की कमी के बारे में चिंतित होने की कोई आवश्यकता नहीं है। अन्यथा, आपको उन लोगों के बीच कुछ नाजुक व्यापार करना होगा जो आप मानने को तैयार हैं और आप आबादी के बारे में क्या निष्कर्ष निकाल सकते हैं ।


2
जैसा कि यह व्यावहारिक रूप से आपके अधिक सारगर्भित " पी-वैल्यू का अर्थ " उत्तर का एक काम किया गया उदाहरण है , न केवल एक ही दर्शन की जासूसी करने में बल्कि जिस तरह से आपका उत्तर संरचित है, मुझे लगता है कि आपको इसे लिंक करना चाहिए ("एक उदाहरण" यह कैसे व्यवहार में लागू किया जाता है मेरे जवाब में पाया जा सकता है ... ") आपके उत्तर के निष्कर्ष में।
सिल्वरफिश

2
@ शेवर धन्यवाद; कि वास्तव में मेरे मन को पार कर गया था। मुझे लगा कि मैं पहले थोड़ा इंतजार कर सकता हूं। अन्य बातों के अलावा, मुझे आश्चर्य नहीं होगा कि कुछ उद्यमी समुदाय के सदस्य डुप्लिकेट धागा खोदें, जिसे मैं अधिक बारीकी से जांचना चाहूंगा। आखिरकार, यह बुनियादी सामग्री है - बहुत सारे प्रश्न द्विपद परीक्षणों के बारे में पूछे गए हैं। इस नए होने का एकमात्र दावा यह है कि यह एक मंझले के परीक्षण की आवश्यकता के रूप में यहां आया है - इसलिए यह स्पष्ट रूप से शुरुआत में एक द्विपद परीक्षण नहीं था - और एकमात्र दावा मेरे जवाब के योग्य होने के लिए है पढ़ना हर कदम को समझाने के प्रयास में निहित है।
व्हीबेर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.