संक्षिप्त उत्तर:
मूल रूप से यह अधिक, 10 की वजह से छह बाहर 1000 से से बाहर 600 के लिए समझाने है दी बराबर वरीयताओं यह अब तक अधिक होने की संभावना 6 10 में से यादृच्छिक संयोग से उत्पन्न करने के लिए।
चलिए एक धारणा बनाते हैं - कि संतरे और सेब को पसंद करने वाले अनुपात वास्तव में बराबर हैं (इसलिए, प्रत्येक 50%)। इसे एक शून्य परिकल्पना कहें। इन समान संभावनाओं को देखते हुए दो परिणामों की संभावना है:
- 10 लोगों के नमूने को देखते हुए, अनियमित रूप से 6 या अधिक लोगों का एक नमूना प्राप्त करने की 38% संभावना है जो संतरे पसंद करते हैं (जो कि सभी संभावना नहीं है)।
- 1000 लोगों के नमूने में 600 में से 1 अरब से कम होने की संभावना है या 1000 में से अधिक लोग संतरे पसंद करते हैं।
(सादगी के लिए मैं एक असीम आबादी मान रहा हूं जहां से असीमित संख्या में नमूने लिए जा सकते हैं)।
एक साधारण व्युत्पत्ति
इस परिणाम को प्राप्त करने का एक तरीका केवल उन संभावित तरीकों को सूचीबद्ध करना है जिनसे लोग हमारे नमूनों में जुड़ सकते हैं:
दस लोगों के लिए यह आसान है:
सेब या संतरे के लिए समान वरीयताओं वाले लोगों की अनंत आबादी से यादृच्छिक पर 10 लोगों के नमूने लेने पर विचार करें। समान प्राथमिकताओं के साथ बस 10 लोगों के सभी संभावित संयोजनों को सूचीबद्ध करना आसान है:
यहां देखें पूरी लिस्ट
r C (n=10) p
10 1 0.09766%
9 10 0.97656%
8 45 4.39453%
7 120 11.71875%
6 210 20.50781%
5 252 24.60938%
4 210 20.50781%
3 120 11.71875%
2 45 4.39453%
1 10 0.97656%
0 1 0.09766%
1024 100%
r परिणाम की संख्या है (जो लोग संतरे पसंद करते हैं), C उस संतरे को पसंद करने वाले कई लोगों के संभावित तरीकों की संख्या है, और p इसके परिणामस्वरूप असतत संभावना है कि कई लोग हमारे नमूने में संतरे पसंद कर रहे हैं।
(p को केवल C की कुल संख्याओं से विभाजित किया गया है। ध्यान दें कि इन दो प्राथमिकताओं को व्यवस्थित करने के 1024 तरीके हैं (अर्थात 2 से 10 की शक्ति तक)।
- उदाहरण के लिए, सभी लोगों को पसंद करने के लिए 10 लोगों (आर = 10) के लिए केवल एक ही तरीका (एक नमूना) है। सेब को पसंद करने वाले सभी लोगों के लिए भी यही सच है (आर = 0)।
- 10 अलग-अलग संयोजन हैं, जिनमें से नौ संतरे पसंद करते हैं। (एक अलग व्यक्ति प्रत्येक नमूने में सेब को प्राथमिकता देता है)।
- 45 नमूने (संयोजन) हैं जहां 2 लोग सेब, आदि को पसंद करते हैं।
(सामान्य तौर पर हम n लोगों के नमूने के r r परिणामों के n C संयोजनों के बारे में बात करते हैं। ऑनलाइन कैलकुलेटर हैं जिनका उपयोग आप इन संख्याओं को सत्यापित करने के लिए कर सकते हैं।)
यह सूची हमें सिर्फ विभाजन का उपयोग करके उपरोक्त संभावनाएं प्रदान करने की अनुमति देती है। नमूने में 6 लोगों को प्राप्त करने की 21% संभावना है जो संतरे पसंद करते हैं (संयोजन के 1024 में से 210)। हमारे नमूने में छह या अधिक लोगों को पाने का मौका 38% है (छह या अधिक लोगों के साथ सभी नमूनों का योग, या 1024 संयोजनों में से 386)।
रेखांकन, संभावनाएं इस तरह दिखती हैं:
बड़ी संख्या के साथ, संभावित संयोजनों की संख्या तेजी से बढ़ती है।
सिर्फ 20 लोगों के नमूनों के लिए 1,048,576 संभावित नमूने हैं, सभी समान संभावना वाले हैं। (नोट: मैंने केवल हर दूसरे संयोजन को नीचे दिखाया है)
r C (n=20) p
20 1 0.00010%
18 190 0.01812%
16 4,845 0.46206%
14 38,760 3.69644%
12 125,970 12.01344%
10 184,756 17.61971%
8 125,970 12.01344%
6 38,760 3.69644%
4 4,845 0.46206%
2 190 0.01812%
0 1 0.00010%
1,048,576 100%
अभी भी केवल एक नमूना है जहां सभी 20 लोग संतरे पसंद करते हैं। मिश्रित परिणाम पेश करने वाले संयोजन बहुत अधिक होने की संभावना है, बस इसलिए कि कई और तरीके हैं जो नमूनों में लोगों को जोड़ सकते हैं।
नमूने जो पक्षपाती हैं, बहुत अधिक संभावना नहीं है, सिर्फ इसलिए कि लोगों के कम संयोजन हैं जो उन नमूनों में परिणाम कर सकते हैं:
प्रत्येक नमूने में सिर्फ 20 लोगों के साथ, हमारे नमूने में 60% या अधिक (12 या अधिक) लोगों की संचयी संभावना केवल 25% संतरे की बूंदों को पसंद करती है।
संभावना वितरण पतले और लम्बे होते देखे जा सकते हैं:
1000 लोगों के साथ संख्या बहुत बड़ी है
हम उपरोक्त उदाहरणों को बड़े नमूनों तक बढ़ा सकते हैं (लेकिन सभी संयोजनों को सूचीबद्ध करने के लिए संभव होने के लिए संख्या बहुत तेज़ी से बढ़ती है), इसके बजाय मैंने आर में संभावनाओं की गणना की है:
r p (n=1000)
1000 9.332636e-302
900 5.958936e-162
800 6.175551e-86
700 5.065988e-38
600 4.633908e-11
500 0.02522502
400 4.633908e-11
300 5.065988e-38
200 6.175551e-86
100 5.958936e-162
0 9.332636e-302
1000 में से 600 या अधिक लोगों की संचयी संभावना है कि संतरे सिर्फ 1.364232e-10 हैं।
संभावना वितरण अब केंद्र के आसपास बहुत अधिक केंद्रित है:
[
(उदाहरण के लिए, आर उपयोग में पसंद करने वाले 1000 लोगों में से 600 में से ठीक 600 की संभावना की गणना करने के लिए dbinom(600, 1000, prob=0.5)
जो 4.633908e-11 के बराबर है, और 600 या अधिक लोगों की संभावना है 1-pbinom(599, 1000, prob=0.5)
, जो 1.364232e-10 (एक बिलियन में 1 से कम) के बराबर है।