पृष्ठभूमि और शब्दावली
यह स्पष्ट करने के लिए कि हम क्या चर्चा कर रहे हैं, आइए कुछ अवधारणाओं और शब्दावली को स्थापित करें। अनुपातों के लिए एक अच्छा मॉडल द्विआधारी कलश है: इसमें या तो चांदी ("सफलता") या फ्यूशिया ("असफलता") के रंग वाली गेंदें होती हैं। कलश में चांदी के गोले का अनुपात हैp (लेकिन यह "अनुपात" नहीं है जिसके बारे में हम बात करेंगे)।
यह कलश एक बर्नौली ट्रायल के लिए एक रास्ता प्रदान करता है । एक प्रतीति प्राप्त करने के लिए , गेंदों को अच्छी तरह से मिलाएं और अपने रंग को देखते हुए नेत्रहीन रूप से एक को ड्रा करें। अतिरिक्त अहसास प्राप्त करने के लिए, पहले खींची गई गेंद को वापस करके बॉक्स को पुनर्गठित करें, फिर प्रक्रिया को कई बार पूर्व निर्धारित संख्या में दोहराएं। का क्रमn इसकी सफलताओं की गणना द्वारा वास्तविकताओं को संक्षेप में प्रस्तुत किया जा सकता है, X। यह एक यादृच्छिक चर है जिसके गुण पूरी तरह से निर्धारित होते हैंn तथा p। का वितरणX एक द्विपद कहा जाता है(n,p)वितरण। (प्रयोगात्मक, या "नमूना") अनुपात अनुपात हैX/n।
ये आंकड़े विभिन्न द्विपद अनुपात के लिए प्रायिकता वितरण के बारप्लेट हैं X/n। सबसे उल्लेखनीय एक सुसंगत पैटर्न है, इसकी परवाह किए बिनाn, जिसमें वितरण संकरा हो जाता है (और बार के समान बार) p से चलता है 1/2 नीचे।
के मानक विचलन X/nप्रश्न में वर्णित अनुपात की मानक त्रुटि है । किसी दिए गए के लिएn, यह मात्रा केवल पर निर्भर कर सकती है p। चलो बुलावा आयाse(p)। गेंदों की भूमिकाओं को स्विच करके - सिल्वर वाले को "फेल्योर" और फुकिया को "सक्सेस" कहते हैं - यह उसके लिए आसान हैse(p)=se(1−p)। इस प्रकार स्थिति जहांp=1−p--अर्थात्, p=1/2- विशेष होना। सवाल यह है कि कैसेse(p) के रूप में बदलता रहता है p से दूर चला जाता है 1/2 एक अधिक चरम मूल्य की ओर, जैसे कि 0।
ज्ञान बनाम समझ
क्योंकि हर किसी को अपनी शिक्षा में इस तरह के आंकड़े दिखाए गए हैं, हर कोई "जानता है" भूखंडों की चौड़ाई - जिनके द्वारा मापा जाता है से( पी )- घट के रूप में पी से दूर चला जाता है 1 / 2। लेकिन वह ज्ञान वास्तव में सिर्फ अनुभव है, जबकि प्रश्न गहरी समझ चाहता है। इस तरह की समझ द्विपदीय वितरण के सावधानीपूर्वक विश्लेषण से उपलब्ध है, जैसे कि अब्राहम डी मोइवर ने लगभग 300 साल पहले किया था। (वे उन लोगों की आत्मा के समान थे, जिन्हें मैंने केंद्रीय सीमा प्रमेय की चर्चा में प्रस्तुत किया था ।) मुझे लगता है, हालांकि, कुछ अपेक्षाकृत सरल विचार इस बात को बनाने के लिए पर्याप्त हो सकते हैं कि चौड़ाई के सबसे निकट होना चाहिएपी = 1 / 2।
एक सरल सहज विश्लेषण
यह स्पष्ट है कि हमें प्रयोग के सफल होने के अनुपात के करीब होने की उम्मीद करनी चाहिए पी। मानक त्रुटि चिंता का विषय है कि उस अपेक्षा से कितनी दूर हम वास्तविक परिणाम का अनुमान लगा सकते हैंएक्स/ एनझूठ होगा। सामान्यता के किसी भी नुकसान के बिना, आपूर्ति करनापी के बीच 0 तथा 1 / 2, इसे बढ़ाने के लिए क्या होगा एक्स/ एन से पी? आमतौर पर, चारों ओरपी एन एक प्रयोग में तैयार की गई गेंदों के चारों ओर चांदी थी (और) ( 1 - पी ) एनफुकिया थे। अधिक चांदी की गेंदों को पाने के लिए, उनमें से कुछपी एनफ्यूशिया के परिणामों में अंतर होना चाहिए था। यह कैसे संभव है कि मौका इस तरह से संचालित हो सकता है? स्पष्ट उत्तर यह है कि कबपीयह छोटा है, यह बहुत संभावना नहीं है कि हम एक चांदी की गेंद को आकर्षित करने जा रहे हैं। इस प्रकार, फुकिया के बजाय चांदी की गेंदों को खींचने की हमारी संभावना हमेशा कम होती है। हम यथोचित उम्मीद कर सकते हैं कि शुद्ध भाग्य से, एक अनुपातपीफुकिया के परिणामों में अंतर हो सकता था, लेकिन ऐसा लगता नहीं है कि इससे अधिक कई परिवर्तन हुए होंगे। इस प्रकार, यह प्रशंसनीय है किएक्स से बहुत अधिक भिन्न नहीं होगा पी × ( 1 - पी ) एन। तुल्य,एक्स/ एन से बहुत अधिक भिन्न नहीं होगा p(1−p)n/n=p(1−p)।
उपसंहार
इस प्रकार जादू संयोजन p(1−p)प्रकट होता है। यह वस्तुतः प्रश्न को सुलझाता है: जाहिर है कि यह मात्रा चोटियों पर हैp=1/2 और घटकर शून्य हो जाता है पी = 0 या पी = 1। यह दावे के लिए एक सहज ज्ञान युक्त अभी तक मात्रात्मक औचित्य प्रदान करता है कि "एक चरम दूसरे की तुलना में अधिक सीमित है" या अन्य ऐसे प्रयासों का वर्णन करने के लिए जो हम जानते हैं।
तथापि, पी ( 1 - पी ) काफी सही मूल्य नहीं है: यह केवल उस तरीके को इंगित करता है, जो हमें बताता है कि प्रसार के आकलन के लिए क्या मात्रा होनी चाहिए एक्स। हमने इस तथ्य को नजरअंदाज कर दिया है कि भाग्य भी हमारे खिलाफ काम करता है: जिस तरह कुछ फुकिया की गेंदों की चांदी हो सकती थी , उसी तरह की कुछ सिल्वर गेंदों की भी फुकिया हो सकती थी । कठोरता से सभी संभावनाओं का लेखा-जोखा जटिल हो सकता है, लेकिन इसका उपयोग करने के बजाय अपशॉट हैp ( 1 - पी ) एन कितना पर एक उचित सीमा के रूप में एक्स अपनी उम्मीद से भटक सकता है पी एन, सभी संभावित परिणामों को ठीक से समझने के लिए हमें वर्गमूल लेना होगा p ( 1 - पी ) एन--------√। (क्यों, के एक अधिक सावधान खाते के लिए, कृपया ( https://stats.stackexchange.com/a/3904 ) पर जाएं ।n, हम सीखते हैं कि अनुपात के यादृच्छिक बदलाव एक्स/ एन के आदेश पर ही होना चाहिए p ( 1 - पी ) एन--------√/n=p(1−p)n−−−−−√, जो मानक त्रुटि है X/n।