किसी अनुपात के लिए मानक त्रुटि, किसी दिए गए n के लिए, 0.5 के लिए सबसे बड़ी क्यों है?


10

एक अनुपात की मानक त्रुटि सबसे बड़ी होगी यह किसी दिए गए N के लिए हो सकती है जब प्रश्न में अनुपात 0.5 होता है, और आगे अनुपात 0.5 से छोटा होता है। मैं देख सकता हूं कि जब मैं अनुपात के मानक त्रुटि के लिए समीकरण को देखता हूं तो ऐसा क्यों होता है, लेकिन मैं इसे आगे नहीं बता सकता।

क्या सूत्र के गणितीय गुणों से परे एक स्पष्टीकरण है? यदि ऐसा है, तो अनुमानित अनुपात (किसी दिए गए एन) के आसपास कम अनिश्चितता क्यों है क्योंकि वे 0 या 1 के करीब हैं?

जवाबों:


8

पृष्ठभूमि और शब्दावली

यह स्पष्ट करने के लिए कि हम क्या चर्चा कर रहे हैं, आइए कुछ अवधारणाओं और शब्दावली को स्थापित करें। अनुपातों के लिए एक अच्छा मॉडल द्विआधारी कलश है: इसमें या तो चांदी ("सफलता") या फ्यूशिया ("असफलता") के रंग वाली गेंदें होती हैं। कलश में चांदी के गोले का अनुपात हैपी (लेकिन यह "अनुपात" नहीं है जिसके बारे में हम बात करेंगे)।

यह कलश एक बर्नौली ट्रायल के लिए एक रास्ता प्रदान करता है । एक प्रतीति प्राप्त करने के लिए , गेंदों को अच्छी तरह से मिलाएं और अपने रंग को देखते हुए नेत्रहीन रूप से एक को ड्रा करें। अतिरिक्त अहसास प्राप्त करने के लिए, पहले खींची गई गेंद को वापस करके बॉक्स को पुनर्गठित करें, फिर प्रक्रिया को कई बार पूर्व निर्धारित संख्या में दोहराएं। का क्रमn इसकी सफलताओं की गणना द्वारा वास्तविकताओं को संक्षेप में प्रस्तुत किया जा सकता है, एक्स। यह एक यादृच्छिक चर है जिसके गुण पूरी तरह से निर्धारित होते हैंn तथा पी। का वितरणX एक द्विपद कहा जाता है(n,p)वितरण। (प्रयोगात्मक, या "नमूना") अनुपात अनुपात हैX/n

आकृति

ये आंकड़े विभिन्न द्विपद अनुपात के लिए प्रायिकता वितरण के बारप्लेट हैं X/n। सबसे उल्लेखनीय एक सुसंगत पैटर्न है, इसकी परवाह किए बिनाn, जिसमें वितरण संकरा हो जाता है (और बार के समान बार) p से चलता है 1/2 नीचे।

के मानक विचलन X/nप्रश्न में वर्णित अनुपात की मानक त्रुटि है । किसी दिए गए के लिएn, यह मात्रा केवल पर निर्भर कर सकती है पी। चलो बुलावा आयाse(p)। गेंदों की भूमिकाओं को स्विच करके - सिल्वर वाले को "फेल्योर" और फुकिया को "सक्सेस" कहते हैं - यह उसके लिए आसान हैse(p)=se(1p)। इस प्रकार स्थिति जहांp=1p--अर्थात्, p=1/2- विशेष होना। सवाल यह है कि कैसेse(p) के रूप में बदलता रहता है p से दूर चला जाता है 1/2 एक अधिक चरम मूल्य की ओर, जैसे कि 0

ज्ञान बनाम समझ

क्योंकि हर किसी को अपनी शिक्षा में इस तरह के आंकड़े दिखाए गए हैं, हर कोई "जानता है" भूखंडों की चौड़ाई - जिनके द्वारा मापा जाता है se(p)- घट के रूप में p से दूर चला जाता है 1/2। लेकिन वह ज्ञान वास्तव में सिर्फ अनुभव है, जबकि प्रश्न गहरी समझ चाहता है। इस तरह की समझ द्विपदीय वितरण के सावधानीपूर्वक विश्लेषण से उपलब्ध है, जैसे कि अब्राहम डी मोइवर ने लगभग 300 साल पहले किया था। (वे उन लोगों की आत्मा के समान थे, जिन्हें मैंने केंद्रीय सीमा प्रमेय की चर्चा में प्रस्तुत किया था ।) मुझे लगता है, हालांकि, कुछ अपेक्षाकृत सरल विचार इस बात को बनाने के लिए पर्याप्त हो सकते हैं कि चौड़ाई के सबसे निकट होना चाहिएp=1/2

एक सरल सहज विश्लेषण

यह स्पष्ट है कि हमें प्रयोग के सफल होने के अनुपात के करीब होने की उम्मीद करनी चाहिए पी। मानक त्रुटि चिंता का विषय है कि उस अपेक्षा से कितनी दूर हम वास्तविक परिणाम का अनुमान लगा सकते हैंएक्स/nझूठ होगा। सामान्यता के किसी भी नुकसान के बिना, आपूर्ति करनापी के बीच 0 तथा 1/2, इसे बढ़ाने के लिए क्या होगा एक्स/n से पी? आमतौर पर, चारों ओरपीn एक प्रयोग में तैयार की गई गेंदों के चारों ओर चांदी थी (और) (1-पी)nफुकिया थे। अधिक चांदी की गेंदों को पाने के लिए, उनमें से कुछपीnफ्यूशिया के परिणामों में अंतर होना चाहिए था। यह कैसे संभव है कि मौका इस तरह से संचालित हो सकता है? स्पष्ट उत्तर यह है कि कबपीयह छोटा है, यह बहुत संभावना नहीं है कि हम एक चांदी की गेंद को आकर्षित करने जा रहे हैं। इस प्रकार, फुकिया के बजाय चांदी की गेंदों को खींचने की हमारी संभावना हमेशा कम होती है। हम यथोचित उम्मीद कर सकते हैं कि शुद्ध भाग्य से, एक अनुपातपीफुकिया के परिणामों में अंतर हो सकता था, लेकिन ऐसा लगता नहीं है कि इससे अधिक कई परिवर्तन हुए होंगे। इस प्रकार, यह प्रशंसनीय है किएक्स से बहुत अधिक भिन्न नहीं होगा पी×(1-पी)n। तुल्य,एक्स/n से बहुत अधिक भिन्न नहीं होगा p(1p)n/n=p(1p)

उपसंहार

इस प्रकार जादू संयोजन p(1p)प्रकट होता है। यह वस्तुतः प्रश्न को सुलझाता है: जाहिर है कि यह मात्रा चोटियों पर हैp=1/2 और घटकर शून्य हो जाता है p=0 या p=1। यह दावे के लिए एक सहज ज्ञान युक्त अभी तक मात्रात्मक औचित्य प्रदान करता है कि "एक चरम दूसरे की तुलना में अधिक सीमित है" या अन्य ऐसे प्रयासों का वर्णन करने के लिए जो हम जानते हैं।

तथापि, p(1p) काफी सही मूल्य नहीं है: यह केवल उस तरीके को इंगित करता है, जो हमें बताता है कि प्रसार के आकलन के लिए क्या मात्रा होनी चाहिए एक्स। हमने इस तथ्य को नजरअंदाज कर दिया है कि भाग्य भी हमारे खिलाफ काम करता है: जिस तरह कुछ फुकिया की गेंदों की चांदी हो सकती थी , उसी तरह की कुछ सिल्वर गेंदों की भी फुकिया हो सकती थी । कठोरता से सभी संभावनाओं का लेखा-जोखा जटिल हो सकता है, लेकिन इसका उपयोग करने के बजाय अपशॉट हैपी(1-पी)n कितना पर एक उचित सीमा के रूप में एक्स अपनी उम्मीद से भटक सकता है पीn, सभी संभावित परिणामों को ठीक से समझने के लिए हमें वर्गमूल लेना होगा पी(1-पी)n। (क्यों, के एक अधिक सावधान खाते के लिए, कृपया ( https://stats.stackexchange.com/a/3904 ) पर जाएंn, हम सीखते हैं कि अनुपात के यादृच्छिक बदलाव एक्स/n के आदेश पर ही होना चाहिए p(1p)n/n=p(1p)n, जो मानक त्रुटि है X/n


3

0 <= p <= 1 के लिए फ़ंक्शन p (1-p) पर विचार करें। पथरी का उपयोग करके आप देख सकते हैं कि p = 1/2 पर यह 1/4 है जो कि अधिकतम मूल्य है। यदि आप देख सकते हैं कि यह द्विपदीय से संबंधित है, तो यह अनुपात के अनुमान के मानक विचलन से है जो sqrt (p (1-p) / n) है तो p = 1/2 अधिकतम है। जब p = 1 या 0 मानक त्रुटि 0 है, क्योंकि आपको हमेशा सभी 1s या सभी 0s क्रमशः मिलेंगे। इसलिए जैसा कि आप 0 या 1 के करीब पहुंचते हैं, एक निरंतरता तर्क कहता है कि मानक त्रुटि 0 के पास पहुंच जाती है जैसे कि p दृष्टिकोण 0 या 1। वास्तव में यह p के रूप में एकात्मक रूप से घटता है p दृष्टिकोण 0 या 1. बड़े एन के लिए अनुमानित अनुपात वास्तविक के करीब होना चाहिए। अनुपात।


3
ओपी ने पहले ही टिप्पणी की है कि "मैं देख सकता हूं कि ऐसा क्यों है जब मैं किसी अनुपात की मानक त्रुटि के लिए समीकरण देखता हूं।" इसलिए मेरा मानना ​​है कि वे सूत्र के विश्लेषण के लिए नहीं पूछ रहे हैंp(1p), लेकिन इसके बजाय सूत्र की गहरी समझ के लिए - जो कुछ भी हो सकता है - वास्तव में अधिकतम होना चाहिएp=1/2
whuber

1
@ जब मैंने ऐसा किया तो मैंने जवाब दिया क्योंकि मैं देख रहा हूं कि सूत्र यह समझने के लिए मौलिक है कि विचलन p = 1/2 पर सबसे बड़ा क्यों है और जब p 0 या 1 के पास हो तो बहुत छोटा हो सकता है। शायद यह कहना सबसे अच्छा है कि वहाँ सूत्र से पूरी तरह से रहित कोई स्पष्टीकरण नहीं है।
माइकल आर। चेर्निक

1

द्विपद बंटन (बड़े के लिए मोटे तौर पर सममित हो जाता हैnयह लगभग सामान्य है )।

चूंकि अनुपात 0 और 1 के बीच होना चाहिए, अनिश्चितता इन सीमाओं से विवश होगी। जब तक माध्य अनुपात बिल्कुल बीच में नहीं होता है, तब तक इनमें से एक सीमा दूसरे की तुलना में अधिक सीमित होगी।

एक सममित अनिमोडल बेल वक्र के लिए केंद्रित है p इकाई अंतराल में फिट होने के लिए, इसकी आधी चौड़ाई से कम होनी चाहिए min[p,1p]


हाँ - लेकिन अन्य बाध्य कम सीमित हो जाएगा! दो प्रभाव रद्द क्यों नहीं होते?
whuber

@ जब मैं सममिति से बहस कर रहा था (यानी सरल "बड़े" में n"मामला, सममित घंटी वक्र अंतराल में फिट होना चाहिए, इसलिए इसकी आधी चौड़ाई तंग पक्ष द्वारा विवश है," मिनट[पी,1-पी])
GeoMatt22
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.