द्विपद यादृच्छिक चर के नमूने के लिए मानक त्रुटि


44

मान लीजिए मैं एक प्रयोग कर रहा हूं जिसमें 2 परिणाम हो सकते हैं, और मैं यह मान रहा हूं कि 2 परिणामों का अंतर्निहित "सत्य" वितरण पैरामीटर और : साथ एक द्विपद वितरण है ।nB i n o m i a l ( n , p )pBinomial(n,p)

मैं मानक त्रुटि की गणना कर सकता हूं, , के विचरण के रूप में : जहां । तो, । मुझे मिलने वाली मानक त्रुटि के लिए: , लेकिन मैंने कहीं ऐसा देखा है कि । मैंने गलत क्या किया? बीमैंएनमीटरमैंकिसीएल(एन,पी)σ2एक्स=nपीक्षक्ष=1-पीσएक्स=SEX=σXnBinomial(n,p)

σX2=npq
q=1p एसएक्स=σX=npq एसएक्स=SEX=pqSEX=pqn

यह आलेख माध्य प्रभावशाली
Training/…

मेरे googling से, ऐसा प्रतीत होता है कि द्विपद वितरण के लिए आत्मविश्वास अंतराल प्राप्त करने का निकट संबंधी विषय बल्कि बारीक और जटिल है। विशेष रूप से, यह इस सूत्र से प्राप्त आत्मविश्वास अंतराल की तरह दिखता है, जो "Wald Intervals" होगा ( en.wikipedia.org/wiki/Binomial_proportion_confidence_interval ) देखें , बल्कि इसे खराब माना जाता है और इसे टाला जाना चाहिए। अधिक जानकारी के लिए jstor.org/stable/2676784?seq=1#metadata_info_tab_contents देखें ।
जलचर कछुए

जवाबों:


58

ऐसा लगता है कि आप दो अलग-अलग तरीकों से दो बार का उपयोग कर रहे हैं - दोनों नमूना आकार के रूप में और बर्नौली परीक्षणों की संख्या के रूप में जो द्विपद यादृच्छिक चर शामिल हैं; किसी भी अस्पष्टता को खत्म करने के लिए, मैं उत्तरार्द्ध को संदर्भित करने के लिए का उपयोग करने जा रहा हूं ।केnk

यदि आपके पास एक से स्वतंत्र नमूने वितरण, उनके नमूने माध्य का विचरण हैB i n o m i a l ( k , p )nBinomial(k,p)

var(1ni=1nXi)=1n2i=1nvar(Xi)=nvar(Xi)n2=var(Xi)n=kpqn

जहाँ और एक ही माध्य है। इसके बाद सेq=1pX¯

(1) , किसी भी यादृच्छिक चर, और किसी भी स्थिर ।var(cX)=c2var(X)Xc

(2) स्वतंत्र यादृच्छिक चर की राशि का विचरण, भिन्न के योग के बराबर होता है

की मानक त्रुटि विचरण का वर्गमूल है: । इसलिए,X¯kpqn

  • जब , आपको वह सूत्र मिलता है जो आपने बताया था:k=npq

  • जब , और द्विपद चर केवल बर्नौली परीक्षण होते हैं , तो आपको वह सूत्र मिलता है जिसे आपने कहीं और देखा है:k=1pqn


3
जब एक बर्नौली यादृच्छिक चर होता है, तो । जब में सफलता की संभावना साथ परीक्षणों पर आधारित एक द्विपद यादृच्छिक चर है , तोv a r ( X ) = p q X n p v a r ( X ) = n p qXvar(X)=pqXnpvar(X)=npq
मैक्रो

2
धन्यवाद! आपने मेरा भ्रम दूर कर दिया। क्षमा करें कि यह इतना प्राथमिक था, मैं अभी भी सीख रहा हूं :-)
फ्रैंक

6
तो क्या फ्रैंक को यह स्पष्ट है कि हम इस तथ्य का उपयोग कर रहे हैं कि किसी भी निरंतर c Var (cX) = c Var (x) के लिए? चूँकि अनुपात का नमूना अनुमान X / n है हमारे पास Var (X / n) = Var (X) / n = npq / n = pq / n है और SEx उसी का वर्गमूल है। मुझे लगता है कि यदि हम सभी चरणों को पूरा करते हैं तो यह सभी के लिए स्पष्ट है। 222
माइकल चेरिक

1
@MichaelChernick, मैंने आपके द्वारा बताए गए विवरणों को स्पष्ट किया है। समस्या वर्णन के आधार पर, मुझे लगा कि फ्रैंक इन तथ्यों को जानते हैं, लेकिन आप सही हैं कि भविष्य के पाठकों के लिए विवरणों को शामिल करना अधिक शैक्षिक होगा।
मैक्रो

2
सोल लागो - इस मामले में k = 1। यदि आप 50 बार एक सिक्का फ़्लिप करते हैं और सफलताओं की संख्या की गणना करते हैं और फिर प्रयोग को 50 बार दोहराया जाता है, तो k = n = 50। एक सिक्के का एक फ्लिप 1 या 0. में परिणत होता है। यह एक बर्नोली आरवी है
B_Miner

9

दो द्विपद वितरणों को भ्रमित करना आसान है:

  • सफलताओं की संख्या का वितरण
  • सफलताओं के अनुपात का वितरण

npq सफलताओं की संख्या है, जबकि npq / n = pq सफलताओं का अनुपात है। इसके परिणामस्वरूप विभिन्न मानक त्रुटि सूत्र हैं।


6

हम इसे इस तरह से देख सकते हैं:

मान लीजिए हम एक प्रयोग कर रहे हैं जहाँ हमें एक निष्पक्ष सिक्के को बार टॉस करने की आवश्यकता है । प्रयोग का समग्र परिणाम जो व्यक्तिगत tosses (जैसे, 1 के रूप में सिर और 0 के रूप में पूंछ) का योग है। तो, इस प्रयोग के लिए, , जहां व्यक्तिगत tosses के परिणाम हैं।वाई वाई = Σ n मैं = 1 एक्स मैं एक्स मैंnYY=i=1nXiXi

यहां, प्रत्येक टॉस का परिणाम, , एक बर्नौली वितरण का अनुसरण करता है और समग्र परिणाम एक द्विपद वितरण का अनुसरण करता है। वाईXiY

संपूर्ण प्रयोग को एकल नमूने के रूप में सोचा जा सकता है। इस प्रकार, यदि हम प्रयोग को दोहराते हैं, तो हम का एक और मूल्य प्राप्त कर सकते हैं , जो एक और नमूना बनाएगा। सभी संभावित मूल्य पूर्ण जनसंख्या का गठन करेंगे।Y यYY

एकल सिक्का टॉस के लिए वापस आ रहा है, जो एक बर्नौली वितरण का अनुसरण करता है, विचरण द्वारा दिया जाता है , जहां सिर (सफलता) और की संभावना है ।पीpqpq=1p

अब, यदि हम , । लेकिन, सभी व्यक्तिगत बर्नौली प्रयोगों के लिए, । चूँकि प्रयोग में tosses या Bernoulli परीक्षण हैं, । इसका मतलब है कि में विचरण ।YV(Y)=V(Xi)=V(Xi)V(Xi)=pqnV(Y)=V(Xi)=npqYnpq

अब, नमूना अनुपात द्वारा दिया जाता है , जो 'सफलता या सिर का अनुपात' देता है। यहाँ, एक स्थिरांक है क्योंकि हम योजना बनाते हैं कि जनसंख्या में सभी प्रयोगों के लिए एक ही सिक्का नहीं लिया जाए।p^=Ynn

तो, ।V(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n

इसलिए, (एक नमूना आँकड़ा) के लिए मानक त्रुटिp^pq/n


आप अपने गणित के आसपास डॉलर लगाकर लेटेक्स टाइपसेटिंग का उपयोग कर सकते हैं, उदाहरण के लिए$x$ देता है । x
सिल्वरफिश

ध्यान दें कि चरण वास्तव में कुछ औचित्य के हकदार हैं! V(Xi)=V(Xi)
सिल्वरफिश

अंतिम कटौती में टाइपो है, V (Y / n) = (1 / n ^ 2) * V (Y) = (1 / n ^ 2) * npq = pq / n सही कटौती होनी चाहिए।
ताराशंकर

क्षमायाचना, मैंने बताया कि टाइपिंग करते समय। अब उम्मीद है कि हल किया जाएगा।
सिल्वरफिश

1
यह सच है अगर असंबद्ध हैं - इसे सही ठहराने के लिए, हम इस तथ्य का उपयोग करते हैं कि परीक्षणों को स्वतंत्र माना जाता है। Xi
सिल्वरफिश

2

मुझे लगता है कि मानक त्रुटि और मानक विचलन के बीच प्रारंभिक पोस्ट में कुछ भ्रम भी है। मानक विचलन एक वितरण के विचरण का वर्ग है; मानक त्रुटि उस वितरण से नमूने के अनुमानित माध्य का मानक विचलन है, अर्थात, यदि आप उस नमूने को अनंत बार कई बार करते हैं, तो इसका मतलब है कि आप इसका निरीक्षण करेंगे। पूर्व वितरण की एक आंतरिक संपत्ति है; उत्तरार्द्ध वितरण के एक संपत्ति (माध्य) के आपके अनुमान की गुणवत्ता का एक उपाय है। जब आप सफलता की अज्ञात संभावना का अनुमान लगाने के लिए एन बर्नौली ट्रायल का एक प्रयोग करते हैं, तो k सफलताओं को देखने के बाद आपके अनुमानित p = k / N की अनिश्चितता अनुमानित अनुपात, sqrt (pq / N) की एक मानक त्रुटि है जहां = 1 -p। सच्चा वितरण एक पैरामीटर पी की विशेषता है, सफलता की सही संभावना।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.