सेट के आकार का अनुमान लगाने में त्रुटि?


9

मान लीजिए हमारे पास एक सेट ए और एक सबसेट बी है अगर हम जानते हैं | ए |, तो हम गणना कर सकते हैं | बी | प्रायिकता p ज्ञात करने से कि A से यादृच्छिक रूप से समान रूप से चुना गया तत्व B से संबंधित है। विशेष रूप से | A | p | B |

मान लीजिए कि हम यादृच्छिक रूप से A के समान तत्व उत्पन्न करते हैं और इस डेटा का उपयोग p का अनुमान लगाने के लिए करते हैं (बी में तत्वों की संख्या n से विभाजित है और इसलिए अनुमान है: B |

यह अनुमान कितना विश्वसनीय है? यानी हम त्रुटि की गणना कैसे कर सकते हैं?

एक साइड सवाल के रूप में, क्या इस तकनीक का कोई नाम है? (यह मार्क-एंड-रिकैपचर तकनीक का गणितीय संस्करण लगता है )


1
यह द्विपद अनुमान है। (कोई अंकन है या बिल्कुल भी वापसी की जो hypergeometric आकलन करने के लिए होता है।।)
whuber

जवाबों:


8

आप अनुपात का अनुमान लगा रहे हैं। सहमति के लिए, कल्पना करें कि A मतदाताओं की आबादी है और B मतदाताओं का एक समूह है जो किसी विशेष उम्मीदवार को वोट देते हैं। इस प्रकार, पी मतदाताओं का प्रतिशत होगा जो उस उम्मीदवार को वोट देंगे। करते हैं:

π उन लोगों का सच्चा प्रतिशत होगा जो उम्मीदवार को वोट देंगे

दूसरे शब्दों में:

π=|बी|||

फिर आपके प्रत्येक नमूने में एक बर्नौली का परीक्षण प्रायिकता या समकक्ष आप यह कल्पना कर सकते हैं कि आपका प्रत्येक नमूना संभावित मतदाताओं का एक सर्वेक्षण है जो उनसे पूछ रहा है कि वे उम्मीदवार को वोट देंगे या नहीं। इस प्रकार, MLE of द्वारा दिया जाता है:ππ

पी=nबीn

कहाँ पे

nबी उन लोगों की संख्या है जिन्होंने कहा था कि वे उम्मीदवार या उन तत्वों की संख्या के लिए मतदान करेंगे जो आपके आकार नमूने में सेट B से संबंधित हैं ।n

आपके अनुमान के लिए मानक त्रुटि है:

π(1-π)n

इसके बाद के संस्करण के लिए MLE का प्रयोग करके लगाया जा सकता है , यानी द्वारा:π

पी(1-पी)n

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.