व्यावहारिक अनुप्रयोग में प्रतिस्थापन के बिना नमूने पर विचार क्यों करें?


13

प्रतिस्थापन के साथ नमूने के नमूने पर प्रतिस्थापन के बिना दो फायदे हैं जैसे कि मैं इसे देखता हूं:

1) आपको परिमित जनसंख्या सुधार के बारे में चिंता करने की आवश्यकता नहीं है।

2) एक मौका है कि आबादी से तत्वों को कई बार खींचा जाता है - फिर आप माप को रीसायकल कर सकते हैं और समय बचा सकते हैं।

बेशक एक शैक्षिक पीओवी से दोनों तरीकों की जांच करनी होगी। लेकिन एक व्यावहारिक पीओवी से मैं यह नहीं देखता कि प्रतिस्थापन के बिना नमूने को बदलने पर विचार क्यों किया जाएगा।

लेकिन मैं आंकड़ों में एक शुरुआती हूं, इसलिए बहुत सारे अच्छे कारण हो सकते हैं कि प्रतिस्थापन के बिना बेहतर विकल्प क्यों हो सकते हैं - कम से कम विशिष्ट उपयोग के मामलों के लिए। कृपया, मुझे अपुष्ट करें!


3
संकेत: विचार करें कि परिमित जनसंख्या सुधार लागू करने का क्या प्रभाव है, और यह लाभप्रद क्यों हो सकता है। (यह भी ध्यान रखें कि (1) रकम कर लगभग हमेशा कम परेशानी और डेटा इकट्ठा करने की तुलना में व्यय है, (2) यदि आप व्यक्तियों तुम नहीं "पुनरावृत्ति" माप चाहिए भेद कर सकते हैं, लेकिन केवल विशिष्ट व्यक्तियों के आधार पर अनुमान।)
Scortchi - को फिर से बहाल मोनिका

ईमानदारी से, मैं वास्तव में आपके किसी भी दावे को नहीं समझता हूं। एफपीसी माप की स्वतंत्रता की कमी के संख्यात्मक परिणामों की भरपाई करता है। लेकिन मुझे नहीं पता कि यह क्यों फायदेमंद है। (१) यह मेरे प्रश्न से कैसे संबंधित है? (२) आप "माप" क्यों नहीं करते? प्रतिस्थापन के साथ नमूना करते समय संयोगवश दो बार एक ही वस्तु को खींचने के प्रत्यक्ष तार्किक परिणाम नहीं है?
राफेल

जवाबों:


13

@Scortchi के उत्तर पर विस्तार। । ।

मान लीजिए जनसंख्या में 5 सदस्य थे और आपके पास 5 व्यक्तियों के नमूने के लिए बजट है। आप चर X की जनसंख्या माध्य में रुचि रखते हैं, इस जनसंख्या में व्यक्तियों की विशेषता है। आप इसे अपने तरीके से कर सकते हैं, और बेतरतीब ढंग से नमूना प्रतिस्थापन के साथ। नमूना माध्य का विचरण V (X) / 5 होगा।

दूसरी ओर, मान लीजिए कि आप प्रतिस्थापन के बिना पांच व्यक्तियों का नमूना लेते हैं। फिर, नमूना माध्य का विचरण 0. है। आपने पूरी आबादी को, प्रत्येक व्यक्ति को एक ही बार सैंपल दिया है, इसलिए "नमूना माध्य" और "जनसंख्या माध्य" में कोई अंतर नहीं है। वे एक जैसी ही चीज हैं।

वास्तविक दुनिया में, आपको हर बार खुशी के लिए कूदना चाहिए जब आपको परिमित जनसंख्या सुधार करना होगा क्योंकि (ड्रमोल।) यह आपके अनुमानक के विचरण को कम कर देता है, जबकि आप अधिक डेटा एकत्र किए बिना नीचे जाते हैं। लगभग कुछ भी ऐसा नहीं करता है। यह जादू की तरह है: अच्छा जादू।

गणित में सटीक एक ही बात कहना (ध्यान देना <, और मान लेना नमूना आकार 1 से अधिक है):

finite sample correction=NnN1<N1N1=1

सुधार <1 का अर्थ है कि सुधार लागू करना विचरण को कम करता है, 'क्योंकि आप इसे विचरण के विरुद्ध गुणा करके सुधार को लागू करते हैं। विविध डाउनलोड == अच्छा।

विपरीत दिशा में चलते हुए, पूरी तरह से गणित से दूर, सोचें कि आप क्या पूछ रहे हैं। यदि आप जनसंख्या के बारे में जानना चाहते हैं और आप इसमें से 5 लोगों का नमूना ले सकते हैं, तो क्या यह संभावना है कि आप एक ही आदमी को 5 बार नमूना लेने के द्वारा अधिक सीखेंगे या क्या यह अधिक संभावना है कि आप सुनिश्चित करके अधिक सीखेंगे आप 5 अलग-अलग लोगों का नमूना लेते हैं?

वास्तविक विश्व का मामला लगभग वही है जो आप कह रहे हैं। लगभग कभी भी आप प्रतिस्थापन के साथ नमूना नहीं करते हैं --- यह केवल तब होता है जब आप बूटस्ट्रैपिंग जैसी विशेष चीजें कर रहे होते हैं। उस मामले में, आप वास्तव में अनुमान लगाने वाले को पेंच करने और इसे "बहुत बड़ा" विचरण देने की कोशिश कर रहे हैं।


"बूटस्ट्रैपिंग" के तहत, मैं आबादी के पैरामीटर का अनुमान लगाने के लिए जनसंख्या के पैरामीटर के स्थान पर नमूने के एक पैरामीटर का उपयोग कर समझता हूं। आप अनुमानक को "पेंच" करने और इसे "बहुत बड़ा" संस्करण देने में रुचि क्यों लेंगे?
राफेल

1
@ Яaffael मैं गैर पैरामीट्रिक बूटस्ट्रैपिंग के बारे में बात कर रहा हूं। आप अपना नमूना लेते हैं (आकार 100 के बारे में), प्रतिस्थापन से इसे फिर से नमूना लें (आकार 100 के बूटस्ट्रैप नमूने से 100 गुना उपज), और फिर ब्याज के अपने अनुमानक की फिर से गणना करें। आप नमूना को एक खिलौना आबादी के रूप में मान रहे हैं, एक नमूना का अनुकरण करते हुए, एक अनुमानक की गणना कर रहा है। यदि आप प्रतिस्थापन के बिना खिलौना आबादी से नमूना लेते हैं, तो आप नमूने में खिलौना आबादी की बिल्कुल नकल करेंगे, मूल अनुमान नए अनुमान के रूप में प्राप्त होगा (अर्थात विचरण = 0)। इससे बचने के लिए, इसलिए आप प्रतिस्थापन के साथ नमूना लें।
बिल

5

प्रतिस्थापन के साथ नमूनों की तुलना के बिना अनुमानों की सटीकता आम तौर पर नमूनाकरण के लिए अधिक होती है।

उदाहरण के लिए, चरम मामले में प्रतिस्थापन के साथ नमूनाकरण किए जाने पर केवल एक तत्व बार का चयन करना संभव है । इससे ब्याज के जनसंख्या पैरामीटर का बहुत ही गलत अनुमान लग सकता है। प्रतिस्थापन के बिना नमूने के तहत ऐसी स्थिति संभव नहीं है। इसलिए आम तौर पर प्रतिस्थापन के बिना नमूने से किए गए अनुमानों के लिए विचरण कम होता है।n


2

मुझे नहीं लगता कि यहां उत्तर पूरी तरह से पर्याप्त हैं, और वे सीमित मामले के लिए बहस करते हैं जिसमें आपका डेटा बहुत कम है।

पर्याप्त रूप से बड़े नमूने के साथ, यह बिल्कुल भी चिंता का विषय नहीं है, विशेष रूप से कई बूटस्ट्रैप के अवशेष (~ 1000) के साथ। यदि मैंने सही वितरण से आकार 10,000 के डेटासेट का नमूना लिया है, और मैं 1,000 बार प्रतिस्थापन के साथ फिर से तैयार करता हूं, तो मैं जो भिन्नता प्राप्त करता हूं (जैसा कि बिना प्रतिस्थापन के मुझे प्राप्त होता है, उसके विपरीत ) पूरी तरह से नगण्य है।

मैं कहूंगा कि अधिक सटीक उत्तर यह है: एक दूसरे क्रम के आंकड़े के विश्वास का अनुमान लगाने के दौरान प्रतिस्थापन के बिना पुन: नमूनाकरण आवश्यक है । उदाहरण के लिए, यदि मैं एक फैलाव माप में अनिश्चितता का अनुमान लगाने के लिए बूटस्ट्रैप का उपयोग कर रहा हूं। इस तरह की मात्रा के लिए प्रतिस्थापन के साथ आरेखण कृत्रिम रूप से बरामद किए गए फैलाव को कम कर सकता है।

वास्तविक डेटा के साथ एक ठोस उदाहरण के लिए, यदि आप इसके ऊपर हैं, तो इस पेपर को देखें https://arxiv.org/abs/1612.02827

यह पृष्ठ 10 पर आपके प्रश्न की संक्षिप्त चर्चा करता है


0

मेरे पास एक परिणाम है जो प्रतिस्थापन के साथ व्यावहारिक रूप से प्रतिस्थापन के बिना व्यवहार करता है और सभी कठिनाइयों को दूर करता है। ध्यान दें कि प्रतिस्थापन गणना के साथ बहुत आसान है। इसलिए, यदि एक संभावना में p और q शामिल हैं, तो प्रतिस्थापन मामले के साथ, सफलता और विफलता की संभावनाएं, प्रतिस्थापन मामले के बिना संबंधित संभावना केवल p ^ aq ^ b (NAB) C (Ra) के प्रतिस्थापन के साथ प्राप्त होती है। कोई भी और बी, जहां एन, आर कुल गेंदों की संख्या और सफेद गेंदों की संख्या है। याद रखें कि पी को आर / एन के रूप में माना जाता है।

K.Balasubramanian


एक चूक थी। (एनएबी) सी (रा) / (एनसीआर) सही अभिव्यक्ति है। उदाहरण के लिए np n (N-1-0) / (R-1) / NCR बन जाता है। आप ऐसे किसी भी परिणाम की जांच कर सकते हैं।
कृष बालासुब्रमण्यम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.