क्या "हर नीली टी-शर्ट वाला व्यक्ति" एक व्यवस्थित नमूना है?


17

मैं एक इंट्रो स्टैटिस्टिक्स क्लास पढ़ा रहा हूं और सैंपलिंग के प्रकारों की समीक्षा कर रहा था, जिसमें व्यवस्थित सैंपलिंग भी शामिल है जहां आप हर केथ इंडिविजुअल या ऑब्जेक्ट का सैंपल लेते हैं।

एक छात्र ने पूछा कि क्या प्रत्येक व्यक्ति को किसी विशेष विशेषता के साथ नमूना लेना एक ही बात को पूरा करेगा।

उदाहरण के लिए, क्या नीली टी-शर्ट वाले प्रत्येक व्यक्ति का नमूना पर्याप्त यादृच्छिक होगा और पूरी आबादी का प्रतिनिधित्व करने के लिए पर्याप्त होगा? कम से कम, यदि आप एक प्रश्न पूछ रहे हैं कि "आप किस रंग की टी-शर्ट पहनना पसंद करते हैं?" मेरी समझ में नहीं है, लेकिन मुझे आश्चर्य है कि अगर यहाँ किसी को भी इस पर कोई विचार था।


12
नहीं, यदि आप ग्लासगो, स्कॉटलैंड में रहते थे, तो ज्यादातर लोग जो "नीली टी-शर्ट" पहनते हैं, संभवतः एक रंगाई समर्थक होंगे। आप केल्टिक समर्थकों को याद कर रहे होंगे । ग्लासगो में फुटबॉल टीम धर्म के लिए एक प्रॉक्सी होगी।
csgillespie

1
@csgillespie अद्भुत उदाहरण!
whuber

इसके अलावा, आपको लड़कियों की तुलना में अधिक लड़के मिल सकते हैं क्योंकि पश्चिमी संस्कृति में नीले पुरुष के साथ जुड़ा हुआ है
रोलाण्ड कोफ़्लर

सफेद टी-शर्ट की तुलना में रंगीन टी-शर्ट अधिक महंगी हैं, और सभी डिजाइन सभी रंगों के लिए काम नहीं करते हैं। इसलिए, भले ही यह निर्दोष लग सकता है, यहां तक ​​कि टी-शर्ट पहनने वालों में आप अमीर लोगों, या अधिक आवेगी उपभोक्ताओं, या ऐसे लोगों का चयन कर सकते हैं जो किसी विशेष राजनीतिक पार्टी का पक्ष लेते हैं।
डगलस ज़ारे

उम्र और टी-शर्ट पहनने के बीच, सांस्कृतिक पृष्ठभूमि और टी-शर्ट पहनने आदि के बीच भी संबंध है।
Glen_b -Reinstate मोनिका

जवाबों:


22

उत्तर, सामान्य रूप से, आपके प्रश्न का "नहीं" है। आबादी (विशेषकर मनुष्यों) से एक यादृच्छिक नमूना प्राप्त करना बेहद मुश्किल है। एक खास विशेषता पर कंडीशनिंग करके, आप कर रहे हैं परिभाषा से नमूने के तौर पर प्राप्त करने के लिए नहीं। यह कितना पूर्वाग्रह है कि यह पूरी तरह से एक और मामला है।

एक छोटे से बेतुके उदाहरण के रूप में, आप इस तरह से नमूना नहीं लेना चाहेंगे, कहते हैं, बियर और पैकर्स के बीच एक फुटबॉल खेल, भले ही आपकी आबादी "फुटबॉल प्रशंसक" थी। (अन्य फुटबॉल प्रशंसकों की तुलना में भालू प्रशंसकों की अलग-अलग विशेषताएं हो सकती हैं, तब भी जब आप जिस मात्रा में रुचि रखते हैं वह सीधे फुटबॉल से संबंधित नहीं लग सकता है।)

इस तरह से नमूने प्राप्त करने के परिणामस्वरूप छिपे हुए पूर्वाग्रह के कई प्रसिद्ध उदाहरण हैं। उदाहरण के लिए, हाल के अमेरिकी चुनावों में जिसमें फोन चुनाव आयोजित किए गए हैं, ऐसा माना जाता है कि लोग केवल एक सेल फोन के मालिक हैं और कोई भी लैंडलाइन (शायद नाटकीय रूप से) नमूने में नहीं है। चूँकि ये लोग भी लैंडलाइन वाले लोगों की तुलना में छोटे और बड़े होते हैं, एक पक्षपाती नमूना प्राप्त होता है। इसके अलावा, युवा लोगों की पुरानी आबादी की तुलना में बहुत अलग राजनीतिक विश्वास हैं। तो, यह एक ऐसे मामले का एक सरल उदाहरण है, जब नमूना भी जानबूझकर किसी विशेष विशेषता पर वातानुकूलित , तब भी ऐसा ही हुआ। और, भले ही चुनाव में कुछ भी नहीं करना था कंडीशनिंग विशेषता के साथ नहीं था (यानी, चाहे या नहीं एक लैंडलाइन का उपयोग करता है), पोल के निष्कर्ष पर कंडीशनिंग विशेषता का प्रभाव महत्वपूर्ण था, दोनों सांख्यिकीय और व्यावहारिक रूप से।


6

जब तक आप नमूने में इकाइयों का चयन करने के लिए उपयोग की जाने वाली विशेषता का वितरण करते हैं, तब तक आप जिस आबादी का अनुमान लगाना चाहते हैं, उसकी विशेषता के वितरण के लिए ऑर्थोगोनल है, आप उस पर कंडीशनिंग चयन द्वारा जनसंख्या मात्रा का निष्पक्ष अनुमान प्राप्त कर सकते हैं। नमूना सख्ती से एक यादृच्छिक नमूना नहीं है। लेकिन लोग इस बात को नजरअंदाज करते हैं कि यादृच्छिक नमूने अच्छे हैं क्योंकि इकाइयों में नमूने का चयन करने के लिए उपयोग किया जाने वाला यादृच्छिक चर जनसंख्या की विशेषता के वितरण के लिए रूढ़िवादी है, इसलिए नहीं कि यह यादृच्छिक है।

पी (इनवोलिट (x_i)) के साथ बर्नौली से बेतरतीब ढंग से ड्राइंग के बारे में सोचें जहां [-inf, inf] में x_i यूनिट i की एक विशेषता है जैसे कि कोव (x, y)! = 0, और y जनसंख्या की विशेषता है जिसकी विशेषता है! मतलब आप अनुमान लगाना चाहते हैं। नमूना "यादृच्छिक" है इस अर्थ में कि आप नमूने में चयन करने से पहले यादृच्छिक कर रहे हैं। लेकिन नमूना y की औसत जनसंख्या का निष्पक्ष अनुमान नहीं देता है।

आपको एक चर पर नमूने में कंडीशनिंग चयन की आवश्यकता है जो यादृच्छिक रूप से असाइन किए गए के रूप में अच्छा है । यानी, वैरिएबल के लिए ऑर्थोगोनल है जिस पर ब्याज की मात्रा निर्भर करती है। रैंडमाइजेशन अच्छा है क्योंकि यह ऑर्थोगोनलिटी को इंश्योर करता है, रैंडमाइजेशन के कारण नहीं।


4
यह सही है, लेकिन जब तक आपके पास वास्तव में यादृच्छिक नमूना नहीं था, तब आपको यह कैसे पता चलेगा कि यह ऑर्थोगोनल था?
पीटर Flom - को पुनः स्थापित मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.