क्या "रैंडम सैंपल" और "आईड रैंडम वैरिएबल" पर्यायवाची हैं?


18

मैं "रैंडम सैंपल" के साथ-साथ "आईड रैंडम वैरिएबल" के अर्थ को समझने में कठिन समय का सामना कर रहा हूं। मैंने कई स्रोतों से इसका अर्थ जानने की कोशिश की, लेकिन बस अधिक से अधिक भ्रमित हो गया। मैं यहाँ पोस्ट कर रहा हूँ जो मैंने कोशिश की और पता चला:

डीगरोट की संभावना और सांख्यिकी कहते हैं:

रैंडम सैंपल / आईआईडी / सैंपल साइज: वास्तविक लाइन पर दिए गए प्रायिकता वितरण पर विचार करें, जिसे pf या PDF द्वारा दर्शाया जा सकता है । यह कहा जाता है कि यादृच्छिक चर इस वितरण से एक यादृच्छिक नमूना बनाते हैं यदि ये यादृच्छिक चर स्वतंत्र होते हैं और उनमें से प्रत्येक का सीमांत pf या pdf । इस तरह के यादृच्छिक चर को स्वतंत्र और पहचान के रूप में वितरित किया जाता है, संक्षिप्त रूप से iid हम नमूना आकार के रूप में यादृच्छिक चर की संख्या n को संदर्भित करते हैं।n एक्स 1 , , एक्स एन एफfnX1,...,Xn

लेकिन मेरे पास अन्य आँकड़े बुक में से एक है:

रैंडम सैंपलिंग में, हम गारंटी देते हैं कि जनसंख्या की प्रत्येक व्यक्तिगत इकाई को चयनित होने का एक समान मौका (संभावना) मिलता है।

इसलिए, मुझे लगता है कि iids ऐसे तत्व हैं जो यादृच्छिक नमूने का निर्माण करते हैं, और यादृच्छिक नमूना लेने की प्रक्रिया यादृच्छिक नमूना है। क्या मैं सही हू?

पुनश्च: मैं इस विषय को लेकर बहुत उलझन में हूं, इसलिए मैं विस्तृत उत्तर की सराहना करूंगा। धन्यवाद।


6
स्वतंत्रता हिस्सा बहुत महत्वपूर्ण है क्योंकि हम एक नमूना है, जिसमें सभी चर हूबहू वितरित कर रहे हैं (एक ही सीमांत रूप से वितरित होती है), लेकिन कर रहे हैं हो सकता है है नहीं स्वतंत्र। इस तरह के नमूने को अभी भी एक यादृच्छिक नमूना माना जा सकता है लेकिन उस प्रयोग का नहीं जिसे आप सोचते हैं कि यह एक यादृच्छिक नमूना है। इस प्रश्न को देखें ।
दिलीप सरवटे

प्रश्न एक सांख्यिकीय अर्थ नहीं लगता है। आईआईडी और यादृच्छिक नमूना स्पष्ट रूप से साक्षर द्वारा स्थापित अलग अवधारणाएं हैं।
सुभाष सी। डावर

2
@ सुभाष इतवार वे हैं? एक परिभाषा के अनुसार: "एक यादृच्छिक नमूना स्वतंत्र, समान रूप से वितरित (आईआईडी) यादृच्छिक चर का एक अनुक्रम है"। तो ऐसा लगता है कि iid और यादृच्छिक नमूना एक ही बात है? डीगरोट की प्रायिकता और सांख्यिकी में उद्धृत पैराग्राफ मूल रूप से यही कहता है। मुझे यह भ्रामक लगता है क्योंकि एक "नमूना" कभी-कभी एक व्यक्ति या व्यक्तियों का एक समूह होता है, और कभी-कभी यादृच्छिक चर का एक क्रम होता है।
गैरी चांग

@ गैरी चांग परिभाषा आप पीडीएफ से संबंधित है। साइकोमेट्री के अनुशासन में यादृच्छिक चर का नमूना लोकप्रिय रहा है। आमतौर पर, इसका उपयोग विश्वसनीयता या वैधता अनुमान के संदर्भ में और कारक विश्लेषण के लिए किया जाता है। साइकोमेट्री एक डोमेन के लिए परीक्षणों की समानता स्थापित करने में रुचि रखते हैं। आईआईडी अवधारणा रैखिक बीजगणित से उत्पन्न होती है। एक नमूना एक अध्ययन के उद्देश्य के आधार पर व्यक्तियों (और (यादृच्छिक) चर) की आबादी से दिया जा सकता है। वर्तमान दिन के आंकड़े मापदण्ड से उधार लिए गए प्रतीत होते हैं।
सुभाष सी। डावर

जवाबों:


9

आप यह नहीं कहते कि अन्य सांख्यिकी पुस्तक क्या है, लेकिन मुझे लगता है कि यह परिमित जनसंख्या के नमूने के बारे में एक पुस्तक (या खंड) है ।

जब आप यादृच्छिक चर का नमूना लेते हैं, अर्थात जब आप एक सेट यादृच्छिक चर के पर विचार करते हैं , तो आप जानते हैं कि यदि वे स्वतंत्र हैं, , और विशेष रूप से और में सभी , के लिए , फिर: जहाँ दूसरा है केंद्रीय क्षण। एन ( एक्स 1 , ... , एक्स एन ) = ( एक्स 1 ) ( एक्स एन )( एक्स मैं ) = μ वार ( एक्स मैं ) = σ 2 मैं ¯ एक्स = Σ मैं एक्स मैंX1,,Xnnf(x1,,xn)=f(x1)f(xn)E(Xi)=μVar(Xi)=σ2i σ2

X¯=iXin,E(X¯)=μ,Var(X¯)=σ2n
σ2

एक परिमित जनसंख्या का नमूना लेना कुछ अलग है। यदि जनसंख्या आकार , तो बिना प्रतिस्थापन के नमूने में संभव नमूने के आकार और वे परिवर्तनीय हैं: उदाहरण के लिए, यदि और , तो नमूना स्थान और नमूने हैं: ( एनN sinp(si)=1(Nn)sin N=5n=3{s1,,s10} s 1 ={1,2,3}, s 2 ={1,2,4}, s 3 ={1,2,5}, s 4 ={1,3,4},

p(si)=1(Nn)i=1,,(Nn)
N=5n=3{s1,,s10}
s1={1,2,3},s2={1,2,4},s3={1,2,5},s4={1,3,4},s5={1,3,5},s6={1,4,5},s7={2,3,4},s8={2,3,5},s9={2,4,5},s10={3,4,5}
यदि आप प्रत्येक व्यक्ति के होने की संख्या की गणना करते हैं, तो आप देख सकते हैं कि वे छह हैं, अर्थात प्रत्येक व्यक्ति के पास चुने जाने का एक समान चांस है (6/10)। तो प्रत्येक दूसरी परिभाषा के अनुसार एक यादृच्छिक नमूना है। मोटे तौर पर, यह एक बेतरतीब नमूना नहीं है क्योंकि व्यक्ति यादृच्छिक चर नहीं हैं: आप लगातार नमूने के माध्यम से अनुमान लगा सकते हैं , लेकिन कभी भी इसका सही मूल्य नहीं जान पाएंगे, लेकिन आप सटीक जनसंख्या का मतलब जान सकते हैं यदि (let मुझे दोहराएं: लगभग।)siE[X]n=N1

चलो कुछ polulation मतलब (माध्य ऊंचाई, मतलब आय, ...) हो। जब आप यादृच्छिक चर नमूने की तरह अनुमान लगा सकते हैं : लेकिन नमूना माध्य विचरण अलग है: जहां जनसंख्या अर्ध-विचरण है: । फैक्टर को " परिमित जनसंख्या सुधार कारक " कहा जाता है ।μn<Nμ

y¯s=i=1nyi,E(y¯s)=μ
Var(y¯s)=σ~2n(1nN)
σ~2i=1N(yiy¯)2N1(1n/N)

यह एक त्वरित उदाहरण है कि कैसे (रैंडम वैरिएबल) iid रैंडम सैंपल और (परिमित जनसंख्या) रैंडम सैंपल अलग हो सकते हैं। सांख्यिकीय निष्कर्ष मुख्य रूप से यादृच्छिक चर नमूनाकरण के बारे में है, नमूना सिद्धांत परिमित जनसंख्या नमूनाकरण के बारे में है।


1 आप प्रकाश बल्ब का निर्माण कर रहे हैं और उनके औसत जीवन काल को जानना चाहते हैं। आपकी "जनसंख्या" सिर्फ एक सैद्धांतिक या आभासी एक है, कम से कम यदि आप प्रकाश बल्ब का निर्माण करते हैं। इसलिए आपको एक डाटा जनरेशन प्रोसेस को मॉडल करना होगाऔर एक (यादृच्छिक चर) नमूने के रूप में प्रकाश बल्ब का एक सेट intepret। अब यह कहें कि आप 1000 प्रकाश बल्बों का एक बॉक्स पाते हैं और उनके औसत जीवन काल को जानना चाहते हैं। आप प्रकाश बल्बों का एक छोटा सा सेट (एक परिमित जनसंख्या नमूना) चुन सकते हैं, लेकिन आप उन सभी का चयन कर सकते हैं। यदि आप एक छोटा सा नमूना चुनते हैं, तो यह प्रकाश बल्बों को यादृच्छिक चर में परिवर्तित नहीं करता है: यादृच्छिक चर आपके द्वारा उत्पन्न होता है, क्योंकि "ऑल" और "एक छोटा सेट" के बीच का चुनाव आप पर निर्भर है। हालांकि, जब एक परिमित आबादी बहुत बड़ी है (अपने देश की आबादी कहें), जब "सभी" चुनना व्यवहार्य नहीं है, तो दूसरी स्थिति पहले वाले के रूप में बेहतर रूप से नियंत्रित की जाती है।


1
आपका क्या मतलब है "व्यक्ति यादृच्छिक चर नहीं हैं?" Whuber के पास वास्तव में कुछ अच्छे जवाब हैं और यहाँ जो एक यादृच्छिक चर की अवधारणा को समझाने के लिए परिमित जनसंख्या नमूने का उपयोग करते हैं।
jsk

मेरा मतलब है कि मैंने क्या कहा है: अगर तो कोई अनिश्चितता नहीं है। n=N
सर्जियो

यह आपके कथन को स्पष्ट करने में सहायक नहीं था, जो लिंक में किए गए लोगों के साथ सीधे विरोधाभास में प्रतीत होता है। कृपया, रक्षात्मक होने की आवश्यकता नहीं है। बारे में बात उस बयान से कोई लेना-देना नहीं है जिसके बारे में मैं उत्सुक हूं। इसके अलावा, एक पतित यादृच्छिक चर एक यादृच्छिक चर नहीं है? n=N
jsk

रक्षात्मक? आप उन लिंक को नहीं समझ पाए। जैसा कि व्हबनर कहता है, ए) टिकटों में एक बॉक्स मॉडल सिर्फ एक खिलौना उदाहरण है जिससे बचने के लिए "यह स्नातक स्तर की सामग्री है"; ख) वह एक बॉक्स में टिकटों को "आबादी" कहने से बचता है , और बताता है कि क्यों। इसलिए कोई विरोधाभास नहीं है । अगर कोई समझ सकता है कि किस व्यक्ति ने क्या कहा है। BTW, मैं एक यादृच्छिक चर नहीं हूँ, क्या आप हैं?
सर्जियो

IMHO, बिल्कुल।
सर्जियो

2

मैं आपको संभाव्य परिभाषाओं और सूत्रों से बोर नहीं करूंगा, जिन्हें आप आसानी से किसी भी पाठ्यपुस्तक में ले सकते हैं (या यहाँ शुरू करने के लिए एक अच्छी जगह है)

इसे सहज रूप से सोचें, यादृच्छिक नमूना यादृच्छिक मूल्यों का एक समूह है। सामान्य तौर पर, हर एक मान या तो समान रूप से या अलग-अलग वितरित किया जा सकता है। नमूना यादृच्छिक नमूने का एक विशेष मामला है, जैसे कि प्रत्येक मूल्य समान वितरण से आता है क्योंकि अन्य मान और इसका मान अन्य मूल्यों पर कोई प्रभाव नहीं डालता है। स्वतंत्रता इस बात से संबंधित है मूल्य उत्पन्न किए गए थेi.i.d.how

i.i.d उदाहरण: एक डेक से एक यादृच्छिक कार्ड ड्रा करें और इसे वापस करें (ऐसा 5 बार करें)। आपको 5 एहसास मूल्य (कार्ड) मिलेंगे । इन मूल्यों में से प्रत्येक एक समान वितरण से आता है (प्रत्येक परिणाम प्राप्त करने की समान संभावना है) और प्रत्येक ड्रा दूसरों से स्वतंत्र है (यानी यह तथ्य कि आपको पहले ड्रॉ में हुकुम का इक्का मिलता है, प्रभावित नहीं करता है किसी भी तरह से परिणाम आपको अन्य ड्रा में मिल सकता है)।

नॉन उदाहरण: अब एक ही काम करें, लेकिन कार्ड को डेक पर वापस किए बिना (मुझे उम्मीद है कि आप अब तक अंतर भर देंगे)। ऐसा करने के बाद फिर से आपके पास 5 वास्तविक मूल्य (कार्ड) होंगे। लेकिन स्पष्ट रूप से वे निर्भर हैं (तथ्य यह है कि आप पहले ड्रॉ पर हुकुम का इक्का खींचते हैं, इसका मतलब है कि आपके पास दूसरे ड्रॉ में आने का मौका नहीं होगा)।i.i.d.


1

एक रैंडम वेरिएबल जिसे आमतौर पर X लिखा जाता है, एक वैरिएबल है जिसके संभावित मान एक यादृच्छिक घटना के संख्यात्मक परिणाम हैं। यादृच्छिक परिघटना ऐसे परिणाम उत्पन्न कर सकती है, जिनमें किसी चर के 10 चर के शीर्ष क्रम में यादृच्छिक चर - शीर्ष संख्या पर कब्जा कर लिया गया हो या नमूने में आय / ऊँचाई आदि। लेकिन यह आवश्यक नहीं है।
आम तौर पर एक रैंडम वेरिएबल एक फ़ंक्शन होता है जो संख्यात्मक परिणामों के लिए यादृच्छिक परिणामों को मैप करता है। जैसे प्रत्येक दिन धूप, बादल या बारिश हो सकती है। हम एक रैंडम वेरिएबल को परिभाषित कर सकते हैं जो मान 1 लेता है यदि यह बरसात है, 2 अगर यह बादल है और 3 अगर यह धूप है। एक यादृच्छिक चर का डोमेन संभावित परिणामों का सेट है।
रैंडम वेरिएबल को स्थापित करने के लिए एक ऐसी प्रक्रिया या प्रयोग होना चाहिए जो संभावित परिणामों से जुड़ा हो जिसे निश्चितता के साथ भविष्यवाणी नहीं की जा सकती है।

आजादी के मुद्दे पर अब आ रहे हैं। दो यादृच्छिक चर स्वतंत्र हैं यदि उनमें से एक का मूल्य दूसरे के पीडीएफ को प्रभावित नहीं करता है। जब हम दूसरे चर के बारे में कुछ जानते हैं, तो हम एक चर के विभिन्न मूल्यों की संभावनाओं के बारे में अपनी भविष्यवाणियों को संशोधित नहीं करते हैं। इसलिए स्वतंत्रता के मामले में पोस्टीरियर पीडीएफ पिछले पीडीएफ के समान हैं। उदाहरण के लिए, जब हम एक निष्पक्ष सिक्के को बार-बार टॉस करते हैं, तो हमारे पास 5 पूर्व के परिणामों के बारे में जो जानकारी होती है, वह वर्तमान टॉस के बारे में हमारी भविष्यवाणी को प्रभावित नहीं करती है, यह हमेशा 0.5 होगी। हालाँकि, अगर सिक्के का पूर्वाग्रह अज्ञात है और इसे रैंडम वेरिएबल के रूप में तैयार किया गया है, तो पिछले 5 टॉस के परिणाम वर्तमान टॉस के बारे में हमारी भविष्यवाणियों को प्रभावित करते हैं क्योंकि यह हमें सिक्के के अज्ञात पूर्वाग्रह के बारे में जानकारी देने की अनुमति देता है।

अब सैंपलिंग के मुद्दे पर आ रहे हैं। नमूनाकरण का उद्देश्य एक अंतर्निहित वितरण के गुणों के बारे में हमें सूचित करना है जो ज्ञात नहीं है और इसका अनुमान होना चाहिए। याद रखें कि एक वितरण नमूना अंतरिक्ष में संभावित परिणामों के सापेक्ष संभावना को संदर्भित करता है (जो एक सशर्त ब्रह्मांड भी हो सकता है)। इसलिए जब हम नमूना लेते हैं तो हमने नमूना स्थान से परिणामों की एक सीमित संख्या को चुना है और हम नमूना स्थान को एक छोटे से अधिक प्रबंधनीय पैमाने पर पुन: पेश करते हैं। समान संभावना तब नमूना में परिणामों की संभावना नहीं नमूनाकरण की प्रक्रिया को संदर्भित करता है। समान संभावना नमूनाकरण का मतलब है कि नमूना मूल नमूना अंतरिक्ष में परिणामों के अनुपात को प्रतिबिंबित करेगा। जैसे अगर हम 10 पूछें, 000 लोग यदि उन्हें कभी गिरफ्तार किया गया है तो यह संभावित है कि जो नमूना हम समाप्त करेंगे वह जनसंख्या का प्रतिनिधि नहीं होगा - नमूना स्पेस-- क्योंकि जिन लोगों को गिरफ्तार किया गया था वे जवाब देने से इनकार कर सकते हैं, इसलिए संभावित परिणामों का अनुपात (गिरफ्तार - गिरफ्तार नहीं) हमारे नमूने और जनसंख्या के बीच व्यवस्थित कारणों से भिन्न होगा। या अगर हमने सर्वेक्षण करने के लिए किसी विशेष पड़ोस को चुना तो परिणाम पूरे शहर के प्रतिनिधि नहीं होंगे। तो समान संभावना नमूना का तात्पर्य है कि कोई भी व्यवस्थित कारण नहीं हैं - शुद्ध यादृच्छिकता की तुलना में - यह हमें विश्वास दिलाता है कि हमारे नमूने में संभावित परिणामों के अनुपात जनसंख्या / नमूना स्थान में परिणामों के अनुपात से अलग हैं। इसलिए संभावित परिणामों (गिरफ्तार नहीं - गिरफ्तार) का अनुपात हमारे नमूने और आबादी के बीच व्यवस्थित कारणों से भिन्न होगा। या अगर हमने सर्वेक्षण करने के लिए किसी विशेष पड़ोस को चुना तो परिणाम पूरे शहर के प्रतिनिधि नहीं होंगे। तो समान संभावना नमूना का तात्पर्य है कि कोई भी व्यवस्थित कारण नहीं हैं - शुद्ध यादृच्छिकता की तुलना में - यह हमें विश्वास दिलाता है कि हमारे नमूने में संभावित परिणामों के अनुपात जनसंख्या / नमूना स्थान में परिणामों के अनुपात से अलग हैं। इसलिए संभावित परिणामों (गिरफ्तार नहीं - गिरफ्तार) का अनुपात हमारे नमूने और आबादी के बीच व्यवस्थित कारणों से भिन्न होगा। या अगर हमने सर्वेक्षण करने के लिए किसी विशेष पड़ोस को चुना तो परिणाम पूरे शहर के प्रतिनिधि नहीं होंगे। तो समान संभावना नमूना का तात्पर्य है कि कोई भी व्यवस्थित कारण नहीं हैं - शुद्ध यादृच्छिकता की तुलना में - यह हमें विश्वास दिलाता है कि हमारे नमूने में संभावित परिणामों के अनुपात जनसंख्या / नमूना स्थान में परिणामों के अनुपात से अलग हैं।


-2

एक यादृच्छिक नमूना यादृच्छिक चर के अनुक्रम का एहसास है। वे यादृच्छिक चर iid हो सकते हैं या नहीं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.