चलो एक से कश्मीर - आयामी यादृच्छिक वेक्टर, यादृच्छिक चर की यानी एक निश्चित स्थिति संग्रह (औसत दर्जे का वास्तविक कार्यों)।x =( एक्स)1, । । । , एक्सj, । । । , एक्सकश्मीर)k -
ऐसे कई वैक्टरों पर विचार करें, कहें , और इन वैक्टरों को i = 1 , के द्वारा अनुक्रमित करें । । । , एन , तो, कहते हैंnमैं = 1 , । । । , एन
और उन्हें एक संग्रह "नमूना" कहा जाता है, के रूप में मानतेएस=( एक्स 1 ,।।।, एक्स मैं ,।।।, x n )। फिर हम प्रत्येकk कोकॉल करते हैं-
एक्समैं= ( एक्स)1 मैं, । । । , एक्सजे आई, । । । , एक्सk i)
एस= ( x)1,...,xi,...,xn)k− आयामी वेक्टर एक "अवलोकन" (हालांकि यह वास्तव में केवल एक बार हो जाता है जब हम मापते हैं और इसमें शामिल यादृच्छिक चर की वास्तविकताओं को रिकॉर्ड करते हैं)।
आइए पहले उस मामले का इलाज करें जहां या तो एक संभाव्यता द्रव्यमान फ़ंक्शन (PMF) या एक प्रायिकता घनत्व फ़ंक्शन (PDF) मौजूद है, और संयुक्त कार्य भी। F i ( x i ) द्वारा अस्वीकृत करें , संयुक्त PMF या प्रत्येक यादृच्छिक वेक्टर के संयुक्त पीडीएफ, और च ( एक्स 1 , । । । , एक्स मैं , । । । , X n ) संयुक्त PMF या इन सभी वैक्टर की संयुक्त पीडीएफ एक साथ। fi(xi),i=1,...,nf(x1,...,xi,...,xn)
तब, नमूना को "स्वतंत्र नमूना" कहा जाता है, यदि निम्नलिखित गणितीय समानता रखती है:S
f(x1,...,xi,...,xn)=∏i=1nfi(xi),∀(x1,...,xi,...,xn)∈DS
जहां संयुक्त द्वारा बनाई डोमेन है n यादृच्छिक वैक्टर / टिप्पणियों।DSn
इसका अर्थ है कि "अवलोकन" "संयुक्त रूप से स्वतंत्र" हैं, (सांख्यिकीय अर्थ में, या "संभावना में स्वतंत्र" जैसा कि पुरानी कहावत थी जो आज भी कभी-कभी देखी जाती है)। आदत बस उन्हें "स्वतंत्र टिप्पणियों" कहने की है।
ध्यान दें कि यहां सांख्यिकीय स्वतंत्रता संपत्ति सूचकांक , अर्थात टिप्पणियों के बीच। यह असंबंधित है कि प्रत्येक अवलोकन में यादृच्छिक चर के बीच संभाव्य / सांख्यिकीय संबंध क्या हैं (सामान्य स्थिति में हम यहां व्यवहार करते हैं जहां प्रत्येक अवलोकन बहुआयामी है)।i
यह भी ध्यान दें कि जिन मामलों में हमारे पास निरंतर यादृच्छिक चर हैं जिनमें कोई घनत्व नहीं है, उपरोक्त को वितरण कार्यों के संदर्भ में व्यक्त किया जा सकता है।
यह "स्वतंत्र टिप्पणियों" का मतलब है । यह गणितीय रूप से व्यक्त की गई एक सटीक परिभाषित संपत्ति है। आइए देखें कि इसका क्या अर्थ है ।
कुछ औचित्य के स्रोत
A. यदि दो अवलोकन संयुक्त रूप से स्वतंत्र टिप्पणियों के समूह का हिस्सा हैं, तो वे "जोड़ी-वार स्वतंत्र" (सांख्यिकीय रूप से) भी हैं।
f(xi,xm)=fi(xi)fm(xm)∀i≠m,i,m=1,...,n
यह बदले में यह दर्शाता है कि सशर्त PMF / PDF "सीमांत" वाले के बराबर हैं
f(xi∣xm)=fi(xi)∀i≠m,i,m=1,...,n
यह कई तर्कों, वातानुकूलित या कंडीशनिंग के लिए सामान्यीकृत करता है, कहते हैं
f(xi,xℓ∣xm)=f(xi,xℓ),f(xi∣xm,xℓ)=fi(xi)
आदि, जब तक बाईं ओर के अनुक्रमणिकाएं ऊर्ध्वाधर रेखा के दाईं ओर अनुक्रमित से भिन्न होती हैं।
इसका तात्पर्य यह है कि यदि हम वास्तव में एक अवलोकन करते हैं, तो नमूने के किसी अन्य अवलोकन की विशेषता वाली संभावनाएं नहीं बदलती हैं। इसलिए जैसा कि भविष्यवाणी है , एक स्वतंत्र नमूना हमारा सबसे अच्छा दोस्त नहीं है। हम निर्भरता रखना पसंद करेंगे ताकि प्रत्येक अवलोकन हमें किसी अन्य अवलोकन के बारे में कुछ और कहने में मदद कर सके।
B. दूसरी ओर, एक स्वतंत्र नमूने में अधिकतम सूचनात्मक सामग्री होती है। प्रत्येक अवलोकन, स्वतंत्र होने के नाते, नमूने में किसी भी अन्य अवलोकन द्वारा, पूर्ण रूप से, आंशिक या आंशिक रूप से जानकारी नहीं दी जा सकती है। तो कुल योग किसी भी तुलनात्मक नमूने की तुलना में अधिकतम है, जहां कुछ टिप्पणियों के बीच कुछ सांख्यिकीय निर्भरता मौजूद है। लेकिन यह जानकारी किस उपयोग की है, अगर यह हमारी भविष्यवाणियों को बेहतर बनाने में हमारी मदद नहीं कर सकती है?
खैर, यह उन अप्रत्यक्ष सूचनाओं के बारे में अप्रत्यक्ष जानकारी है जो नमूने में यादृच्छिक चर की विशेषता है। जितना अधिक इन अवलोकनों में सामान्य विशेषताएं हैं (हमारे मामले में सामान्य संभावना वितरण), उतना ही हम उन्हें उजागर करने के लिए बेहतर स्थिति में हैं, अगर हमारा नमूना स्वतंत्र है।
दूसरे शब्दों में अगर नमूना स्वतंत्र है और "समान रूप से वितरित" है, जिसका अर्थ है
fi(xi)=fm(xm)=f(x),i≠m
न केवल सामान्य संयुक्त संभाव्यता वितरण बारे में जानकारी प्राप्त करने के लिए यह सबसे अच्छा संभव नमूना है , बल्कि यादृच्छिक चर के सीमांत वितरण के लिए भी है जिसमें प्रत्येक अवलोकन शामिल है, f j ( x j i ) कहते हैं । f(x)fj(xji)
तो भले ही , तो शून्य अतिरिक्त भविष्य कहनेवाला के रूप में संबंध है बिजली की वास्तविक प्राप्ति एक्स मैं एक स्वतंत्र और हूबहू वितरित नमूने के साथ, हम सबसे अच्छा स्थिति में करने के लिए उजागर कर रहे हैं कार्यों च मैं (या उसके गुण से कुछ), सीमांत वितरण अर्थात्।f(xi∣xm)=fi(xi)xi fi
इसलिए, संबंध के रूप में आकलन (जो कभी कभी यहां एक कैच-ऑल शब्द के रूप में प्रयोग किया जाता है, लेकिन यह की अवधारणा से अलग रखा जाना चाहिए भविष्यवाणी ), एक स्वतंत्र नमूना है , हमारे "बेस्ट फ्रेंड" अगर यह के साथ "हूबहू वितरित संयुक्त है " संपत्ति।
सी। यह भी अनुसरण करता है कि टिप्पणियों का एक स्वतंत्र नमूना जहां प्रत्येक को पूरी तरह से अलग-अलग संभाव्यता वितरण की विशेषता है, जिसमें कोई भी सामान्य विशेषता नहीं है, एक के रूप में जानकारी का एक संग्रह के रूप में बेकार है, जो निश्चित रूप से प्राप्त कर सकता है (निश्चित रूप से जानकारी का हर टुकड़ा अपने आप में है) योग्य, यहाँ मुद्दा यह है कि इनको एक साथ लिया जाए तो इन्हें कुछ भी उपयोगी बनाने के लिए नहीं जोड़ा जा सकता है)। तीन अवलोकनों से युक्त एक नमूने की कल्पना कीजिए: एक जिसमें दक्षिण अमेरिका के फलों की (मात्रात्मक विशेषताएं) हैं, एक अन्य जिसमें यूरोप के पहाड़ हैं, और तीसरा एशिया से कपड़े हैं। बहुत दिलचस्प जानकारी के सभी तीनों को टुकड़े-टुकड़े करते हैं, लेकिन एक नमूना के रूप में एक साथ हमारे लिए कुछ भी उपयोगी नहीं हो सकता है।
एक अन्य तरीके से रखो, एक स्वतंत्र नमूने के लिए एक आवश्यक और पर्याप्त स्थिति उपयोगी होने के लिए, यह है कि टिप्पणियों में कुछ सांख्यिकीय विशेषताएं हैं। यही कारण है कि, सांख्यिकी में, "नमूना" शब्द सामान्य रूप से "सूचना के संग्रह" का पर्याय नहीं है, लेकिन "कुछ सामान्य विशेषताओं वाले संस्थानों पर जानकारी का संग्रह" है।
ओपा के डेटा एक्सपेलिमेंट के लिए आवेदन
उपयोगकर्ता @gung के अनुरोध के जवाब में, ऊपर के प्रकाश में ओपी के उदाहरण की जांच करते हैं। हम यथोचित रूप से मानते हैं कि हम दो से अधिक शिक्षकों और छह से अधिक विद्यार्थियों वाले स्कूल में हैं। इसलिए ए) हम विद्यार्थियों और शिक्षकों दोनों का नमूना ले रहे हैं, और बी) हम अपने डेटा में उस ग्रेड को शामिल करते हैं जो प्रत्येक शिक्षक-शिष्य संयोजन से मेल खाता है।
जीपीटीएस= ( s)1, । । । , एस6)
रों1= ( टी1, पी1, जी1)रों2= ( टी1, पी2, जी2)रों3= ( टी1, पी3, जी3)रों3= ( टी2, पी4, जी4)रों4= ( टी2, पी5, जी5)रों5= ( टी2, पी6, जी6)
पीमैंजीमैं
टी1, टी2
रों1, एस2, एस3टी1रों4, एस5, एस6टी2
ध्यान से "समान यादृच्छिक चर" और "समान वितरण वाले दो अलग-अलग यादृच्छिक चर" के बीच अंतर को ध्यान से देखें।
रों1, एस2, एस3टी1रों4, एस5, एस6टी2
अब मान लें कि हम अपने नमूने से यादृच्छिक चर "शिक्षक" को बाहर करते हैं। (पुपिल, ग्रेड) छह अवलोकनों का नमूना है, एक स्वतंत्र नमूना है?
यहां, शिक्षकों, विद्यार्थियों और ग्रेड के बीच संरचनात्मक संबंध क्या है, इसके बारे में हम जो धारणाएँ बनाएंगे, वे मायने रखती हैं।
टी1टी2जी1, जी2, जी3टी1
लेकिन कहते हैं कि शिक्षक उस संबंध में समान हैं। फिर बताई गई धारणा के तहत "शिक्षक छात्रों को प्रभावित करते हैं" हमारे पास फिर से है कि पहले तीन अवलोकन एक-दूसरे पर निर्भर हैं, क्योंकि शिक्षक विद्यार्थियों को प्रभावित करते हैं जो ग्रेड को प्रभावित करते हैं, और हम एक ही परिणाम पर आते हैं, इस मामले में अप्रत्यक्ष रूप से (और इसी तरह) अन्य तीन)। तो फिर, नमूना स्वतंत्र नहीं है।
विक्रेता का मामला
जी ईएम, एफ
रों1= ( जी ई1, पी1, जी1)रों2= ( जी ई2, पी2, जी2)रों3= ( जी ई3, पी3, जी3)रों3= ( जी ई4, पी4, जी4)रों4= ( जी ई5, पी5, जी5)रों5= ( जी ई6, पी6, जी6)
नोट ध्यान से है कि हम क्या के रूप में संबंध है लिंग नमूने के वर्णन में शामिल है, नहीं वास्तविक मूल्य है कि यह प्रत्येक छात्र के लिए ले जाता है, लेकिन यादृच्छिक चर "लिंग" । इस बहुत लंबे उत्तर की शुरुआत में पीछे देखें: नमूना को संख्याओं के संग्रह के रूप में परिभाषित नहीं किया गया है (या सामान्य में निश्चित संख्यात्मक या मान नहीं), लेकिन यादृच्छिक चर (कार्यों के साधन) के संग्रह के रूप में ।
जी ईमैं1जी ई1पी2, पी3, । । ।, तो यह टिप्पणियों के बीच निर्भरता का एक और संभावित स्रोत हो जाता है। अंत में, एक पुतली का लिंग सीधे दूसरे पुतली के ग्रेड को प्रभावित करता है? अगर हम तर्क देते हैं कि ऐसा नहीं है, तो हम एक स्वतंत्र नमूना प्राप्त करते हैं (एक ही शिक्षक वाले सभी विद्यार्थियों पर सशर्त)।