एन -1 के बजाए कोविरसी अनुमानक का भाजक n-2 क्यों नहीं होना चाहिए?


36

(निष्पक्ष) भिन्नता अनुमानक का भाजक n1 क्योंकि n अवलोकन हैं और केवल एक पैरामीटर का अनुमान लगाया जा रहा है।

V(X)=i=1n(XiX¯)2n1

एक ही टोकन से मुझे आश्चर्य है कि दो मापदंडों का अनुमान लगाए जाने पर सहसंयोजक के क्यों नहीं होना चाहिए n2?

Cov(X,Y)=i=1n(XiX¯)(YiY¯)n1

15
यदि आपने ऐसा किया है, तो आपके पास विचरण के लिए दो परस्पर विरोधी परिभाषाएँ होंगी: एक पहला सूत्र होगा और दूसरा साथ लागू होने वाला दूसरा सूत्र होगा Y=X
whuber

3
एक द्वि / बहुभिन्नरूपी माध्य (अपेक्षा) एक है, 2 पैरामीटर नहीं।
ttnphns

14
@ttnphns यह सच नहीं है: बीवरिएट का मतलब स्पष्ट रूप से दो पैरामीटर हैं क्योंकि इसे व्यक्त करने के लिए दो वास्तविक संख्याओं की आवश्यकता होती है। (वास्तव में यह एक एकल वेक्टर पैरामीटर है, लेकिन ऐसा कहना केवल इस तथ्य को दो घटकों को मिटा देता है।) यह स्पष्ट रूप से पूलित-विचरण टी-परीक्षणों के लिए स्वतंत्रता की डिग्री में दिखाता है, उदाहरण के लिए, जहां 2 घटाया जाता है, नहीं 1। इस सवाल के बारे में क्या दिलचस्प है कि यह कैसे पता चलता है कि कैसे अस्पष्ट, असभ्य और संभावित भ्रामक आम "स्पष्टीकरण" है जिसे हम n से घटाते हैं क्योंकि एक पैरामीटर का अनुमान लगाया गया है। 1n
whuber

@ शुभंकर, आप उस पर सही हैं। यदि यह केवल (स्वतंत्र अवलोकन) थे जो मायने रखता है कि हम बहुभिन्नरूपी परीक्षणों में univariate की तुलना में अधिक df खर्च नहीं करेंगे । n
ttnphns

3
@ वाउचर: मैं शायद कहूंगा कि यह दर्शाता है कि "पैरामीटर" के रूप में जो मायने रखता है वह स्थिति पर निर्भर करता है। इस मामले में विचरण की गणना n अवलोकनों परn की जाती है और इसलिए प्रत्येक अवलोकन - या कुल माध्य - को एक पैरामीटर के रूप में देखा जा सकता है, भले ही यह बहुभिन्नरूपी माध्य हो, जैसा कि ttnphns ने कहा। हालांकि, अन्य मामलों में जब उदाहरण के लिए एक परीक्षण आयामों के रैखिक संयोजनों पर विचार करता है, प्रत्येक अवलोकन का प्रत्येक आयाम "एक पैरामीटर" बन जाता है। आप सही कह रहे हैं कि यह एक मुश्किल मुद्दा है।
अमीबा का कहना है कि मोनिका

जवाबों:



20

एक विशेष मामला आपको अंतर्ज्ञान देने के लिए चाहिए; निम्नलिखित के बारे में सोचें:

Cov^(X,X)=V^(X)

आप खुश हैं कि उत्तरार्द्ध कारण है बेसेल सुधार।i=1n(XiX¯)2n1

लेकिन को द्वारा in को पूर्व के लिए , तो अब आपको क्या लगता है कि रिक्त स्थान को भरना सबसे अच्छा हो सकता है?YXCov^(X,Y)i=1n(XiX¯)(XiX¯)mystery denominator


1
ठीक है। लेकिन ओपी पूछ सकता है "कोव (एक्स, एक्स) और कोव (एक्स, वाई) पर विचार करना तर्क की एक पंक्ति में क्यों है? आप क्यू में एक्स द्वारा वाई की जगह क्यों ले रहे हैं? एक अलग स्थिति है? " आपने उसे टाल नहीं दिया, जबकि उत्तर (अत्यधिक अपदस्थ) को मेरी धारणा में होना चाहिए :-)
ttnphns

7

एक त्वरित और गंदा जवाब ... चलो पहले ; यदि आपको ज्ञात अपेक्षित मान साथ अवलोकन था, तो आप विचरण का अनुमान लगाने के लिए का उपयोग करेंगे।var(X)n E(X)=01ni=1nXi2

अज्ञात मान होने के कारण, आप अपने टिप्पणियों को टिप्पणियों में लिए ले कर ज्ञात अपेक्षित मान में बदल सकते हैं । आपको हर में साथ एक सूत्र मिलेगा - हालांकि स्वतंत्र नहीं है और आपको इसे ध्यान में रखना होगा; अंत में आपको सामान्य सूत्र मिलेगा।nn1Ai=XiX1i=2,,nn1Ai

अब सहसंयोजक के लिए आप एक ही विचार का उपयोग कर सकते हैं: यदि का अपेक्षित मान , तो आपको सूत्र में था। अन्य सभी देखे गए मानों में घटाकर , आपको ज्ञात अपेक्षित मान के साथ अवलोकन मिलता है ... और सूत्र में एक - एक बार फिर, यह कुछ निर्भरता का परिचय देता है लेखा।(X,Y)(0,0)1n(X1,Y1)n11n1

PS साफ तरीका यह है कि एक आधार का चुनाव करना है , जो वैक्टर ऐसा(1,,1)n1c1,,cn1Rn

  • jcij2=1 सभी के लिए ,i
  • jcij=0 सभी के लिए ,i
  • jci1jci2j=0सभी लिए ।i1i2

फिर आप चर और । स्वतंत्र हैं, मूल्य की उम्मीद है , और मूल चर से ही विचरण / सहप्रसरण की है।n1Ai=jcijXjBi=jcijYj(Ai,Bi)(0,0)

सभी बिंदु यह है कि यदि आप अज्ञात अपेक्षा से छुटकारा चाहते हैं, तो आप एक (और केवल एक) अवलोकन को छोड़ देते हैं। यह दोनों मामलों के लिए समान काम करता है।


6

यहाँ एक प्रमाण है कि हर व्यक्ति के साथ p-varate नमूना सहसंयोजक आकलनकर्ता सहसंयोजक मैट्रिक्स का निष्पक्ष अनुमानक है:1n1

x=(x1,...,xp)

Σ=E((xμ)(xμ))

S=1n(xix¯)(xix¯)

दिखाने के लिए:E(S)=n1nΣ

प्रमाण:S=1nxixix¯x¯

आगामी:

(1)E(xixi)=Σ+μμ

(2)E(x¯x¯)=1nΣ+μμ

इसलिए:E(S)=Σ+μμ(1nΣ+μμ)=n1nΣ

और इसलिए , अंतिम भाजक , निष्पक्ष है। ऑफ-विकर्ण तत्व आपके व्यक्तिगत नमूना सहसंयोजक हैं।Su=nn1S1n1Su

अतिरिक्त टिप्पणी:

  1. एन ड्रॉ स्वतंत्र हैं। इसका उपयोग (2) नमूना माध्य के कोवरियन की गणना करने के लिए किया जाता है।

  2. चरण (1) और (2) इस तथ्य का उपयोग करते हैं किCov(x)=E[xx]μμ

  3. चरण (2) इस तथ्य का उपयोग करता है किCov(x¯)=1nΣ


चरण 2 में होने वाली कठिनाई! :)
एल्विस

@ एल्विस यह गन्दा है। नियम कोव (एक्स + वाई, जेड) = कोव (एक्स, जेड) + कोव (वाई, जेड) को लागू करने की आवश्यकता है और यह पहचानना होगा कि विभिन्न ड्रा स्वतंत्र हैं। तो फिर यह मूल रूप से
कोवरियस

4

मुझे लगता है कि 'n-1' का उपयोग करने के पीछे अंतर्ज्ञान बनाने का एक तरीका है और 'n-2' नहीं है - यह है कि सह-विचरण की गणना के लिए हमें X और Y दोनों का मतलब नहीं है, लेकिन दोनों में से कोई भी, अर्थात


क्या आप इस बारे में विस्तार से बता सकते हैं कि यह कैसे उपयोग करने वाले के प्रश्न पर है? साक्ष्य में बीजगणितीय संबंध इस तथ्य से उत्पन्न होता है कि अवशिष्ट औसत राशि के सापेक्ष शून्य है, लेकिन अन्यथा इस बारे में चुप है कि कौन सा भाज्य प्रासंगिक है।
whuber

5
मैं यहां आया क्योंकि मेरे पास ओपी के समान ही प्रश्न था। मुझे लगता है कि यह उत्तर बिंदु के नुब पर मिलता है @whuber ने ऊपर बताया: अंगूठे का नियम है कि df ~ = n - (अनुमानित पैरामीटर) अस्पष्ट, अस्पष्ट और संभावित रूप से भ्रामक हो सकता है। यह इस तथ्य को इंगित करता है कि यद्यपि ऐसा लगता है कि आपको दो मापदंडों (xbar और ybar) का अनुमान लगाने की आवश्यकता है, आप वास्तव में केवल एक (xbar या ybar) का अनुमान लगाते हैं। चूंकि df दोनों मामलों में समान होना चाहिए, यह दोनों का निचला भाग होना चाहिए। मुझे लगता है कि यहां यही मंशा है।
mpettis 20

1

1) प्रारंभ ।df=2n

2) नमूना सहसंयोजक । दो खोना ; एक से , एक से जिसके परिणामस्वरूप ।Σi=1n(XiX¯)(YiY¯)dfX¯Y¯df=2(n1)

3) हालांकि, केवल प्रत्येक उत्पाद से अलग शब्द होते हैं। जब दो संख्याओं को एक साथ गुणा किया जाता है तो प्रत्येक अलग संख्या से स्वतंत्र जानकारी गायब हो जाती है।Σi=1n(XiX¯)(YiY¯)n

एक ट्राइट उदाहरण के रूप में, उस पर विचार करें

24=124=212=38=46=64=83=122=241 ,

और जिसमें अपरिमेय और अंश शामिल नहीं हैं, जैसे , ताकि जब हम दो संख्या श्रृंखलाओं को एक साथ गुणा करें और उनके उत्पाद की जांच करें, तो हम देखते हैं कि सभी एक नंबर श्रृंखला से, जैसा कि हमने मूल जानकारी का आधा हिस्सा खो दिया है, अर्थात्, जो दो नंबर जोड़े-वार समूहन से पहले एक संख्या में थे (यानी, गुणन) किया गया था।24=2626df=n1

दूसरे शब्दों में, सामान्यता के नुकसान के बिना हम लिख सकते हैं

(XiX¯)(YiY¯)=ziz¯ कुछ और ,ziz¯

यानी, , और, । से की है, जो तब स्पष्ट रूप से है , सहप्रसरण सूत्र बन जाता हैzi=XiYiX¯YiXiY¯z¯=X¯Y¯zdf=n1

Σi=1nziz¯n1=

Σi=1n[(XiX¯)(YiY¯)]n1=

1n1Σi=1n(XiX¯)(YiY¯)

इस प्रकार, प्रश्न का उत्तर यह है कि समूहन द्वारा को आधा कर दिया गया है।df


@whuber पृथ्वी पर मुझे एक ही चीज़ दो बार पोस्ट करने और एक बार डिलीट करने के बाद कैसे मिली? क्या देता है? क्या हम उनमें से एक से छुटकारा पा सकते हैं? भविष्य के संदर्भ के लिए, क्या ऐसे डुप्लिकेट को स्थायी रूप से हटाने का कोई तरीका है? मेरे पास कुछ लटका हुआ है और यह कष्टप्रद है।
कार्ल

जहाँ तक मैं बता सकता हूँ, आपने अपना उत्तर डुप्लिकेट से यहाँ पर भेज दिया। (किसी और के पास आपके नाम में उत्तर पोस्ट करने की शक्ति नहीं है।) सिस्टम दृढ़ता से कई थ्रेड्स में समान उत्तर पोस्ट करने को हतोत्साहित करता है, इसलिए जब मैंने देखा कि, यह मुझे विश्वास दिलाता है कि ये दो धागे सही डुप्लिकेट हैं और मैंने उन्हें "मर्ज" कर दिया है। यह एक ऐसी प्रक्रिया है जो स्रोत थ्रेड से सभी टिप्पणियों और उत्तरों को लक्ष्य थ्रेड में ले जाती है। मैंने तब आपके डुप्लिकेट पोस्ट को यहां लक्ष्य थ्रेड में हटा दिया था। यह स्थायी रूप से हटा दिया जाएगा, लेकिन आपके साथ-साथ पर्याप्त रूप से उच्च प्रतिष्ठा के लोगों को भी दिखाई देगा।
whuber

@ जब मुझे पता नहीं था कि मर्ज में क्या होता है, कि मर्ज लगातार हो रहा था या लगातार कई चीजों को देखने के बावजूद नियम क्या हैं। सीखने में समय लगता है, धैर्य रखें, बीटीडब्ल्यू, क्या आप स्टैटिस्टिक्स.स्टैकएक्सचेंज.com/questions/251700/… को लेने पर विचार करेंगे Hold?
कार्ल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.