दो चर का योग अलग-अलग चर से अधिक भिन्नता को कैसे समझा सकता है?


13

जब मुझे दो पूर्वसूचक नकारात्मक रूप से सहसंबद्ध होते हैं तो मुझे तीसरे चर के साथ राशि के सहसंबंध के लिए कुछ परिणाम मिल रहे हैं। इन खराब परिणामों के कारण क्या है?

उदाहरण 1: दो चर और तीसरे चर के योग के बीच सहसंबंध

गिल्डफोर्ड के 1965 पाठ के पृष्ठ 427 पर सूत्र 16.23 पर विचार करें, जो नीचे दिखाया गया है।

हैरान करने वाली खोज: यदि दोनों चर तीसरे चर के साथ .2 और एक दूसरे के साथ सहसंबंधित हैं, तो सूत्र .52 के मान में परिणत होता है। तीसरे चर के साथ कुल का सहसंबंध कैसे हो सकता है ।52 यदि दो चर प्रत्येक चर को केवल तीसरे चर के साथ सहसंबंधित करते हैं।

उदाहरण 2: दो चर और तीसरे चर के बीच बहु सहसंबंध क्या है?

गिल्डफोर्ड के 1965 पाठ के पृष्ठ 404 (नीचे दिखाया गया है) पर सूत्र 16.1 पर विचार करें।

हैरान करनेवाला खोज: एक ही स्थिति। यदि दोनों चर तीसरे चर के साथ सहसंबद्ध .2 और एक दूसरे के साथ सहसंबंधित हैं, तो सूत्र .52 के मान में परिणत होता है। तीसरे चर के साथ कुल का सहसंबंध कैसे हो सकता है ।52 यदि दो चर प्रत्येक चर को केवल तीसरे चर के साथ सहसंबंधित करते हैं।

मैंने एक त्वरित मोंटे कार्लो सिमुलेशन की कोशिश की और यह गिलफोर्ड के सूत्रों के परिणामों की पुष्टि करता है।

लेकिन अगर दो भविष्यवक्ता प्रत्येक तीसरे चर के 4% के पूर्वानुमान का अनुमान लगाते हैं, तो उनमें से 1/3 भाग के पूर्वानुमान का योग कैसे हो सकता है?

तीसरे चर के साथ दो चर का योग तीसरे चर के साथ दो चर के कई सहसंबंध

स्रोत: मनोविज्ञान और शिक्षा में मौलिक सांख्यिकी, 4 वां संस्करण।, 1965।

स्पष्टीकरण

मैं जिस स्थिति से निपट रहा हूं उसमें अब अपनी क्षमताओं को मापने के आधार पर व्यक्तिगत लोगों के भविष्य के प्रदर्शन की भविष्यवाणी करना शामिल है।

नीचे दिए गए दो वेन चित्र स्थिति की मेरी समझ को दर्शाते हैं और मेरी पहेली को स्पष्ट करने के लिए हैं।

यह वेन आरेख (चित्र 1) X1 और C. के बीच के शून्य क्रम r = .2 को दर्शाता है। मेरे क्षेत्र में कई ऐसे प्रेडिक्टर वैरिएबल्स हैं जो मामूली कसौटी का अनुमान लगाते हैं।

चित्र .1

यह वेन आरेख (चित्र 2) दो ऐसे भविष्यवक्ताओं को दर्शाता है, X1 और x2, प्रत्येक का अनुमान है कि C = r .2 पर और दो भविष्यवक्ता नकारात्मक रूप से सहसंबंधित हैं, r = - 7।

रेखा चित्र नम्बर 2

मैं दो आर = .2 भविष्यवक्ताओं के बीच एक रिश्ते की कल्पना करने के लिए एक नुकसान में हूं जो उन्हें एक साथ सी के विचरण के 25% की भविष्यवाणी करेगा।

मुझे X1, x2 और C के बीच के रिश्ते को समझने में मदद लेनी चाहिए।

अगर (जैसा कि मेरे प्रश्न के उत्तर में कुछ लोगों द्वारा सुझाया गया है) एक्स 2 एक्स 1 के लिए एक दबानेवाला चर के रूप में कार्य करता है, तो दूसरे वेन आरेख में किस क्षेत्र को दबाया जा रहा है?

यदि एक ठोस उदाहरण मददगार होगा, तो हम X1 और x2 को दो मानव क्षमता और C को 4 साल का कॉलेज GPA, 4 साल बाद मान सकते हैं।

मुझे यह कल्पना करने में कठिनाई हो रही है कि कैसे एक दमनशील चर दो r = .2 शून्य क्रम r के 8% समझाया गया विचलन का कारण बन सकता है और सी के विचरण के 25% को विस्तार से समझा सकता है। एक ठोस उदाहरण एक बहुत ही उपयोगी उत्तर होगा।


आँकड़ों में अंगूठे का एक पुराना नियम है कि स्वतंत्र चर के एक सेट का योग उनके चर के योग के बराबर है।
माइक हंटर

@DJohnson। आपकी टिप्पणी पूछे गए प्रश्न से कैसे संबंधित है?
जोएल डब्ल्यू।

क्षमा करें, मुझे यह प्रश्न समझ में नहीं आया। मेरे लिए, यह स्पष्ट है कि यह कैसे संबंधित है। इसके अलावा, यह एक टिप्पणी है जो न तो इनाम के योग्य है और न ही गहन विस्तार की आवश्यकता है।
माइक हंटर

1
@DJohnson। आपकी टिप्पणी पूछे गए प्रश्न से कैसे संबंधित है? मेरे लिए, यह स्पष्ट नहीं है कि यह कैसे संबंधित है।
जोएल डब्ल्यू।

2
एन विचारों के अर्थ के बारे में आपके प्रश्न को मेटा सीवी साइट पर बेहतर प्रतिक्रिया मिल सकती है।
mdewey

जवाबों:


3

यह तब हो सकता है जब दो भविष्यवक्ताओं दोनों में एक बड़ा उपद्रव कारक होता है, लेकिन विपरीत संकेत के साथ, इसलिए जब आप उन्हें उपद्रव रद्द करते हैं और आप तीसरे चर के बहुत करीब आते हैं।

आइए एक और भी अधिक उदाहरण के साथ उदाहरण दें। मान लीजिए कि स्वतंत्र मानक सामान्य यादृच्छिक चर हैं। अब छोडोX,YN(0,1)

A=X

B=X+0.00001Y

कहते हैं कि आपका तीसरा चर है, आपके दो भविष्यवक्ता हैं, और एक अव्यक्त चर है जिसके बारे में आपको कुछ भी नहीं पता है। Y के साथ A का सहसंबंध 0 है, और Y के साथ B का सहसंबंध बहुत छोटा है, 0.00001 के करीब है। * लेकिन साथ का सहसंबंध 1 है।, बी एक्स + बी वाईYA,BXA+BY

* B के मानक विचलन से 1 से थोड़ा अधिक होने पर एक नन्हा नन्हा सुधार है।


क्या इस प्रकार की स्थिति कभी सामाजिक विज्ञान में उत्पन्न होती है?
जोएल डब्ल्यू।

1
सामाजिक विज्ञान शब्दजाल में, यह मूल रूप से एक मजबूत प्रभाव है जो किसी विशेष तरीके से कमजोर प्रभाव को स्वीकार करता है। मैं एक सामाजिक विज्ञान विशेषज्ञ नहीं हूं, लेकिन इसका एक उदाहरण खोजना मुश्किल नहीं है।
पॉल

क्या आपके पास भौतिक विज्ञान के अलावा अन्य कोई उदाहरण हो सकता है?
जोएल डब्ल्यू।

क्या आपके द्वारा वर्णित रिश्ते को वेन आरेख में दिखाया जा सकता है?
जोएल डब्ल्यू।

मुझे व्यक्तिगत रूप से यहां वेन आरेख मददगार नहीं मिलेगा, लेकिन अगर आपको चाहिए, तो मैं बी को एक आयत के रूप में आकर्षित करूंगा, फिर इसे दो उप-आयतों में विभाजित करें, एक बड़ा वसा एक ए और एक छोटा पतला एक वाई। सुमिंग ए और बी। बड़े भाग A को रद्द करना और छोटे भाग Y को छोड़ देना।
पॉल

10

यह तीन चरों के गर्भ धारण करने में सहायक हो सकता है, क्योंकि यह अन्य असंबंधित चरों के रैखिक संयोजन के रूप में होता है। अपनी अंतर्दृष्टि में सुधार करने के लिए हम उन्हें ज्यामितीय रूप से चित्रित कर सकते हैं, उनके साथ बीजगणितीय रूप से काम कर सकते हैं, और सांख्यिकीय विवरण प्रदान कर सकते हैं जैसा कि हम कृपया।

फिर, तीन असंबंधित शून्य-माध्य, इकाई-विचरण चर , और । इन निर्माणों से निम्नलिखित:XYZ

U=X,V=(7X+51Y)/10;W=(3X+17Y+55Z)/75.

ज्यामितीय व्याख्या

निम्नलिखित ग्राफिक इन चर के बीच संबंधों को समझने के लिए आपको सभी की आवश्यकता है।

आकृति

इस छद्म 3 डी चित्र शो , , , और में समन्वय प्रणाली। वैक्टर के बीच के कोण उनके सहसंबंधों को दर्शाते हैं (सहसंबंध गुणांक कोणों के कोसाइन होते हैं)। और बीच का बड़ा ऋणात्मक सहसंबंध उनके बीच के आप्त कोण में परिलक्षित होता है। साथ और छोटे सकारात्मक सहसंबंध उनके निकट-लंबवतता से परिलक्षित होते हैं। हालाँकि, और का योग सीधे नीचे हैUVWU+VX,Y,ZUVUVWUVW, एक तीव्र कोण (लगभग 45 डिग्री) बनाना: अप्रत्याशित रूप से उच्च सकारात्मक सहसंबंध है।


बीजगणितीय गणना

अधिक कठोरता चाहने वालों के लिए, यहाँ ग्राफिक में ज्यामिति का बैकअप लेना बीजगणित है।

, , और बनाने के लिए उन सभी वर्गमूल जड़ें हैं , जिनमें इकाई भिन्नताएं भी हैं: जो उनके सहसंबंधों की गणना करना आसान बनाता है, क्योंकि सहसंबंध सहसंबंधों के बराबर होगा। इसलियेUVW

Cor(U,V)=Cov(U,V)=E(UV)=E(51XY7X2)/10=7/10=0.7

क्योंकि और असंबंधित हैं। इसी तरह,XY

Cor(U,W)=3/75=1/5=0.2

तथा

Cor(V,W)=(73+1517)/(1075)=1/5=0.2.

आखिरकार,

Cor(U+V,W)=Cov(U+V,W)Var(U+V)Var(W)=1/5+1/5Var(U)+Var(V)+2Cov(U,V)=2/51+12(7/10)=2/53/50.5164.

नतीजतन, इन तीन चरों में वांछित सहसंबंध होते हैं।


सांख्यिकीय स्पष्टीकरण

अब हम देख सकते हैं कि सब कुछ ठीक वैसे ही काम करता है जैसे:

  • U और का एक मजबूत नकारात्मक सहसंबंध है क्योंकि , के नकारात्मक के समानुपाती है और के एक छोटे से कई के रूप में "शोर" है ।V7/10VUY

  • U और के कमजोर सकारात्मक संबंध है क्योंकि के एक छोटे से अधिक शामिल प्लस के गुणकों के रूप में शोर का एक बहुत और ।W1/5WUYZ

  • V और का कमजोर सकारात्मक सहसंबंध है क्योंकि (जब गुणा किया जाता है , जो किसी भी सहसंबंध को नहीं बदलेगा) तीन चीजों का योग है:W1/5W75

    • 17Y , जो साथ सकारात्मक रूप से सहसंबद्ध है ;V
    • 3X , जिसका साथ नकारात्मक सहसंबंध समग्र सहसंबंध को कम करता है;V
    • और का एक बहु जो बहुत शोर का परिचय देता है।Z
  • फिर भी, को साथ सकारात्मक रूप से सहसंबद्ध है क्योंकि यह के उस हिस्से का एक भाग जिसमें शामिल नहीं है ।U+V=(3X+51Y)/10=3/100(3X+17Y)WWZ


क्या वेन आरेख में यह दिखाने का कोई तरीका है? गणित के बावजूद, मुझे अभी भी दो चर के 25 +% को समझने वाले दो चर के योग का तर्क नहीं दिखता है, जब प्रत्येक दो चर जो कि पूर्वसूचक में जाते हैं, लेकिन उस तीसरे चर के 4% के परिवर्तन का तर्क देते हैं । कैसे 8% समझाया गया विचरण 25% समझाया गया विचरण केवल दो चर जोड़कर हो सकता है?
जोएल डब्ल्यू।

इसके अलावा, क्या इस अजीब घटना के व्यावहारिक अनुप्रयोग हैं?
जोएल डब्ल्यू।

यदि एक वेन आरेख समझाया गया विचरण का प्रतिनिधित्व करने के लिए अनुचित है, तो क्या आप मुझे बता सकते हैं कि यह अनुचित क्यों है?
जोएल डब्ल्यू।

@JoelW। यहाँ अच्छा जवाब इस बात पर है कि वेन आरेख इस घटना (उत्तर के अंत की ओर) को दर्शाने के कार्य के लिए नहीं हैं: आंकड़े.stackexchange.com/a/73876/5829
जेक वेस्टफॉल

जोएल, कोहेन ने एक वेन-जैसे आरेख का उपयोग किया था जिसे वे भिन्नताओं का विश्लेषण करने के लिए "बैलेंटाइन" कहते थे। उदाहरण के लिए ww2.amstat.org/publications/jse/v10n1/kennedy.html देखें । जहां तक ​​व्यावहारिक अनुप्रयोग जाते हैं, आपको विपरीत प्रश्न पूछना चाहिए: विचरण और विचरण विकारों के कौन से अनुप्रयोग व्यावहारिक नहीं हैं ?
whuber

5

एक और सरल उदाहरण:

  • चलोzN(0,1)
  • चलोx1N(0,1)
  • आज्ञा दें (इसलिए )x2=zx1z=x1+x2

फिर:

  • Corr(z,x1)=0
  • Corr(z,x2).7
  • Corr(z,x1+x2)=1

ज्यामितीय रूप से, व्हाट्सएप ग्राफिक में जैसा चल रहा है। वैचारिक रूप से, यह कुछ इस तरह दिख सकता है: यहाँ छवि विवरण दर्ज करें

(आपके गणित करियर के कुछ बिंदु पर, यह सीखना ज्ञानवर्धक हो सकता है कि यादृच्छिक चर वेक्टर हैं, एक आंतरिक उत्पाद है , और इसलिए सहसंबंध दो यादृच्छिक चर के बीच कोण का कोसाइन है।)E[XY]

x1 और असंबंधित हैं, इसलिए वे ऑर्थोगोनल हैं। Let दो वैक्टर के बीच के कोण को दर्शाते हैं।zθ

  • Corr(z,x1)=cosθzx1=0θz,x1=π2
  • Corr(z,x2)=cosθzx2.7θz,x2=π4
  • Corr(z,x1+x2)=cosθz,x1+x2=1θz,x1+x2=0

टिप्पणियों में चर्चा से जुड़ने के लिए , के उत्तर में, को कुछ संकेत के रूप में , को कुछ शोर के रूप में, और शोर के संकेत को संकेत और शोर के योग के रूप में । जोड़ना को शोर घटाकर के बराबर है शोर संकेत से ।zx1x2zx1x1x2x1x2


(+1) अच्छा उदाहरण!
user795305

कृपया अपने उत्तर के परिसर की व्याख्या करें। Z = X1 + x2 को प्रस्तुत करने के बाद, "फिर संवाददाता (z, X1) = 0" क्यों कहें? क्या आप कह रहे हैं कि पत्र (z, X1) = 0 आपके पहले लेट स्टेटमेंट का अनुसरण करता है, या शून्य का सहसंबंध एक अतिरिक्त धारणा है? यदि यह एक अतिरिक्त धारणा है, तो मूल प्रश्न में स्थिति को अतिरिक्त धारणा की आवश्यकता क्यों है?
जोएल डब्ल्यू।

@JoelW। मैं कह रहा हूँ मानक सामान्य वितरण के बाद एक यादृच्छिक चर है और एक स्वतंत्र यादृच्छिक चर है जो मानक सामान्य वितरण का भी अनुसरण करता है। और स्वतंत्र हैं, इसलिए उनका सहसंबंध ठीक 0. है। फिर गणना करें और उस कॉल करें । zx1zx1zx1x2
मैथ्यू गुन

@MatthewGunn। आपका तीसरा अक्षर z = X1 + x2 कहता है। ऐसा लगता है कि आपके पहले दो Lets उल्लंघन करते हैं जो कहते हैं कि z और X1 स्वतंत्र हैं।
जोएल डब्ल्यू।

1
@JoelW। मैं सहमत नहीं हूं क्योंकि यह कथन सत्य नहीं है। देखकर के बीच स्वतंत्रता के बारे में कुछ भी नहीं निकलता है और । z=x1+x2zx1
मैथ्यू गुन

3

अपनी टिप्पणी को संबोधित करते हुए:

गणित के बावजूद, मुझे अभी भी दो चर के योग के तर्क नहीं दिख रहे हैं, जो तीसरे चर के 25 +% को समझाते हैं, जब प्रत्येक दो चर जो कि भविष्यवाणी में जाते हैं, लेकिन उस तीसरे चर के 4% के भिन्नता । कैसे 8% समझाया गया विचरण 25% समझाया गया विचरण केवल दो चर जोड़कर हो सकता है?

यहाँ मुद्दा शब्दावली "विचरण समझाया गया" प्रतीत होता है। आंकड़ों में बहुत सारे शब्दों की तरह, इसे ध्वनि के लिए चुना गया है जैसे कि इसका मतलब है कि यह वास्तव में अधिक से अधिक है।

यहाँ एक सरल संख्यात्मक उदाहरण दिया गया है। मान लीजिए कि कुछ चर में मान हैंY

y=(6,7,4,8,9,6,6,3,5,10)

और , प्लस की थोड़ी सी त्रुटि । मान लीजिए कि का मान के मान से बहुत बड़ा है ।UYRRY

r=(20,80,100,90,50,70,40,30,40,60)

और , ताकिU=R+0.1Y

u=(19.4,79.3,100.4,90.8,50.9,70.6,40.6,30.3,40.5,61.0)

और मान लीजिए कि एक और चर ताकिV=R+0.1Y

v=(20.6,80.7,99.6,89.2,49.1,69.4,39.4,29.7,39.5,59.0)

तब और दोनों का साथ बहुत छोटा संबंध है , लेकिन यदि आप उन्हें एक साथ जोड़ते हैं तो की रद्द हो जाती है और आपको ठीक मिलता है , जो साथ पूरी तरह से सहसंबद्ध है ।वी वाई आर 0.2 वाई वाईUVYr0.2YY

विचरण के संदर्भ में, यह एकदम सही समझ में आता है। में विचरण का एक बहुत छोटे से अनुपात बताते क्योंकि में विचरण के सबसे की वजह से है । इसी तरह, में अधिकांश विचलन कारण है । लेकिन , सभी प्रकारों के बारे में बताता है । यहाँ प्रत्येक चर की एक साजिश है:U U R V R R Y U + VYUURVRYU+V

प्रत्येक चर का प्लॉट

हालांकि, जब आप दूसरी दिशा में "विचरण समझाया" शब्द का उपयोग करने का प्रयास करते हैं, तो यह भ्रामक हो जाता है। ऐसा इसलिए है क्योंकि यह कह रहा है कि कुछ "समझाता है" कुछ और है एक तरह से संबंध (कार्य के मजबूत संकेत के साथ)। रोजमर्रा की भाषा में, व्याख्या कर सकते हैं के बिना समझा । पाठ्यपुस्तक के लेखकों ने सहसंबंध के बारे में बात करने के लिए "व्याख्या" शब्द उधार लिया है, इस उम्मीद में कि लोगों को एहसास नहीं होगा कि एक विचरण घटक साझा करना वास्तव में "व्याख्या" के समान नहीं है।B B AABBA


@ n-0101 ने आपके चर, फ्लाउंडर को चित्रित करने के लिए कुछ आंकड़े बनाए हैं। यदि आप उन्हें शामिल करना चाहते हैं, तो आप उन्हें देखना चाहते हैं।
गंग - मोनिका

हालाँकि, इसे संपादित करें, लेकिन आप इसे पसंद करते हैं। मैं वास्तव में काम पर imgur नहीं देख सकता, लेकिन मुझे यकीन है कि यह ठीक हो जाएगा!
फ्लूनडर

मैंने सुझाव को अस्वीकार कर दिया, b / c मैंने नहीं देखा कि उसने आपसे यहां संपर्क किया था। यद्यपि आप सुझाए गए संपादन कतार में जाकर इसे अनुमोदित कर सकते हैं।
गूँग - मोनिका

आपके द्वारा प्रदान किया गया उदाहरण दिलचस्प है, अगर ध्यान से गढ़ा गया है, लेकिन मैंने जो स्थिति प्रस्तुत की है वह अधिक सामान्य है (संख्याओं को ध्यान से नहीं चुना गया) और 2 चर एन (0,1) पर आधारित है। यहां तक ​​कि अगर हम शब्दावली को "व्याख्या" से "साझा" में बदलते हैं, तो भी सवाल बना रहता है। 2 यादृच्छिक चर कैसे हो सकते हैं, प्रत्येक तीसरे चर के साथ 4% साझा विचरण के साथ जोड़ा जा सकता है, एक साधारण राशि के संदर्भ में जोड़ा जा सकता है, सूत्र के अनुसार, 25% साझा विचरण तीसरे चर के साथ है? साथ ही, यदि लक्ष्य भविष्यवाणी है, तो क्या इस विचित्र वृद्धि में कोई वास्तविक दुनिया के व्यावहारिक अनुप्रयोग हैं?
जोएल डब्ल्यू।

खैर, इलेक्ट्रॉनिक्स में कहीं भी जब आपके पास (जोर शोर + कमजोर सिग्नल) + (-लॉउड शोर) = कमजोर सिग्नल होता है, तो आप इसे लागू कर रहे होंगे। उदाहरण के लिए, शोर-रद्द करने वाला हेडफ़ोन।
फ्लूनडर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.