क्या यह निर्भर चर के संबंध में अवशिष्ट के भूखंडों का अध्ययन करने के लिए समझ में आता है?


11

मैं जानना चाहूंगा कि क्या मुझे अविकसित प्रतिगमन मिलने पर आश्रित चर के संबंध में अवशिष्टों के भूखंडों का अध्ययन करना समझ में आता है। यदि यह समझ में आता है, तो अवशिष्ट (y- अक्ष पर) और आश्रित चर के अनुमानित मान (x- अक्ष पर) के बीच एक मजबूत, रैखिक, बढ़ते सहसंबंध का क्या अर्थ है?

यहाँ छवि विवरण दर्ज करें


3
मुझे यकीन नहीं है कि आप "मजबूत, रैखिक, बढ़ते सहसंबंध" से क्या मतलब है। क्या आप प्लॉट दिखा सकते हैं? सज्जित मूल्यों के विरुद्ध अवशिष्टों की साजिश करना पूरी तरह से उचित है। सामान्य तौर पर, आप चाहते हैं कि कोई संबंध न हो - केंद्र के माध्यम से एक सपाट क्षैतिज रेखा। इसके अलावा, आप चाहते हैं कि अवशेषों का ऊर्ध्वाधर फैलाव आपके भूखंड के बाईं ओर से दाईं ओर स्थिर हो।
गंग - मोनिका

नमस्ते। आपके उत्तर के लिए धन्यवाद। यह कथानक है: img100.imageshack.us/img100/7414/bwages.png
लुइगी

यह चिंताजनक है। मुझे यह सुनिश्चित करने दें कि मैं समझता हूं: आपने एक प्रतिगमन मॉडल चलाया, फिर अवशेषों बनाम फिट किए गए मूल्यों की साजिश रची, और जो आपको मिला है, क्या वह सही है? ऐसा नहीं लगना चाहिए। क्या आप मॉडल और प्लॉट के लिए उपयोग किए गए कोड में अपना प्रश्न और पेस्ट संपादित कर सकते हैं?
गंग -

आपने सही समझा। मुझे क्षमा करें, लेकिन मुझे नहीं पता कि कोड को कैसे पुनः प्राप्त किया जाए, मैंने प्रतिगमन को चलाया और अवशिष्टों को कार्यक्रम ग्रेटेल के साथ प्लॉट किया।
लुइगी

2
जब मैंने अपना जवाब नीचे लिखा था, तो मैंने शुरू में @ mark999 द्वारा टिप्पणी नहीं देखी थी। मुझे लगता है कि उनका संदेह सही है, कि यह अवशिष्ट बनाम y- मूल्य है। लुइगी, अपने ग्राफ़ को फिर से करें - जब आप गलत हैं तो इसकी व्याख्या करने की कोशिश न करें कि चर क्या हैं।
माइकल बिशप

जवाबों:


12

yi=β0+β1xi+ϵiβ10yiβ0ϵiyxy^iβ^0--- हर अवलोकन के लिए समान। यदि सभी अनुमानित मूल्य लगभग समान हैं, तो उन्हें त्रुटियों से असंबद्ध होना चाहिए।

xyβ^1

x

यदि आप थोड़ा R प्रदर्शन चाहते हैं, तो यहां जाएं:

y      <- rnorm(100, 0, 5)
x      <- rnorm(100, 0, 2)
res    <- lm(y ~ x)$residuals
fitted <- lm(y ~ x)$fitted.values
plot(y, res)
plot(x, res)
plot(fitted, res)

β1=0

5

अनुमान लगाया गया कि मॉडल सही ढंग से निर्दिष्ट है ...

PX=X(XX)1XPXPX2=PXPX=PX

Cov(Y^,e^)=Cov(PXY,(IPX)Y)=PXCov(Y,Y)(IPX)=σ2PX(IPX)=0

तो पूर्वानुमानित आश्रित चर के खिलाफ अवशिष्ट के बिखराव-साजिश को कोई संबंध नहीं दिखाना चाहिए।

परंतु!

Cov(Y,e^)=Cov(Y,(IPX)Y)=Cov(Y,Y)(IPX)=σ2(IPX)

σ2(IPX)

जहाँ तक मुझे पता है ग्रेट मूल निर्भर चर के खिलाफ अवशिष्टों के ग्राफ को डिफ़ॉल्ट रूप से उत्पन्न करता है (भविष्यवाणी नहीं की गई है)।


मैं अलग संभावना की सराहना करता हूं। यह वह जगह है जहाँ Gretl का कुछ ज्ञान सहायक है। मुझे आश्चर्य है कि, यह कितना प्रशंसनीय है कि यह वास्तविक उत्तर के रूप में है। अपने सिम्युलेटेड डेटा का उपयोग करते हुए, मैंने मूल DV बनाम अवशिष्ट और साजिश रची; r = .22 और प्लॉट मेरे 3rd प्लॉट की तरह दिखता है, न कि प्रश्न प्लॉट। बेशक, मैंने अपनी कहानी की प्रशंसनीयता की जांच करने के लिए उन आंकड़ों पर काम किया - वे आपकी जांच करने के लिए उपयुक्त नहीं हो सकते हैं।
गूँग - मोनिका

@gung क्या मतलब है कि आपने अपने नकली डेटा का उपयोग किया है?
माइकल बिशप

@MichaelBishop यदि आप मेरे उत्तर को देखते हैं, तो आप देखते हैं कि मैंने अपनी कहानी को आज़माने के लिए डेटा का अनुकरण किया है, यह देखने के लिए कि क्या यह पोस्ट किए गए कथानक की तरह दिखाई देगा। मेरा कोड और प्लॉट प्रस्तुत किए गए हैं। जब से मैं बीज निर्दिष्ट, यह किसी के द्वारा प्रतिलिपि प्रस्तुत करने योग्य है आर के उपयोग के साथ
को पुनः स्थापित मोनिका - गुंग

4

क्या यह संभव है कि आप वास्तविक मूल्यों के साथ फिट / अनुमानित मूल्यों को भ्रमित कर रहे हैं?

जैसा कि @gung और @Bostat ने कहा है, आपको उम्मीद है कि फिट किए गए मूल्यों और अवशिष्टों के बीच कोई संबंध नहीं है। दूसरी ओर, आश्रित / परिणाम चर के वास्तविक मूल्यों और अवशिष्टों के बीच एक रैखिक संबंध खोजना अपेक्षित है और विशेष रूप से सूचनात्मक नहीं है।

पिछले वाक्य को स्पष्ट करने के लिए जोड़ा गया: न केवल अवशिष्ट और बाहर आने के वास्तविक मूल्यों के बीच किसी भी रैखिक संबंध की उम्मीद की जानी है ... वाई के कम मापा मूल्यों के लिए, एक उपयोगी मॉडल से वाई के अनुमानित मूल्यों की तुलना में अधिक हो जाएगा वास्तविक मापा मान, और इसके विपरीत।


आप जो कह रहे हैं उसका निहितार्थ यह है कि, यदि मूल्यों को Y के निम्न मानों पर लगातार कम करके आंका जाता है, और Y के उच्च मूल्यों पर लगातार अधिभोग किया जाता है, तो यह ठीक है। यह एक समस्या है, है ना?
19land में rolando2

@ rolando2, मैंने यह नहीं कहा है कि आप जो कहते हैं वह मैंने निहित है हालांकि शायद मुझे अपना जवाब स्पष्ट करना चाहिए। जैसा कि आपने कहा, वाई की कम ऊंचाई पर लगातार अंडरप्रिडेंस करना और वाई के उच्च मूल्यों पर अत्याचार करना बहुत खराब मॉडल का संकेत होगा। मैंने इसके विपरीत की कल्पना की, वाई के कम मूल्यों पर अतिप्रश्न और वाई के उच्च मूल्यों पर नजरअंदाज किया। यह घटना आम है, और आपके द्वारा व्याख्या करने में सक्षम आश्रित चर में कितने विचरण के अनुपात में होने की उम्मीद है। कल्पना कीजिए कि आपके पास किसी भी वैरिएबल की कमी है जो वाई की भविष्यवाणी करता है, इसलिए आप हमेशा अपनी भविष्यवाणी के रूप में माध्य का उपयोग करें
माइकल बिशप

1
आपने जो कहा है वह मेरे लिए मायने रखता है, सिवाय एक बात के। मुझे यह कल्पना करने में कठिनाई हो रही है कि एक प्रवृत्ति जो लुइगी ने दिखाई है वह कभी भी एक ध्वनि या वांछनीय समाधान में दिखाई देगी, भले ही प्रवृत्ति ऊपरी बाएं से निचले दाईं ओर गई हो।
rolando2

1
@ rolando2, अवशिष्टों को आमतौर पर मनाया - सज्जित के रूप में परिभाषित किया जाता है, इसलिए नकारात्मक अवशिष्ट ओवर-पूर्वानुमान हैं। थोड़ी व्याख्यात्मक शक्ति के साथ एक उचित रूप से निर्दिष्ट मॉडल में - मैं एक सामाजिक वैज्ञानिक हूं इसलिए मैं इन सभी को देखता हूं - अवशिष्ट और मनाया परिणाम मूल्यों के बीच एक मजबूत सकारात्मक संबंध होगा। यदि यह एक वास्तविक बनाम वास्तविक स्थान है, तो ऊपरी बाएं से दाएं नीचे की ओर एक प्रवृत्ति बुरी तरह से गलत-निर्दिष्ट मॉडल का संकेत होगी, जिसके बारे में आपको शुरुआत में चिंता थी।
माइकल बिशप 3

ठीक है, मेरी गलती है। जैसा कि माइकल बिशप और रोआह ने लिखा है, ग्रेटेल ने प्रेक्षित y के संबंध में अवशिष्टों का उल्लेख किया है , न कि भविष्यवाणी की गई। मुझे इस सब गड़बड़ के लिए बहुत खेद है, मुझे वास्तव में इन सभी उत्तरों की उम्मीद नहीं थी। मैं एक शुरुआती हूं और मैंने यह त्रुटि की है, इसलिए मुझे आशा है कि आप मुझे "माफ" कर सकते हैं। वैसे भी, मुझे लगता है कि यह मुझे संकेत देना चाहिए कि मुझे अधिक व्याख्यात्मक चर का उपयोग करना चाहिए था। सभी को धन्यवाद!
लुइगी

3

यहां दिए गए उत्तर मुझे कुछ विचार दे रहे हैं कि यहां क्या हो रहा है। मुझे विश्वास है कि दुर्घटना से कुछ गलतियाँ हुई होंगी। देखें कि क्या निम्नलिखित कहानी समझ में आती है: शुरू करने के लिए, मुझे लगता है कि डेटा में X & Y के बीच एक मजबूत संबंध है (यहां कुछ कोड और एक प्लॉट):

set.seed(5)
wage <- rlnorm(1000, meanlog=2.3, sdlog=.5)
something_else <- .7*wage + rnorm(1000, mean=0, sd=1)
plot(wage, something_else, pch=3, col="red", main="Plot X vs. Y")

यहाँ छवि विवरण दर्ज करें

लेकिन गलती से वाई की भविष्यवाणी सिर्फ माध्य से की गई। इसकी तुलना करते हुए, केवल माडल से अवशिष्ट को X के विरुद्ध प्लॉट किया जाता है, भले ही इसका उद्देश्य क्या था जो कि फिटेड वैल्यू (कोड और प्लॉट) के विरुद्ध प्लॉट करना था:

meanModel <- lm(something_else~1)
windows()
plot(wage, meanModel$residuals, pch=3, col="red", 
    main="Plot of residuals from Mean only Model against X")
abline(h=0, lty="dotted")

यहाँ छवि विवरण दर्ज करें

हम इसे उचित मॉडल के अनुसार ठीक कर सकते हैं और उस (कोड और प्लॉट) से अवशिष्टों की साजिश रच सकते हैं:

appropriateModel <- lm(something_else~wage)
windows()
plot(appropriateModel$fitted.values, appropriateModel$residuals, pch=3, col="red",
main="Plot of residuals from the appropriate\nmodel against fitted values")
lines(lowess(appropriateModel$residuals~appropriateModel$fitted.values))

यहाँ छवि विवरण दर्ज करें

ऐसा लगता है कि जब मैं शुरू कर रहा था तो मैंने केवल गॉफ-अप के प्रकार किए थे।


0

यह ग्राफ़ इंगित करता है कि आपके द्वारा फिट किया गया मॉडल अच्छा नहीं है। जैसा कि @gung ने मुख्य प्रश्न पर पहली टिप्पणी में कहा कि विधेय प्रतिक्रिया और अवशिष्ट के बीच कोई संबंध नहीं होना चाहिए।

"एक विश्लेषक एक यादृच्छिक फैशन में एक प्रतिक्रिया की भविष्यवाणी करने में गलती करना एक प्रतिगमन मॉडल की उम्मीद करनी चाहिए; मॉडल वास्तविक तुलना में अधिक मूल्यों का अनुमान है और समान प्रायिकता के साथ वास्तविक से कम करना चाहिए देखें। इस "

मैं उनके बीच के रिश्ते को देखने के लिए स्वतंत्र बनाम बनाम पहले प्लॉट प्रतिक्रिया की सिफारिश करूंगा। मॉडल में बहुपद शब्द जोड़ना उचित होगा।


0

क्या यह नहीं होता अगर X और Y चर के बीच कोई संबंध नहीं होता? इस ग्राफ को देखने से, ऐसा प्रतीत होता है कि आप अनिवार्य रूप से वाई का अनुमान लगा रहे हैं।


0

मुझे लगता है कि ओपी को मूल रिस्पांस वेरिएबल (मॉडल से फिटेड रिस्पांस वेरिएबल नहीं) बनाम रेजीड्यूल्स मिले। मैं हर समय इस तरह के भूखंड देखता हूं, लगभग एक ही सटीक पैटर्न के साथ। सुनिश्चित करें कि आप अवशेषों बनाम सज्जित मूल्यों की साजिश करते हैं, क्योंकि मुझे यकीन नहीं है कि आप अवशेषों बनाम मूल वाई से क्या सार्थक निष्कर्ष निकाल सकते हैं। लेकिन मैं निश्चित रूप से गलत हो सकता हूं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.