प्रतिलोम स्वतंत्र चर के साथ प्रतिगमन


10

मान लीजिए कि मेरे पास आश्रित चर का -vector और स्वतंत्र चर का -vector है। जब को विरुद्ध प्लॉट किया जाता है , तो मैं देखता हूं कि दोनों के बीच एक रैखिक संबंध (उर्ध्वगामी प्रवृत्ति) है। अब, इसका मतलब यह भी है कि और बीच एक रैखिक गिरावट है ।वाई एन एक्स वाई 1NYNXY वाईएक्स1XYX

अब, यदि मैं प्रतिगमन को चलाता हूं: और प्राप्त मान प्राप्त करेंY = β एक्सY=βX+ϵY^=β^X

फिर मैं प्रतिगमन चलाता हूं: और प्राप्त मान ~ Y = α 1Y=α1X+ϵY~=α^1X

क्या दो पूर्वानुमानित मूल्य, और लगभग बराबर होंगे? ~ YY^Y~

जवाबों:


10

 जब Y को विरुद्ध प्लॉट किया जाता है , तो मैं देखता हूं कि दोनों के बीच एक रैखिक संबंध (उर्ध्वगामी प्रवृत्ति) है। अब, इसका मतलब यह भी है कि वाई और एक्स के बीच एक रैखिक गिरावट है1X

अंतिम वाक्य गलत है: नीचे की ओर प्रवृत्ति है, लेकिन यह रेखीय नहीं है: वाई ~ 1 / एक्स Y ~ X

मैंने एक को फंक्शन के साथ-साथ पर थोड़ा शोर किया । जैसा कि आप देख सकते हैं, जबकि को विरुद्ध साजिश रचने से रैखिक व्यवहार होता है, विरुद्ध रैखिक से दूर होता है। वाईवाई1f(x)=1xYY वाईएक्स1XYX

(@whuber बताते हैं कि प्लॉट के खिलाफ होमोसिस्टेस्टिक नहीं दिखता है। मुझे लगता है कि यह कम लिए अधिक विचरण करता है क्योंकि बहुत अधिक केस डेंसिटी बड़ी रेंज की ओर ले जाती है जो कि अनिवार्य रूप से हम है अनुभव। वास्तव में, डेटा होमोसिस्टैस्टिक है: मैंने डेटा उत्पन्न करने के लिए उपयोग किया , इसलिए के आकार पर कोई निर्भरता नहीं है ।)Y वाईएक्स1XYY = 1 / X + rnorm (length (X), sd = 0.1)X

तो सामान्य तौर पर संबंध बहुत अधिक गैर-रैखिक होते हैं। यही है, जब तक कि आपकी सीमा इतनी संकीर्ण न हो कि आपयहाँ एक उदाहरण है:d Xd1xdx=1x2const.

वाई ~ 1 / एक्स Y ~ X

जमीनी स्तर:

  • सामान्य तौर पर, एक रेखीय या बहुपद फ़ंक्शन द्वारा a -type फ़ंक्शन को अनुमानित करना बहुत कठिन है । और ऑफसेट अवधि के बिना आपको एक उचित अनुमान नहीं मिलेगा।1X
  • यदि अंतराल एक रेखीय सन्निकटन की अनुमति देने के लिए पर्याप्त संकीर्ण है, तो आप किसी भी तरह से डेटा से यह अनुमान लगाने में सक्षम नहीं होंगे कि संबंध होना चाहिए और रैखिक ( ) नहीं होना चाहिए ।1X एक्स1XX

आप एक अमान्य धारणा के साथ शुरू करते हैं: ओपी ने कभी भी और का उल्लेख नहीं किया है वे रैखिक रूप से संबंधित हैं। एकमात्र दावा यह था कि और रैखिक रूप से संबंधित (एक नकारात्मक ढलान के साथ) प्रतीत होते हैं। यही कारण है कि, ज़ाहिर है, इंगित करता है कि और रहे nonlinearly संबंधित। मुझे लगता है कि यह इस तरह की एक गंभीर प्रस्थान है जो यह सवाल उठाता है कि आपकी पोस्ट के शेष केवल पाठकों को भ्रमित कर सकते हैं। X Y 1 / X Y XYXY1/XYX
व्हीबर

2
@whuber: मुझे पूरी तरह से खेद है लेकिन अभी बहुत घना प्रतीत हो रहा है। प्रश्न कहता है: "जब वाई को 1 / एक्स के खिलाफ साजिश रची जाती है, तो मैं देखता हूं कि एक रैखिक संबंध (ऊपर की ओर प्रवृत्ति) है"। यही मैंने 1 और 3 की छवि में चित्रित करने की कोशिश की: वाई 1 से अधिक / एक्स रैखिक रूप से बढ़ रहा है। मैं तो एक्स (nonlinear, घटते) पर इसी Y प्लॉट किया। मैं ओपी को कहां गलत समझ सकता हूं?
SX

1
क्षमा न करें - मैंने केवल आपकी पोस्ट (पहली छवि में एक्स कुल्हाड़ियों के लेबल को ट्रांसफ़र करके) को गलत बताया है! दोष सब मेरा है। इसलिए मैं आपके उत्तर को बढ़ा रहा हूं, जो सही और सूचनात्मक है। यदि आपको एक मौका मिलता है, हालाँकि, आप अवशिष्ट के होमोसैसिडिटी (या इसके अभाव) पर इस परिवर्तन के प्रभाव पर टिप्पणी करना चाह सकते हैं (जो आपके बनाम प्लॉट में पाया जा सकता है )। 1 / एक्सY1/X
whuber

समरूपता पर टिप्पणियों के लिए धन्यवाद। बदलने से स्वतंत्र चर आप प्रतिक्रिया की homoscedasticity में परिवर्तन नहीं करते हैं - लेकिन अपनी उपस्थिति निश्चित रूप से, बदल सकते हैं जैसा कि आप बाहर बिंदु है, जो पता करने के लिए उपयोगी है। (। हम कई अन्य पदों, जहां उदाहरण के लिए समूह आबादी में मात्र मतभेद, के लिए लोगों को गलत विशेषता heteroscedasticity में इस घटना को देखा है)
whuber

बहुत गहन जवाब और टिप्पणियाँ! धन्यवाद @cbeleites और @whuber!
Mayou

2

मुझे उनके "सामान्य रूप से लगभग बराबर" होने का कोई कारण नहीं दिखता है - लेकिन वास्तव में आपके पास लगभग समान होने का क्या मतलब है?

यहाँ एक खिलौना उदाहरण दिया गया है:

library(ggplot2)
n <- 10^3
df <- data.frame(x=runif(n, min=1, max=2))
df$y <- 5 / df$x + rnorm(n)
p <- (ggplot(df, aes(x=x, y=y)) +
      geom_point() +
      geom_smooth(method="lm", formula=y ~ 0 + x) +  # Blue, OP's y hat
      geom_smooth(method="lm", formula=y ~ 0 + I(x^-1), color="red"))  # Red, OP's y tilde
p

चित्र:

मैं कहूंगा कि ये "लगभग बराबर" से बहुत दूर हैं

"नीला" मॉडल बहुत बेहतर होता अगर इसे एक अवरोधन (यानी स्थिर) की अनुमति दी जाती ...


यह बताना मुश्किल है कि आप नीले मॉडल के साथ क्या कर रहे हैं, लेकिन यह निश्चित रूप से ऐसा कुछ नहीं है जैसा कि ओपी वर्णन करता है! लाल एक सवाल में प्रस्तुत स्थिति के बहुत करीब है।
whuber

@cbeleites ऑफसेट की कमी बताती है कि अन्यथा क्या एक रहस्य था। एड्रियन, आप सही हैं - लेकिन मुझे संदेह है कि आपके उदाहरण से ओपी के डेटा पर बहुत असर पड़ता है। पोस्ट एक ऐसी स्थिति का वर्णन करती है जिसमें बनाम प्लॉट (बिना किसी अवरोधक के) अच्छा प्रतीत होता है, जबकि आप एक ऐसी स्थिति का वर्णन करते हैं जहां अच्छा रिश्ता और बीच होता है - और इसलिए बनाम फिट भयानक है। 1 / एक्स वाई एक्स वाई 1 / एक्सY1/XYXY1/X
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.