एक "सरल" माप त्रुटि मॉडल फिटिंग के लिए तरीके


13

मैं उन तरीकों की तलाश कर रहा हूं जिनका उपयोग "ओएलएस" माप त्रुटि मॉडल का अनुमान लगाने के लिए किया जा सकता है।

x i = X i + e x , i Y i = α + β X i

yi=Yi+ey,i
xi=Xi+ex,i
Yi=α+βXi

जहां अज्ञात और साथ त्रुटियां सामान्य हैं । "मानक" OLS इस मामले में काम नहीं करेगा। σ 2 एक्सσy2σx2

विकिपीडिया के कुछ अनुचित समाधान हैं - दो ने आपको यह मानने पर मजबूर कर दिया है कि या तो "भिन्नता अनुपात" या " विश्वसनीयता अनुपात " ज्ञात है, जहां असली का विचरण है । मैं इससे संतुष्ट नहीं हूं, क्योंकि कोई ऐसा व्यक्ति नहीं हो सकता जो भिन्नताओं को उनके अनुपात के बारे में नहीं जानता हो? λ=σ 2 एक्सδ=σy2σx2 σ 2 एक्स एक्समैंλ=σX2σx2+σX2σX2Xi

वैसे भी, क्या इन दोनों के अलावा कोई अन्य समाधान है जो मुझे मापदंडों के बारे में कुछ भी "जानने" की आवश्यकता नहीं है?

केवल अवरोधन और ढलान के लिए समाधान ठीक हैं।


विकिपीडिया लेख स्वयं आपको इस प्रश्न का उत्तर प्रदान करता है। यदि आप "सच्चे" रजिस्ट्रार की सामान्यता मानते हैं, तो आपको त्रुटियों के वितरण पर आगे की स्थिति की आवश्यकता होगी। यदि सच्चा प्रतिपादक गाऊसी नहीं है, तो आपको कुछ उम्मीद है। रायरसोल (1950) देखें ।
कार्डिनल

इसके अलावा, "इंटरसेप्ट और स्लोप के लिए समाधान ठीक हैं" से आपका क्या मतलब है। वे आपके केवल दो पैरामीटर हैं! या क्या आप "सच्चे" प्रतिसादकर्ता के रूप में अच्छी तरह से वापस करने की कोशिश कर रहे थे?
कार्डिनल

@कार्डिनल - मेरा मतलब था कि मैं विशेष रूप से दो पैमाने के मापदंडों के बारे में परवाह नहीं करता था, और जैसा कि आप कहते हैं, "सही" । Xi
probabilityislogic

समझा। यह समझ आता है।
कार्डिनल

जवाबों:


7

JW Gillard द्वारा वर्णित कई प्रकार की संभावनाएँ हैं जो दोनों वैरिएबल्स में त्रुटियों के साथ रैखिक प्रतिगमन के एक ऐतिहासिक अवलोकन में वर्णित हैं

यदि आप किसी अन्य पर एक विधि को चुनने के लिए विवरण या कारणों में कोई दिलचस्पी नहीं कर रहे हैं, सिर्फ आसान, केन्द्रक के माध्यम से लाइन आकर्षित करने के लिए है, जिसके साथ जाना ढलान के साथ , अर्थात मनाया गया मानक विचलन का अनुपात (ढलान के संकेत को और के सहसंयोजक के संकेत के समान ); जैसा कि आप शायद बाहर काम कर सकते हैं, यह के -axis पर एक अवरोधन देता है(x¯,y¯)β^=sy/sxxyyα^=y¯β^x¯.

इस विशेष दृष्टिकोण के गुण हैं

  1. यह एक ही पंक्ति की तुलना देता है के खिलाफ के रूप में के खिलाफ ,xyyx
  2. यह पैमाने पर अपरिवर्तनीय है, इसलिए आपको इकाइयों के बारे में चिंता करने की आवश्यकता नहीं है,
  3. यह दो साधारण रेखीय प्रतिगमन रेखाओं के बीच स्थित है
  4. यह उन्हें पार करता है जहां वे टिप्पणियों के केंद्रक पर एक दूसरे को पार करते हैं, और
  5. इसकी गणना करना बहुत आसान है।

ढलान दो साधारण रैखिक प्रतिगमन ढलानों के ढलान का ज्यामितीय माध्य है। यह भी है कि यदि आप और अवलोकनों का मानकीकरण करते हैं, तो आपको 45 ° (या यदि नकारात्मक सहसंबंध है तो 135 °) पर एक रेखा खींची जाए और फिर लाइन को डी-मानकीकृत कर दिया जाए। इसे एक निहित धारणा बनाने के बराबर के रूप में भी देखा जा सकता है कि त्रुटियों के दो सेटों के भिन्न रूप, टिप्पणियों के दो सेटों के संस्करण के समानुपाती हैं; जहां तक ​​मैं बता सकता हूं, आप दावा करते हैं कि यह नहीं पता कि यह कौन सा तरीका गलत है।xy

यह बताने के लिए कुछ R कोड है: चार्ट में लाल रेखा पर का OLS प्रतिगमन है, नीली रेखा पर का OLS प्रतिगमन है , और हरी रेखा यह सरल विधि है। ध्यान दें कि ढलान लगभग 5 होना चाहिए।YXXY

X0 <- 1600:3600
Y0 <- 5*X0 + 700
X1 <- X0 + 400*rnorm(2001)
Y1 <- Y0 + 2000*rnorm(2001)
slopeOLSXY  <- lm(Y1 ~ X1)$coefficients[2]     #OLS slope of Y on X
slopeOLSYX  <- 1/lm(X1 ~ Y1)$coefficients[2]   #Inverse of OLS slope of X on Y
slopesimple <- sd(Y1)/sd(X1) *sign(cov(X1,Y1)) #Simple slope
c(slopeOLSXY, slopeOLSYX, slopesimple)         #Show the three slopes
plot(Y1~X1)
abline(mean(Y1) - slopeOLSXY  * mean(X1), slopeOLSXY,  col="red")
abline(mean(Y1) - slopeOLSYX  * mean(X1), slopeOLSYX,  col="blue")
abline(mean(Y1) - slopesimple * mean(X1), slopesimple, col="green")

@ हेनेरी, की आपकी परिभाषा मेरे लिए कोई मायने नहीं रखती। क्या कुछ "टोपी" गायब हैं? β^
कार्डिनल

यह की प्रेक्षित मानक विचलन होने के लिए मतलब है की प्रेक्षित मानक विचलन से विभाजित । मैं को बदल दूंगा{yi}{xi}σs
हेनरी

@ हेनरी, क्या आप अपनी कुछ टिप्पणियों को स्पष्ट कर सकते हैं? आपके वर्तमान विवरण के आधार पर मुझे कोई चीज़ आड़े आ रही है। Let ढलान मान लें कि प्रतिक्रिया है और भविष्यवक्ता है। Let मान लें कि प्रतिक्रिया और है । फिर और , जहां की और बीच नमूना सहसंबंध है । इसलिए इन दो ढलान अनुमानों का ज्यामितीय मतलब सिर्फ ।β^xyyxβ^yxxyβ^xy=ρ^sy/sxβ^yx=ρ^sx/syρ^xyρ^
कार्डिनल

@कार्डिनल: नहीं - जब मैं देखता हूं तो मेरा मतलब है कि ढलान क्योंकि इसे रूप में फिर से लिखा जा सकता है । जब आप एक ही ग्राफ पर एक साथ दो ओएलएस रेखाओं को आरेखित बिंदुओं के साथ खींचने की कोशिश करते हैं (जैसे कि ऊर्ध्वाधर अक्ष पर और क्षैतिज अक्ष पर ) तो आपको ढलान में से एक को उल्टा करना होगा। तो मेरा मतलब था कि आप ज्यामितीय माध्य को " और , जो कि बस । या, यदि आप और दोनों रेखाओं और प्रेक्षित बिंदुओं के लिए दूसरे तरीके से प्लॉट करने के लिए अपरंपरागत हैं , तो आपको ढलान के रूप में इसका उलटा मिलता है।1 /y = एक्स /- /y एक्स ρ रों y / एस एक्स रों y / ρ रों एक्स रों y / एस एक्स y एक्सx=by+c1/by=x/bc/byxρ^sy/sxsy/ρ^sxsy/sxyx
हेनरी

@ हेनरी - यह काफी दिलचस्प जवाब है। मुझे इसकी वैधता पर संदेह नहीं है, लेकिन एक बात जो मुझे आश्चर्यचकित करती है वह यह है कि और बीच सहसंबंध / सहसंबंध उत्तर से पूरी तरह अनुपस्थित है। निश्चित रूप से यह उत्तर के लिए प्रासंगिक होना चाहिए ? एक्सYX
प्रोबेबिलिसलॉजिकल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.