क्वांटाइल प्रतिगमन में आर-स्क्वेर्ड


21

मैं अपने डेटा के 90 वें प्रतिशत के पूर्वानुमानकर्ताओं को खोजने के लिए क्वांटाइल रिग्रेशन का उपयोग कर रहा हूं। मैं quantregपैकेज का उपयोग करते हुए आर में यह कर रहा हूं । मैं क्वांटल रिग्रेशन के लिए कैसे निर्धारित कर सकता हूं जो यह संकेत देगा कि भविष्यवाणियों के वेरिएबल की कितनी परिवर्तनशीलता बताई जा रही है?आर2

मैं वास्तव में क्या जानना चाहता हूं: "किसी भी विधि का उपयोग मैं यह पता लगाने के लिए कर सकता हूं कि परिवर्तनशीलता की कितनी व्याख्या की जा रही है?"। P मान द्वारा महत्व स्तर कमांड के आउटपुट में उपलब्ध है summary(rq(formula,tau,data)):। मैं फिट की अच्छाई कैसे प्राप्त कर सकता हूं?


7
R2 मात्रात्मक प्रतिगमन के लिए प्रासंगिक नहीं है।
whuber

@ वाउचर: किसी भी वैकल्पिक विधि का उपयोग मैं यह जानने के लिए कर सकता हूं कि परिवर्तनशीलता की कितनी व्याख्या की जा रही है?
rnso

2
यह एक अच्छी बात होगी अपने सवाल के शरीर में पूछना, बजाय एक टिप्पणी में दफन! "परिवर्तनशीलता की व्याख्या की गई" (जैसा कि भिन्नता के संदर्भ में, वैसे भी मापा जाता है) अनिवार्य रूप से एक न्यूनतम-वर्ग अवधारणा है; शायद आप जो चाहते हैं वह सांख्यिकीय महत्व का एक उपयुक्त उपाय है या संभवतः फिट होने की अच्छाई है।
whuber

योग्यता के किसी भी आंकड़े के लिए आपको यह विचार करने की आवश्यकता है कि अच्छा प्रदर्शन क्या होगा, खराब प्रदर्शन क्या होगा और अप्रासंगिक क्या होगा। उदाहरण के लिए, यह 90 वीं प्रतिशतक की कोई आलोचना नहीं है यदि वह 10 वें प्रतिशत का एक घटिया भविष्यवक्ता है। यदि आप मात्रात्मक प्रतिगमन का उपयोग नहीं कर रहे थे तो आपका बेंचमार्क जो भी आप उपयोग कर सकते हैं वह हो सकता है। यदि आपके भविष्यवक्ता निरंतर हैं, तो इसे परिभाषित करना कठिन हो सकता है।
निक कॉक्स

1
@ वाउचर: मैंने उस प्रश्न के शरीर में जोड़ दिया है। P मान द्वारा महत्व स्तर सारांश (आरक्यू (सूत्र, ताऊ, डेटा)) आउटपुट में उपलब्ध है। मैं फिट की अच्छाई कैसे प्राप्त कर सकता हूं?
रंसो

जवाबों:


23

Koenker और Machado वर्णन करते हैं, विशेष रूप से ( ) मात्रात्मक पर फिट की अच्छाई का एक स्थानीय उपाय । आर τ[1]R1τ

चलोV(τ)=minbρτ(yixib)

Let और पूर्ण मॉडल और एक प्रतिबंधित मॉडल के लिए गुणांक अनुमान हो, और और जाएं। इसी पद। ~ β (τ) वी ~ वी वीβ^(τ)β~(τ)वी^वी~वी

वे फिट मानदंड की अच्छाई को परिभाषित करते हैं ।आर1(τ)=1-वी^वी~

Koenker यहां के लिए कोड देता है ,वी

rho <- function(u,tau=.5)u*(tau - (u < 0))
V <- sum(rho(f$resid, f$tau))

इसलिए यदि हम को एक इंटरसेप्ट-ओनली ( - या नीचे दिए गए कोड स्निपेट में) और फिर एक अप्रतिबंधित मॉडल ( ) के साथ गणना करते हैं, तो हम इसकी गणना कर सकते हैं - कम से कम विशेष रूप से - सामान्य तरह कुछ ।~ वी वीवीवी~V0वी^R1 <- 1-Vhat/V0आर2

संपादित करें: आपके मामले में, निश्चित रूप से, दूसरा तर्क, जिसे f$tauकोड की दूसरी पंक्ति में कॉल में रखा जाएगा, जो भी tauआपके द्वारा उपयोग किया जाएगा। पहली पंक्ति में मान केवल डिफ़ॉल्ट सेट करता है।

'माध्य के बारे में व्याख्या करना' वास्तव में वही नहीं है जो आप क्वांटाइल रिग्रेशन के साथ कर रहे हैं, इसलिए आपको वास्तव में समकक्ष उपाय की उम्मीद नहीं करनी चाहिए।

मुझे नहीं लगता कि की अवधारणा मात्रात्मक प्रतिगमन के लिए अच्छी तरह से अनुवाद करती है। आप यहां विभिन्न विभिन्न-या-कम सादृश्य मात्राओं को परिभाषित कर सकते हैं, लेकिन आप जो भी चुनते हैं, आपके पास अधिकांश गुण नहीं होंगे असली में ओएलएस प्रतिगमन है। आपको इस बारे में स्पष्ट होना चाहिए कि आपको किन गुणों की आवश्यकता है और आप क्या नहीं करते हैं - कुछ मामलों में यह मापना संभव हो सकता है कि आपको क्या चाहिए।आर2आर2

-

[1] कोएन्केर, आर और मचाडो, जे (१ ९९९),
क्वांटाइल रिग्रेशन के लिए फिट एंड रिलेटेड इंसर्शन प्रोसेस,
जर्नल ऑफ द अमेरिकन स्टेटिस्टिकल एसोसिएशन, ९ ४ : ४४,, १२ ९ ६-१३१०


क्या ताऊ = 0.9 0.5 के बजाय होना चाहिए?
दिमित्री वी। मास्टरोव

हां, यह होना चाहिए, लेकिन यदि आप सही दूसरे तर्क की आपूर्ति करते हैं (जैसा कि मैंने ऊपर उद्धृत दूसरी पंक्ति में किया है), तो यह काम करता है। पहली पंक्ति में 0.5 का मान केवल एक डिफ़ॉल्ट तर्क है यदि आप tauफ़ंक्शन को कॉल करते समय निर्दिष्ट नहीं करते हैं । मैं पोस्ट में स्पष्ट करूंगा।
Glen_b -Reinstate मोनिका

@Glen_b स्पष्टीकरण के लिए धन्यवाद। जब तक मैं कुछ बेवकूफ नहीं कर रहा हूं, वी छद्म- बजाय अनुमानित मात्रा के बारे में भारित विचलन का योग प्रतीत होता है । आर2
दिमित्री वी। मास्टरोव

@ दिमित्री उह, आप सही कह रहे हैं, मैंने कुछ छोड़ दिया है। मैं जल्द ही इसे ठीक कर दूंगा।
Glen_b -Reinstate मोनिका

@ दिमित्री मुझे लगता है कि मैंने इसे अब ठीक कर दिया है।
Glen_b -Reinstate मोनिका

19

जेएएसए में कोएन्केर और मचाडो (1999) द्वारा सुझाया गया छद्म- उपाय , एक मॉडल से उसी राशि के साथ ब्याज के मॉडल के लिए भारित विचलन की राशि की तुलना में फिट की भलाई को मापता है जिसमें केवल अवरोधन दिखाई देता है। इसकी गणना की जाती हैआर2

आर1(τ)=1-Σyमैंy^मैंτ|yमैं-y^मैं|+Σyमैं<y^मैं(1-τ)|yमैं-y^मैं|Σyमैंy¯τ|yमैं-y¯|+Σyमैं<y¯मैं(1-τ)|yमैं-y¯|,

जहां फिट है वें quantile अवलोकन के लिए , और से अवरोधन-केवल सज्जित मूल्य है आदर्श।y^मैं=ατ+βτएक्सτमैंy¯=βτ

आर1(τ) को में झूठ बोलना चाहिए , जहां 1 अंश के लिए एक सही फिट के अनुरूप होगा, जिसमें अंशों का भारित योग शून्य होगा। यह क्यूआरएम के लिए फिट होने का एक स्थानीय उपाय है क्योंकि यह ओएलएस से वैश्विक विपरीत पर निर्भर करता है । यकीनन इसका उपयोग करने के बारे में चेतावनी का स्रोत: यदि आप मॉडल पूंछ में फिट होते हैं, तो गारंटी नहीं है कि यह कहीं और अच्छी तरह से फिट बैठता है। यह दृष्टिकोण नेस्टेड मॉडल की तुलना करने के लिए भी इस्तेमाल किया जा सकता है।[0,1]τआर2

यहाँ R में एक उदाहरण दिया गया है:

library(quantreg)
data(engel)

fit0 <- rq(foodexp~1,tau=0.9,data=engel)
fit1 <- rq(foodexp~income,tau=0.9,data=engel)

rho <- function(u,tau=.5)u*(tau - (u < 0))
R1 <- 1 - fit1$rho/fit0$rho

यह शायद अधिक सुरुचिपूर्ण ढंग से पूरा किया जा सकता है।


आपका सूत्र अच्छी तरह से प्रदर्शित नहीं होता है। माइनस साइन इन के बाद: R_1(\tau) = 1 - 􀀀अंतिम वर्ण किसी प्रकार की गड़बड़ी है। क्या आप इसकी जाँच कर सकते हैं? हो सकता है कि आप के बजाय टेक्स उपयोग करने के कुछ अ-मानक वर्ण चिपकाया।
टिम

@ मुझे कुछ भी अजीब नहीं दिख रहा है, या तो टेक्स या स्क्रीन पर।
दिमित्री वी। मास्टरोव

यह लिनक्स और खिड़कियों दोनों पर ऐसा दिखता है: snag.gy/ZAp5T.jpg
टिम

@ यह बॉक्स कुछ भी मेल नहीं खाता है, इसलिए इसे अनदेखा किया जा सकता है। मैं इसे बाद में किसी अन्य मशीन से संपादित करने का प्रयास करूंगा।
दिमित्री वी। मास्टरोव
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.