मैं एक डेटा सेट में मेरे मूल्यों के 99 वें प्रतिशत का उपयोग करके एक प्रतिगमन मॉडल बनाने के लिए क्वांटग्राम पैकेज का उपयोग कर रहा हूं । पिछले स्टैकओवरफ़्लो प्रश्न से सलाह के आधार पर मैंने पूछा, मैंने निम्नलिखित कोड संरचना का उपयोग किया है।
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
जिसे मैं अपने डेटा के ऊपर प्लॉट दिखाता हूं। मैंने इसे ggplot2 का उपयोग करके प्लॉट किया है, अंकों के लिए एक अल्फा मान के साथ। मुझे लगता है कि मेरे विश्लेषण में मेरे वितरण की पूंछ को पर्याप्त रूप से नहीं माना जा रहा है। शायद यह इस तथ्य के कारण है कि व्यक्तिगत बिंदु हैं, कि प्रतिशत के प्रकार के माप द्वारा अनदेखा किया जा रहा है।
टिप्पणियों में से एक ने सुझाव दिया कि
पैकेज विगनेट में नॉनलाइनियर क्वांटाइल रिग्रेशन पर सेक्शन और स्मूदनिंग स्पाइन के साथ मॉडल आदि शामिल हैं।
मेरे पिछले प्रश्न के आधार पर मैंने एक लघुगणक संबंध माना, लेकिन मुझे यकीन नहीं है कि यह सही है। मुझे लगा कि मैं 99 वें प्रतिशत के अंतराल पर सभी बिंदुओं को निकाल सकता हूं और फिर उन्हें अलग से जांच सकता हूं, लेकिन मुझे यकीन नहीं है कि यह कैसे करना है, या यदि यह एक अच्छा तरीका है। मैं इस संबंध को पहचानने में सुधार करने के बारे में किसी भी सलाह की सराहना करूंगा।