Poisson regressions के लिए एक अच्छा दृश्य क्या है?


11

मैं कोड जटिलता को क्लोजनेस जैसे कोड दोषों के साथ जोड़ना चाहता हूं। एक सामान्य मॉडल इसे एक पॉइसन प्रक्रिया के रूप में देखना है, जहां अवधि कोडिंग में कितना समय बिताती है और घनत्व कोड जटिलता का एक कार्य है। मैं एक प्रतिगमन करने में सक्षम हूं और महत्व मान आदि प्राप्त कर रहा हूं।

हालाँकि, परिणामों की कल्पना करना मेरे लिए कठिन है (और मेरे कम गणितीय सहयोगियों के लिए भी कठिन है)। क्या आउटलेयर जैसी चीज़ों को देखने के लिए यह देखने का एक अच्छा तरीका है, अगर यह एक रैखिक प्रवृत्ति आदि है? (आर संकुल के लिंक की सराहना की जाती है।)

उदाहरण के लिए, मैं सिर्फ साजिश कर सकता हूं, Defects / Time ~ Complexityलेकिन यह काफी शोर है और चूंकि Defectsविवेकाधीन है और बहुत छोटा है, इसलिए प्रवृत्ति को देखना मुश्किल है। एक बात जो मैं सोच रहा था, वह यह है कि मैं डेटा को क्वांटाइल्स में स्लाइस कर सकता हूं और फिर प्रति क्वांटाइल में एक रिग्रेशन कर सकता हूं और परिणामी घनत्वों की साजिश कर सकता हूं - मुझे यकीन नहीं है कि यह कितना वैध है, खासकर जब से मेरा डेटा सामान्य रूप से वितरित नहीं होता है इसलिए यह हो सकता है एक मात्रा क्या है के बारे में लोगों को गुमराह करना।

जवाबों:


6

आपके द्वारा मॉडल फिट करने के बाद, जो भी मानक तकनीक उनके लिए सार्थक हैं, उनकी तुलना करने के लिए एक चर के रूप में अनुमानित दोषों का उपयोग क्यों नहीं किया जाता है? यह एक निरंतर परिवर्तनशील होने का लाभ है जिससे आप छोटे अंतर भी देख सकते हैं। उदाहरण के लिए, लोग 1.4 और 0.6 के दोषों की अपेक्षित संख्या के बीच के अंतर को समझेंगे, भले ही वे दोनों एक दौर में हों।

एक उदाहरण के लिए कि अनुमानित मूल्य दो चर पर निर्भर करता है, आप समय v का एक समोच्च साजिश कर सकते हैं। दो कुल्हाड़ियों और रंग और आकृति के रूप में जटिलता अनुमानित दोष दिखाने के लिए; और शीर्ष पर वास्तविक डेटा बिंदुओं को अतिरंजित करें।

नीचे दिए गए कथानक को कुछ चमकाने और एक किंवदंती की आवश्यकता है लेकिन एक प्रारंभिक बिंदु हो सकता है।

यहाँ छवि विवरण दर्ज करें

एक विकल्प जोड़ा गया चर भूखंड या आंशिक प्रतिगमन भूखंड है, जो एक पारंपरिक गाऊसी प्रतिक्रिया प्रतिगमन से अधिक परिचित है। इन्हें कार लाइब्रेरी में लागू किया गया है। प्रभावी रूप से शो के बीच संबंध क्या प्रतिक्रिया के बाकी है और व्याख्यात्मक चर में से एक से क्या बचा है, बाकी व्याख्यात्मक चर के बाद प्रतिक्रिया और व्याख्यात्मक चर दोनों के लिए अपना योगदान दिया है। मेरे अनुभव में अधिकांश गैर-सांख्यिकीय दर्शकों को सराहना करना थोड़ा मुश्किल लगता है (मेरे खराब स्पष्टीकरण द्वारा, निश्चित रूप से)।

यहाँ छवि विवरण दर्ज करें

#--------------------------------------------------------------------
# Simulate some data
n<-200
time <- rexp(n,.01)
complexity <- sample(1:5, n, prob=c(.1,.25,.35,.2,.1), replace=TRUE)
trueMod <- exp(-1 + time*.005 + complexity*.1 + complexity^2*.05)
defects <- rpois(n, trueMod)
cbind(trueMod, defects)


#----------------------------------------------------------------------
# Fit model
model <- glm(defects~time + poly(complexity,2), family=poisson)
# all sorts of diagnostic checks should be done here - not shown


#---------------------------------------------------------------------
# Two variables at once in a contour plot

# create grid
gridded <- data.frame(
    time=seq(from=0, to=max(time)*1.1, length.out=100),
    complexity=seq(from=0, to=max(complexity)*1.1, length.out=100))

# create predicted values (on the original scale)
yhat <- predict(model, newdata=expand.grid(gridded), type="response")

# draw plot
image(gridded$time, gridded$complexity, matrix(yhat,nrow=100, byrow=FALSE),
    xlab="Time", ylab="Complexity", main="Predicted average number of defects shown as colour and contours\n(actual data shown as circles)")
contour(gridded$time, gridded$complexity, matrix(yhat,nrow=100, byrow=FALSE), add=TRUE, levels=c(1,2,4,8,15,20,30,40,50,60,70,80,100))

# Add the original data
symbols(time, complexity, circles=sqrt(defects), add=T, inches=.5)

#--------------------------------------------------------------------
# added variable plots

library(car)
avPlots(model, layout=c(1,3))

2

[yमैं|एक्समैं]yमैंएक्समैं

एक्समैंyमैं=0,yमैं=1

एक्समैंएक्समैं

एक्समैंएक्समैं

Btw: क्या आपके पास भी आपके डेटा पर एक नकारात्मक द्विपद प्रतिगमन है? क्या परिणाम बहुत अलग हैं? यदि ऐसा है, तो आपकी पॉइसन धारणा (सशर्त विचरण के बराबर सशर्त माध्य) बहुत अधिक प्रतिबंधक हो सकती है (देखें "अतिविशिष्टता")। उदाहरण के लिए, यह हो सकता है, यदि आपके चर "दोष" में कई शून्य हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.