कई रैखिक मॉडल से संबंधों को पेश करने का सबसे अच्छा तरीका

मेरे पास लगभग 6 भविष्यवक्ताओं के साथ एक रेखीय मॉडल है और मैं अनुमान, एफ मान, पी मान आदि प्रस्तुत करने जा रहा हूं। हालांकि, मैं सोच रहा था कि किसी एकल भविष्यवक्ता के व्यक्तिगत प्रभाव का प्रतिनिधित्व करने के लिए सबसे अच्छा दृश्य साजिश क्या होगी प्रतिक्रिया चर? स्कैटर प्लॉट? सशर्त प्लॉट? प्रभाव की साजिश? आदि? मैं उस प्लॉट की व्याख्या कैसे करूंगा?

यदि आप कर सकते हैं तो मैं उदाहरण देने के लिए स्वतंत्र महसूस करने के लिए आर में ऐसा कर रहा हूँ।

संपादित करें: मैं मुख्य रूप से किसी भी भविष्यवक्ता और प्रतिक्रिया चर के बीच संबंध प्रस्तुत करने से संबंधित हूं।

— AMathew
स्रोत

क्या आपके पास सहभागिता की शर्तें हैं? यदि आपके पास है तो प्लॉट करना बहुत कठिन होगा।

— गरमका सिप

नहीं, सिर्फ 6 निरंतर चर

— AMAThew

आपके पास पहले से ही छह प्रतिगमन गुणांक हैं, प्रत्येक भविष्यवक्ता के लिए एक, जो संभवतः सारणीबद्ध रूप में प्रस्तुत करने जा रहे हैं, ग्राफ़ के साथ फिर से उसी बिंदु को दोहराने का क्या कारण है?

— पेंग्विन_ नाइट नाइट

गैर-तकनीकी दर्शकों के लिए, मैं उन्हें अनुमान के बारे में बात करने या गुणांक की गणना करने की तुलना में एक भूखंड दिखाऊंगा।

— AMAThew

@ मैं देख रहा हूँ। शायद ये दो वेबसाइटें आपको कुछ प्रेरणा दे सकती हैं: प्रतिगमन मॉडल की कल्पना करने के लिए आर विज़ग्राम पैकेज और एरर बार प्लॉट का उपयोग करना।

— पेंग्विन_ नाइट

मेरी राय में, आपके द्वारा वर्णित मॉडल वास्तव में प्लॉटिंग के लिए खुद को उधार नहीं देता है, क्योंकि प्लॉट सबसे अच्छा काम करते हैं जब वे जटिल जानकारी प्रदर्शित करते हैं जो अन्यथा समझना मुश्किल है (उदाहरण के लिए, जटिल इंटरैक्शन)। हालाँकि, यदि आप अपने मॉडल में संबंधों का एक प्लॉट प्रदर्शित करना चाहते हैं, तो आपको दो मुख्य विकल्प मिलेंगे:

कच्चे आंकड़ो के बिखराव के साथ, ब्याज और अपने परिणाम के अपने पूर्ववर्तियों में से प्रत्येक के बीच द्विवार्षिक संबंधों के भूखंडों की एक श्रृंखला प्रदर्शित करें। आपकी पंक्तियों के चारों ओर प्लॉट त्रुटि लिफाफे हैं।
विकल्प 1 से प्लॉट प्रदर्शित करें, लेकिन कच्चे डेटापॉइंट्स को दिखाने के बजाय, अपने अन्य भविष्यवक्ताओं के साथ डेटापॉइंट्स को हाशिए पर दिखाएं (यानी, अन्य भविष्यवक्ताओं के योगदान को घटाने के बाद)

विकल्प 1 का लाभ यह है कि यह दर्शकों को कच्चे डेटा में बिखराव का आकलन करने की अनुमति देता है। विकल्प 2 का लाभ यह है कि यह अवलोकन-स्तर की त्रुटि को दर्शाता है जो वास्तव में फोकल गुणांक के मानक त्रुटि के परिणामस्वरूप होता है जिसे आप प्रदर्शित कर रहे हैं।

आर Prestigeमें carपैकेज में डेटासेट से डेटा का उपयोग करके मैंने आर कोड और नीचे प्रत्येक विकल्प का एक ग्राफ शामिल किया है।

## Raw data ##

mod <- lm(income ~ education + women, data = Prestige)
summary(mod)

# Create a scatterplot of education against income
plot(Prestige$education, Prestige$income, xlab = "Years of education", 
     ylab = "Occupational income", bty = "n", pch = 16, col = "grey")
# Create a dataframe representing the values on the predictors for which we 
# want predictions
pX <- expand.grid(education = seq(min(Prestige$education), max(Prestige$education), by = .1), 
                  women = mean(Prestige$women))
# Get predicted values
pY <- predict(mod, pX, se.fit = T)

lines(pX$education, pY$fit, lwd = 2) # Prediction line
lines(pX$education, pY$fit - pY$se.fit) # -1 SE
lines(pX$education, pY$fit + pY$se.fit) # +1 SE

कच्चे डेटा पॉइंट का उपयोग करके ग्राफ़

## Adjusted (marginalized) data ##

mod <- lm(income ~ education + women, data = Prestige)
summary(mod)

# Calculate the values of income, marginalizing out the effect of percentage women
margin_income <- coef(mod)["(Intercept)"] + coef(mod)["education"] * Prestige$education + 
    coef(mod)["women"] * mean(Prestige$women) + residuals(mod)

# Create a scatterplot of education against income
plot(Prestige$education, margin_income, xlab = "Years of education", 
     ylab = "Adjusted income", bty = "n", pch = 16, col = "grey")
# Create a dataframe representing the values on the predictors for which we 
# want predictions
pX <- expand.grid(education = seq(min(Prestige$education), max(Prestige$education), by = .1), 
              women = mean(Prestige$women))
# Get predicted values
pY <- predict(mod, pX, se.fit = T)

lines(pX$education, pY$fit, lwd = 2) # Prediction line
lines(pX$education, pY$fit - pY$se.fit) # -1 SE
lines(pX$education, pY$fit + pY$se.fit) # +1 SE

समायोजित डेटा

— पैट्रिक एस फोर्शर
स्रोत