यहाँ मेरी स्थिति के बारे में एक छोटी पृष्ठभूमि है: मेरा डेटा एक शिकारी द्वारा सफलतापूर्वक खाए गए शिकार की संख्या को संदर्भित करता है। जैसा कि प्रत्येक परीक्षण में शिकार की संख्या सीमित (25 उपलब्ध) होती है, मेरे पास एक कॉलम "नमूना" उपलब्ध शिकार की संख्या का प्रतिनिधित्व करता था (इसलिए, प्रत्येक परीक्षण में 25), और दूसरे को "गणना" कहा जाता है जो सफलता की संख्या थी ( कितने शिकार खाए गए)। मैंने अनुपात डेटा पर आर किताब से उदाहरण पर अपना विश्लेषण आधारित किया (पृष्ठ 578)। व्याख्यात्मक चर तापमान (4 स्तर, जिसे मैंने कारक के रूप में माना), और शिकारी का सेक्स (जाहिर है, पुरुष या महिला)। इसलिए मैं इस मॉडल को समाप्त करता हूं:
model <- glm(y ~ Temperature+Sex+Temperature*Sex data=predator, family=quasibinomial)
डीविंस टेबल का विश्लेषण प्राप्त करने के बाद, यह पता चलता है कि तापमान और सेक्स (लेकिन बातचीत नहीं) का शिकार की खपत पर महत्वपूर्ण प्रभाव पड़ता है। अब, मेरी समस्या: मुझे यह जानना होगा कि कौन से तापमान में अंतर है, अर्थात, मुझे 4 तापमान की एक दूसरे से तुलना करनी होगी। अगर मेरे पास एक लीनियर मॉडल था, तो मैं TukeyHSD फ़ंक्शन का उपयोग करूंगा, लेकिन जैसा कि मैं एक GLM का उपयोग कर रहा हूं मैं नहीं कर सकता। मैं पैकेज एमएएस के माध्यम से देख रहा हूं और एक विपरीत मैट्रिक्स स्थापित करने की कोशिश कर रहा हूं, लेकिन किसी कारण से यह काम नहीं करता है। कोई सुझाव या संदर्भ?
यहाँ सारांश मैं अपने मॉडल से मिलता है, अगर यह स्पष्ट करने में मदद करता है ...
y <- cbind(data$Count, data$Sample-data$Count)
model <- glm(y ~ Temperature+Sex+Temperature*Sex data=predator, family=quasibinomial)
> summary(model)
# Call:
# glm(formula = y ~ Temperature + Sex + Temperature * Sex, family=quasibinomial, data=data)
# Deviance Residuals:
# Min 1Q Median 3Q Max
# -3.7926 -1.4308 -0.3098 0.9438 3.6831
# Coefficients:
# Estimate Std. Error t value Pr(>|t|)
# (Intercept) -1.6094 0.2672 -6.024 3.86e-08 ***
# Temperature8 0.3438 0.3594 0.957 0.3414
# Temperature11 -1.0296 0.4803 -2.144 0.0348 *
# Temperature15 -1.2669 0.5174 -2.449 0.0163 *
# SexMale 0.3822 0.3577 1.069 0.2882
# Temperature8:SexMale -0.2152 0.4884 -0.441 0.6606
# Temperature11:SexMale 0.4136 0.6093 0.679 0.4990
# Temperature15:SexMale 0.4370 0.6503 0.672 0.5033
# ---
# Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
# (Dispersion parameter for quasibinomial family taken to be 2.97372)
# Null deviance: 384.54 on 95 degrees of freedom
# Residual deviance: 289.45 on 88 degrees of freedom
# AIC: NA
# Number of Fisher Scoring iterations: 5
Temperature
एक कारक के रूप में मॉडलिंग क्यों की ? क्या आपके पास वास्तविक संख्यात्मक मान नहीं हैं? मैं उन्हें एक निरंतर परिवर्तनशील के रूप में उपयोग करूंगा और फिर यह पूरा मुद्दा मूट है।
glht
multcomp
glht(my.glm, mcp(Temperature="Tukey"))
model<-glm(y ~ Temperature*Sex data=predator, family=quasibinomial)