एक समय पर मिश्रित प्रभाव मॉडल से अनुमानित मूल्यों के योग पर भिन्नता


32

मेरे पास एक मिश्रित प्रभाव वाला मॉडल है (वास्तव में एक सामान्यीकृत मिश्रित मॉडल है) जो मुझे समय के लिए भविष्यवाणियां देता है। ऑटोकरेलेशन को काउंटर करने के लिए, मैं एक corCAR1 मॉडल का उपयोग करता हूं, इस तथ्य को देखते हुए कि मेरे पास लापता डेटा है। डेटा मुझे कुल भार देने वाला है, इसलिए मुझे पूरे पूर्वानुमान अंतराल पर योग करने की आवश्यकता है। लेकिन मुझे उस कुल भार पर मानक त्रुटि का भी अनुमान लगाना चाहिए।

यदि सभी पूर्वानुमान स्वतंत्र होंगे, तो इसे आसानी से हल किया जा सकता है:

के साथ वी एक आर ( [ एक्स मैं ] ) = एस ( [ एक्स मैं ] ) Var(i=1nE[Xi])=i=1nVar(E[Xi])Var(E[Xi])=SE(E[Xi])2

समस्या यह है कि, अनुमानित मान एक मॉडल से आ रहे हैं, और मूल डेटा में ऑटोक्रेलेशन है। संपूर्ण समस्या निम्न प्रश्नों की ओर ले जाती है:

  1. क्या मैं यह मानने में सही हूं कि गणना की गई भविष्यवाणियों पर एसई को उस भविष्यवाणी के अनुमानित मूल्य पर विचरण की जड़ के रूप में व्याख्या की जा सकती है? मैं भविष्यवाणियों की व्याख्या "मतलब भविष्यवाणियों" के रूप में करता हूं, और इसलिए साधनों का एक पूरा सेट प्राप्त करता हूं।
  2. मैं इस समस्या में स्वतःसंबंध को कैसे शामिल करूं, या क्या मैं सुरक्षित रूप से मान सकता हूं कि यह परिणामों को बहुत अधिक प्रभावित नहीं करेगा?

यह R में एक उदाहरण है। मेरे असली डेटासेट में लगभग 34.000 माप हैं, इसलिए स्केलबिलिटी एक समस्या है। यही कारण है कि मैं प्रत्येक महीने के भीतर ऑटोक्रेलेशन मॉडल करता हूं, अन्यथा गणना किसी भी अधिक संभव नहीं है। यह सबसे सही समाधान नहीं है, लेकिन सबसे सही एक संभव नहीं है।

set.seed(12)
require(mgcv)

Data <- data.frame(
    dates = seq(as.Date("2011-1-1"),as.Date("2011-12-31"),by="day")
)

Data <- within(Data,{
X <- abs(rnorm(nrow(Data),3))
Y <- 2*X + X^2 + scale(Data$dates)^2
month <- as.POSIXlt(dates)$mon+1
mday <- as.POSIXlt(dates)$mday
})

model <- gamm(Y~s(X)+s(as.numeric(dates)),correlation=corCAR1(form=~mday|month),data=Data)

preds <- predict(model$gam,se=T)

Total <- sum(preds$fit)

संपादित करें:

सीखने के लिए सबक: पहले पैनकेक करने से पहले सभी मदद फ़ाइलों में सभी नमूनों से गुजरें। मैंने भविष्यवाणियों की मदद फाइलों में।

#########################################################
## now get variance of sum of predictions using lpmatrix
#########################################################

Xp <- predict(b,newd,type="lpmatrix") 

## Xp %*% coef(b) yields vector of predictions

a <- rep(1,31)
Xs <- t(a) %*% Xp ## Xs %*% coef(b) gives sum of predictions
var.sum <- Xs %*% b$Vp %*% t(Xs)

जो मैं करना चाहता हूं उसके करीब लगता है। यह अभी भी मुझे नहीं बताता कि यह कैसे किया जाता है। मैं इस तथ्य के रूप में दूर हो सकता है कि यह रैखिक भविष्यवक्ता मैट्रिक्स पर आधारित है। किसी भी अंतर्दृष्टि का अभी भी स्वागत है।


6
var(iE[Xi])=aTvar(E[X])a
avar(E[X])E[X]=(E[X1],,E[Xn])T

@probabilityislogic मूल रूप से r प्रोग्राम कर रहा है। गणित के लिए Thx
जोरिस मेय्स

2
@probabilityislogic यदि आप उसे उत्तर में लपेट सकते हैं, तो आप मेरे +50 इनाम ले सकते हैं। ;)
ई-सुशी

E(Xi)=μii=1nVar(E[Xi])=0

@ user52220 यह वह जगह है जहाँ आप गलत हैं। E (Xi) अपेक्षित मूल्य है और इसलिए एक यादृच्छिक चर है, जबकि mu_i जनसंख्या का मतलब है और इसलिए एक निश्चित संख्या है। वार (म्यू) = 0, लेकिन वही ई (शी) के लिए सही नहीं है।
जोरिस मेय्स

जवाबों:


1

मैट्रिक्स नोटेशन में एक मिश्रित मॉडल के रूप में प्रतिनिधित्व किया जा सकता है

y = एक्स * बीटा + जेड * यू + एप्सिलॉन

जहां एक्स और जेड क्रमशः ज्ञात प्रभाव और यादृच्छिक प्रभाव टिप्पणियों से संबंधित डिजाइन मैट्रेस हैं।

मैं ऑटो-सहसंबंध को सही करने के लिए एक सरल और पर्याप्त (लेकिन सबसे अच्छा नहीं) परिवर्तन लागू करूंगा जिसमें पहले अवलोकन को खोना शामिल है, और एक छोटे से एक के साथ [y1, y2, ... yn] के कॉलम वेक्टर को बदलना है। अवलोकन कॉलम वेक्टर, अर्थात्: [y2 - rho * y1, y3 - rho * y2, ..., yn - rho * y (n-1)], जहाँ rho सीरियल ऑटो-सहसंबंध के लिए आपका अनुमानित मूल्य है।

इसे एक मैट्रिक्स T से गुणा करके, T * y का निर्माण किया जा सकता है, जहाँ T की पहली पंक्ति निम्नानुसार बनाई गई है: [-rho, 1, 0, 0, ....,], दूसरी पंक्ति: [0, -हो, 1, 0, 0, ...], आदि इसी तरह, अन्य डिज़ाइन मैट्रिसेस को T * X और T * Z में बदल दिया जाता है। इसके अलावा, त्रुटि की शर्तों के विचरण-सहसंयोजक मैट्रिक्स को भी बदल दिया जाता है, अब स्वतंत्र त्रुटि शर्तों के साथ।

अब, बस नए डिजाइन मैट्रेस के साथ समाधान की गणना करें।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.