भविष्यवाणी के लिए lmer का उपयोग करना


18

नमस्कार मुझे दो समस्याएं हैं जो बहुस्तरीय / मिश्रित मॉडल के लिए प्राकृतिक उम्मीदवारों की तरह लगती हैं, जिनका मैंने कभी उपयोग नहीं किया है। सरल, और एक है कि मैं एक परिचय के रूप में प्रयास करने की उम्मीद है, इस प्रकार है: डेटा प्रपत्र की कई पंक्तियों की तरह दिखता है

x y innergroup outergroup

जहाँ x एक संख्यात्मक सहसंयोजक है, जिस पर मैं y (एक और संख्यात्मक चर) प्राप्त करना चाहता हूं, प्रत्येक y एक इनरग्रुप से संबंधित है, और प्रत्येक इनग्रुप एक नेगग्रुप (यानी, एक निश्चित इनरग्रुप में सभी y एक ही ऑर्गग्रुप से संबंधित है) । दुर्भाग्य से, इनरग्रुप में कई स्तर (कई हजारों) होते हैं, और प्रत्येक स्तर में अपेक्षाकृत कम अवलोकन होते हैं, इसलिए मुझे लगा कि इस तरह का मॉडल उपयुक्त हो सकता है। मेरे सवाल हैं

  1. मैं इस प्रकार का बहुस्तरीय सूत्र कैसे लिखूं?

  2. एक बार जब लमेर मॉडल फिट हो जाता है, तो कोई इससे कैसे भविष्यवाणी करता है? मैंने कुछ सरल खिलौना उदाहरण फिट किए हैं, लेकिन एक पूर्वानुमान () फ़ंक्शन नहीं मिला है। अधिकांश लोग इस तरह की तकनीक के साथ भविष्यवाणी की तुलना में अधिक रुचि रखते हैं। मेरे पास कई मिलियन पंक्तियाँ हैं, इसलिए गणना एक मुद्दा हो सकती है, लेकिन मैं हमेशा इसे उपयुक्त रूप से काट सकता हूं।

मुझे कुछ समय के लिए दूसरा करने की आवश्यकता नहीं होगी, लेकिन मैं इसके बारे में सोचना और इसके साथ खेलना शुरू कर सकता हूं। मेरे पास पहले जैसा ही डेटा है, लेकिन बिना x, और y अब फॉर्म एक द्विपदीय चर है । वाई इनग्रुप्स के भीतर भी बहुत से अतिप्रदर्शन को प्रदर्शित करता है। अधिकांश n 2 या 3 (या उससे कम) से अधिक नहीं हैं, इसलिए प्रत्येक y की सफलता दर का अनुमान लगाने के लिए मैं बीटा-द्विपद संकोचन अनुमानक ( α + k i ) / ( α + β + ) का उपयोग कर रहा हूं n मैं ) है, जहां(n,nk)nyi(α+ki)/(α+β+ni) और g का अनुमान MLE द्वारा प्रत्येक इनरग्रुप के लिए अलग-अलग किया जाता है। यह कुछ हद तक पर्याप्त है, लेकिन डेटा स्पार्सिटी अभी भी मुझे परेशान करती है, इसलिए मैं उपलब्ध सभी डेटा का उपयोग करना चाहूंगा। एक दृष्टिकोण से, यह समस्या आसान है क्योंकि कोई कोवरिएट नहीं है, लेकिन दूसरे से द्विपद प्रकृति इसे और अधिक कठिन बनाती है। क्या किसी के पास कोई उच्च (या निम्न) स्तर का मार्गदर्शन है?αβ


कृपया सत्यापित करें कि मैंने जिस संकोचन सूत्र में डाला है वह कोष्ठक हैं, जहाँ आप उन्हें बनाने का इरादा रखते हैं।
व्हीबेर

1
आपके प्रश्न का दूसरा भाग (बाइनरी चर के साथ) एक अलग प्रश्न नहीं होना चाहिए?
chl

जवाबों:


16

आर फॉर्मूलों का उपयोग करने वाले कारकों को रिश्तों को व्यक्त करना विल्किंसन की धारणा से आता है, जहां '*' क्रॉसिंग को दर्शाता है और '/' नेस्टिंग है, लेकिन मिश्रित-प्रभाव मॉडल, या अधिक सामान्यतः यादृच्छिक प्रभावों के लिए फार्मूला में कुछ विशिष्टताएं हैं, जिन्हें संभाला जाता है। उदाहरण के लिए, दो पार किए गए यादृच्छिक प्रभावों का प्रतिनिधित्व किया जा सकता है (1|x1)+(1|x2)। मैंने आपके वर्णन को नेस्टिंग के मामले के रूप में व्याख्यायित किया है, जैसे बहुत से वर्गों को स्कूलों में नेस्टेड (राज्यों में नेस्टेड, इत्यादि) किया जाता है, इसलिए एक मूल सूत्र lmerजैसा दिखेगा (जब तक कि अन्यथा नहीं कहा जाता है, एक gaussianपरिवार डिफ़ॉल्ट रूप से उपयोग किया जाता है):

y ~ x + (1|A:B) + (1|A)

जहां ए और बी क्रमशः आपके आंतरिक और बाहरी कारकों के अनुरूप हैं। बी को ए के भीतर नेस्टेड किया जाता है, और दोनों को यादृच्छिक कारकों के रूप में माना जाता है। पुराने nlme पैकेज में, यह कुछ इस तरह के अनुरूप होगा lme(y ~ x, random=~ 1 | A/B)। यदि ए को एक निश्चित कारक माना जाता था, तो सूत्र को पढ़ना चाहिए y ~ x + A + (1|A:B)

लेकिन यह lme4 पैकेज के लिए अधिक सटीक डी। बेट्स के विनिर्देशों की जांच करने के लायक है , उदाहरण के लिए उनकी आगामी पाठ्यपुस्तक में, lme4: R के साथ मिश्रित-प्रभाव मॉडलिंग , या एक ही वेबपेज पर उपलब्ध कई हैंडआउट। विशेष रूप से, फिटिंग रैखिक मिश्रित-प्रभाव मॉडल में ऐसे घोंसले के शिकार संबंधों के लिए एक उदाहरण है , आर में lme4 पैकेज । जॉन मेनडॉनल्ड्स ट्यूटोरियल एक अच्छा अवलोकन भी प्रदान करता है: आर के lme4 पैकेज के साथ एक मिश्रित मॉडल विश्लेषण का एनाटॉमी । अंत में, lme4 अनुकरण पर आर विगनेट की धारा 3 में एक नेस्टेड संरचना के विश्लेषण का एक उदाहरण शामिल है।

Lme4predict() में कोई फंक्शन नहीं है(यह फ़ंक्शन अब मौजूद है, नीचे टिप्पणी देखें), और आपको अनुमानित निश्चित (देखें ?fixef) और यादृच्छिक (देखें ?ranef) प्रभावों का उपयोग करके अपने आप को अनुमानित व्यक्तिगत मूल्यों की गणना करना होगा , लेकिन lme4 में भविष्यवाणी फ़ंक्शन की कमी पर इस धागे को भी देखें । आप mcmcsamp()फ़ंक्शन का उपयोग करके पीछे के वितरण से एक नमूना भी उत्पन्न कर सकते हैं । कभी-कभी, यह टकराव हो सकता है, हालांकि। देखें sig-मुझे अधिक अद्यतन जानकारी के लिए मेलिंग सूची।


3
अपडेट करने के लिए: lme4अब अंदर एक प्रेडिक्शन
Bar

: अब उपलब्ध predict.merMod यहाँ प्रलेखन rdocumentation.org/packages/lme4/versions/1.1-12/topics/...
DirtStats

10

ईज़ी पैकेज ezPredict () फ़ंक्शन, जो lmer मॉडल से भविष्यवाणियों जहां भविष्यवाणी केवल तय प्रभाव पर आधारित है प्राप्त होता है। यह वास्तव में सिर्फ एक आवरण है जिसके चारों ओर ग्लॉमी विकी में विस्तृत दृष्टिकोण है ।


5

मैं में "logit.mixed" समारोह का प्रयोग करेंगे Zelig , जो lime4 के लिए एक आवरण है और यह बहुत सुविधाजनक भविष्यवाणी और अनुकरण करने के लिए बनाता है।


लगता है कोई भविष्यवाणी () zelig में logit.mixed के लिए विधि है ..
nassimhddd

3

Lme4 के विकास संस्करण में एक अंतर्निहित पूर्वानुमान फ़ंक्शन (predict.merMod) है। यह https://github.com/lme4/lme4/ पर पाया जा सकता है ।

"Lme4 r-forge रिपॉजिटरी से लगभग अप-टू-डेट विकास बायनेरी" स्थापित करने के लिए कोड उपरोक्त पृष्ठ पर पाया जा सकता है और है:

install.packages("lme4", repos=c("http://lme4.r-forge.r-project.org/repos", getOption("repos")["CRAN"]))

1
ध्यान दें कि यह अब विकास संस्करण नहीं है, predictकुछ वर्षों से उपलब्ध है।
बेन बोलकर

1

स्टीफन राउडेनबुश की हैंडबुक इन मल्टीलेवल एनालिसिस की पुस्तक में एक अध्याय है " कई छोटे समूहों " । यदि आप केवल y पर x के प्रभावों में रुचि रखते हैं और उच्च स्तर के प्रभावों में कोई दिलचस्पी नहीं रखते हैं, तो उनका सुझाव बस एक निश्चित प्रभाव मॉडल (यानी सभी उच्च स्तर के समूहों के लिए एक डमी चर) का अनुमान लगाना है।

मुझे नहीं पता कि यह भविष्यवाणी के लिए कितना लागू है, लेकिन मुझे लगता है कि वह जो कुछ लिखता है वह उस पर लागू होता है जिसे आप पूरा करने की कोशिश कर रहे हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.