क्या मैंने अपने मॉडल को सही ढंग से lmer में निर्दिष्ट किया है?


26

मैंने बहुत सारी सहायता साइटें देखी हैं और मैं अभी भी उलझन में हूँ कि मिश्रित मॉडल में अधिक जटिल नेस्टेड शब्दों को कैसे निर्दिष्ट किया जाए। मैं भी के उपयोग के रूप में भ्रमित कर रहा हूँ :और /और |बातचीत को निर्दिष्ट और का उपयोग कर यादृच्छिक कारकों के साथ घोंसले में lmer()में lme4में पैकेज R

इस प्रश्न के उद्देश्य के लिए, मान लें कि मैंने अपने डेटा को इस मानक सांख्यिकीय मॉडल के साथ सटीक रूप से चित्रित किया है: तय है, और यादृच्छिक हैं। (निहितार्थ) भीतर निहित है ।

Yमैंjकश्मीर=यू+स्टेशनमैं+रस्साj(मैं)+दिनकश्मीर+(स्टेशन×दिन)मैंकश्मीर+(रस्सा×दिन)j(मैं)कश्मीर
stationtowdayTowstation

दूसरे शब्दों में, मुझे उम्मीद है कि मेरे मॉडल में स्टेशन (i, फिक्स्ड), टो (j, यादृच्छिक, स्टेशन के भीतर निहित नेस्टेड), दिन (k, यादृच्छिक), और टो और डे के बीच बातचीत, और डे के बीच की बातचीत शामिल है। और स्टेशन। मैंने अपना मॉडल बनाने के लिए एक सांख्यिकीविद् के साथ परामर्श किया है और इस समय यह विश्वास करता हूं कि यह मेरे डेटा का प्रतिनिधि होगा, लेकिन उन लोगों के लिए अपने डेटा का विवरण भी जोड़ूंगा, जो मेरी पोस्ट के नीचे रुचि रखते हैं ताकि अव्यवस्था न हो।

अब तक जो मैं एक साथ करने में सक्षम था वह निम्नलिखित है lmer:

lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day), 
     data=my.data)

क्या यह मेरे सांख्यिकीय मॉडल का सटीक चित्रण करता है? यदि यह सही ढंग से नहीं पढ़ता है तो मेरे कोड को बेहतर बनाने के लिए कोई सुझाव?

मैंने उन विशिष्ट शब्दों को बोल्ड किया है, जिन्हें मुझे अपने lmer सूत्र में निर्दिष्ट करने में कठिनाई हो रही है

# 1। टो स्टेशन के भीतर नेस्टेड जब टो यादृच्छिक है और स्टेशन तय हो गया है
तो मैं उलझन में हूं, हालांकि नेस्टेड और इंटरैक्शन शर्तों के बीच अंतर करने के बारे में है जो यादृच्छिक उपयोग कर रहे हैं :और /। मेरे उपरोक्त उदाहरण में, मेरे पास (1|station:tow)है जिसमें मुझे उम्मीद है कि स्टेशन के भीतर टो नेस्टेड पढ़ता है। मैंने विभिन्न साइटों पर परस्पर विरोधी टिप्पणियां पढ़ी हैं या नहीं, जिनका मैं उपयोग :कर रहा हूँ या नहीं /, इसके यादृच्छिक (1|...)प्रारूप के भीतर lmer

# 2। स्टेशन और दिन के बीच की बातचीत जब स्टेशन तय होता है और दिन यादृच्छिक होता है
तब मेरे पास होता है (1|station:day)लेकिन इस बार मैं उम्मीद कर रहा हूं कि यह स्टेशन और दिन के बीच की बातचीत को पढ़ता है। ऐसा लगता है कि मैं स्टेशन और दिन के स्टेशन और दिन के साथ-साथ उनके इंटरैक्शन के लिए खाते के लिए स्टेशन * दिन का उपयोग कर सकता हूं (बजाय ऊपर दिए गए तीन शब्दों में से प्रत्येक को शामिल करने के बजाय), लेकिन मैं यह नहीं बताता कि इसे कैसे निर्दिष्ट करें जब एक तय हो जाता है और दूसरा यादृच्छिक होता है। चाहेंगे station*(1|day)कि क्या ज़रूरत है?

# 3। टो और दिन (दोनों यादृच्छिक) के बीच की बातचीत जब टो स्टेशन (निश्चित) में नेस्टेड होती है , तो अंत में, मेरे पास (1|tow:day)उम्मीद है कि मैं towऔर इंटरएक्शन पढ़ता हूं day, लेकिन मैं सोच रहा हूं कि क्या मुझे फिर से निर्दिष्ट करने की आवश्यकता है कि टो नेस्टेड है (संक्षेप में) स्टेशन में?

मैं दोनों सांख्यिकीय और मॉडलिंग के लिए नया हूं Rऔर lmerयदि संभव हो तो मेरे सवालों के जवाब में पूरी तरह से स्पष्टीकरण की परेशानी की सराहना करता हूं।

मेरे डेटा पर अधिक विवरण: मैं पूछ रहा हूं कि क्या समतल समुद्र में एक भौतिक मोर्चे पर प्लवक की सांद्रता बदलती है। मेरे पास इस मोर्चे के तीन स्टेशन, इंशोर और भीतर हैं। स्टेशन इस प्रकार तय किया गया है। प्रत्येक स्टेशन पर, मैं तीन प्रतिकृति प्लवक टावर्स लेता हूं (जिससे मैं सॉर्ट करता हूं, गिनता हूं, और पानी के मीटर प्रति # कीड़े के संदर्भ में एक एकाग्रता प्राप्त करता हूं)। टो यादृच्छिक है: तीन टावों में मुझे उस विशेष स्टेशन पर प्लवक में सामान्य परिवर्तनशीलता के लिए खाते की उम्मीद है। टो को आंतरिक रूप से स्टेशन में घोंसला बनाया गया है क्योंकि प्रत्येक टो में एक अद्वितीय आईडी नहीं है (123,123,123 प्रत्येक स्टेशन पर टो के लिए आईडी है)। फिर मैंने एक नए मोर्चे के साथ कई, स्वतंत्र दिनों में ऐसा किया था। मुझे लगता है कि मैं डे को एक अवरुद्ध कारक के रूप में सोच सकता हूं? कई यादृच्छिक फ्रंट दिनों में इसे दोहराने के रूप में दिन यादृच्छिक है, दिन-प्रतिदिन परिवर्तनशीलता को पकड़ने और उन सभी दिनों के प्रतिनिधि होने का प्रयास कर रहा है जहां यह मोर्चा मौजूद है। मैं बातचीत की शर्तों के बारे में जानना चाहता हूं कि क्या दिन-प्रतिदिन परिवर्तनशीलता में परिवर्तन होता है और क्या स्टेशन हमेशा समान डेटा प्राप्त करते हैं या क्या यह दिन पर निर्भर करता है?

फिर से, आपके समय और मदद के लिए धन्यवाद, मैं इसकी सराहना करता हूं!


मुझे विश्वास है कि आप कुछ मानक याद कर रहे हैं (यदि मैं गलत था तो मैं उन्हें जोड़ना नहीं चाहता था) आपके मानक सांख्यिकीय मॉडल पर।

1
एफडब्ल्यूआईडब्ल्यू, जो भी इस धागे के पार आता है और इस विषय पर आश्चर्य करता है कि क्या यह विषय पर है, इसे देखते हुए Rसिंटैक्स, आईएमओ पर ध्यान केंद्रित किया गया है , यह पर्याप्त रूप से सांख्यिकीय है (यह समझना कि मॉडल निर्दिष्ट घोंसले के शिकार और बातचीत आदि से संबंधित कैसे है) विषय पर सीवी के लिए।
गूँज - मोनिका

1
यह मेरी राय में विषय पर 100% है।


2
आपके के अनुसार lmer()वाक्य रचना, आप एक मॉडल जहां की एक निश्चित प्रभाव है निर्दिष्ट किया है stationऔर चार यादृच्छिक अवरोध, का एक ही (1) संयोजन के साथ व्यक्तियों द्वारा साझा stationऔर tow, (2) मूल्य Day, (3) के संयोजन stationऔर dayऔर ( 4) के संयोजन towऔर day, क्रमशः। क्या आपका यही इरादा है? मुझे यकीन नहीं है क्योंकि, जैसा कि @BekekP द्वारा इंगित किया गया है, आपने कैसे लिखा है कि आपका मॉडल तैयार करना स्पष्ट नहीं है। आपने चर नाम लिखे हैं, पैरामीटर नहीं। आमतौर पर, इस तरह के एक मॉडल में, चर संयोजनों को सब्सक्राइबर्स द्वारा कब्जा कर लिया जाता है।
मैक्रो

जवाबों:


23

जब स्टेशन रैंडम हो और स्टेशन को ठीक किया जाए तो स्टेशन के भीतर टो नेस्टेड

station+(1|station:tow)सही है। जैसा कि @ जॉन ने अपने जवाब में कहा, (टो और स्टेशन के बीच स्टेशन प्लस इंटरेक्शन का मुख्य प्रभाव) तक (1|station/tow)विस्तार करेगा (1|station)+(1|station:tow), जो आप नहीं चाहते हैं क्योंकि आपने पहले से ही स्टेशन को एक निश्चित प्रभाव के रूप में निर्दिष्ट किया है।

स्टेशन और दिन के बीच बातचीत जब स्टेशन तय हो जाता है और दिन यादृच्छिक होता है।

एक निश्चित और एक यादृच्छिक प्रभाव के बीच बातचीत हमेशा यादृच्छिक होती है। जैसा कि @ जॉन ने कहा, फिर station*dayसे station+day+station:day, जो आप (फिर से) नहीं चाहते हैं, क्योंकि आप dayअपने मॉडल में पहले ही निर्दिष्ट कर चुके हैं । मुझे नहीं लगता कि ऐसा करने का एक तरीका है जो आप चाहते हैं और day(यादृच्छिक) और station(निश्चित) के पार प्रभाव को ध्वस्त कर सकते हैं, लेकिन अगर आप लिखना चाहते थे station+(1|day/station), जो पिछले उत्तर में निर्दिष्ट है, तो इसका विस्तार होगा station + (1|day) + (1|day:station)

टो और स्टेशन के बीच दिन के समय बातचीत होती है

क्योंकि आप की अनन्य मानों की जरूरत नहीं है towचर (यानी के रूप में आप कहते हैं कि नीचे tows निर्दिष्ट कर रहे हैं के रूप में क्योंकि 1, 2, 3हर स्टेशन पर, आप कर के रूप में, घोंसले को निर्दिष्ट करने की जरूरत है (1|station:tow:day)। यदि आप tows विशिष्ट निर्दिष्ट किया, या तो आप इस्तेमाल कर सकते हैं (1|tow:day)या (1|station:tow:day)(उन्हें बराबर जवाब देना चाहिए)। यदि आप इस मामले में नेस्टिंग निर्दिष्ट नहीं करते हैं, तो lme4सभी स्टेशनों पर रैंड # 1 द्वारा साझा किए गए यादृच्छिक प्रभाव का अनुमान लगाने की कोशिश करेंगे ...

station:tow:day××

क्या http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#model-specification और http://bbolker.github.io/mixedmodels.misc/glmmFAQ.html#nested-or-crossed आपके लिए उपयोगी है?


सहायक उत्तर और संदर्भ के लिए बहुत बहुत धन्यवाद, वे बहुत सराहना करते हैं। ऊपर बताए अनुसार मैं संकेतन (1 | a: b) के बारे में उलझन में हूँ, जहाँ यह प्रतीत होता है कि ':' का अर्थ "नेस्टेड" के साथ-साथ एक बातचीत भी हो सकता है। यह दोनों कैसे निर्दिष्ट कर सकते हैं? दूसरे शब्दों में, यह कैसे पता चलता है कि आप किस रिश्ते को इंगित कर रहे हैं? मुझे यहां कुछ बुनियादी याद आ रही है, मैं माफी चाहता हूं।
wtree

4
इस संदर्भ में, बातचीत और घोंसले के बीच इतना अंतर नहीं है। इसमें Bनेस्टेड है Aया सिर्फ इसके साथ इंटरैक्ट करता है, यह इस बात पर निर्भर करता है कि Aमॉडल का मुख्य प्रभाव इसमें शामिल है या नहीं। यदि का मुख्य प्रभाव Bहै भी मॉडल तो में यह पार है ...
बेन Bolker

हाय सब, मैंने यहां एक संबंधित प्रश्न पूछा: आँकड़ें ।stackexchange.com / questions / 272377/… अगर किसी को (विशेष रूप से @BenBolker) को देखने और जवाब देने का मौका मिला है।
जोशुआ रोसेनबर्ग

11

सूत्र में कुछ चीजें थोड़ी भ्रमित करने वाली हैं। :जबकि दो शब्दों के बीच बातचीत के लिए है *मुख्य प्रभाव और बातचीत के लिए है। /बातचीत के लिए एक और एक है लेकिन क्या यह करता अंश और शर्तों के सभी विभाजक (जैसे में के बीच एक बातचीत उत्पन्न है A/(B+C) = A:B + A:C)। |की तरह "के आधार पर वर्गीकृत" कुछ के लिए है। इसलिए, 1|stationस्टेशन के आधार पर और इसे कोष्ठक में वर्गीकृत किया जाएगा (1|station)। इस तरह आप घोंसले का शिकार करेंगे।

उम्मीद है कि मदद मिलेगी। यह एक यादृच्छिक प्रभाव है एक निश्चित प्रभाव के भीतर नेस्टेड करने के लिए थोड़ा अजीब है और मुझे यकीन नहीं है कि आप इसका प्रतिनिधित्व कैसे करेंगे। मैं स्थिति की कल्पना भी नहीं कर सकता। आपको बेहतर प्रतिक्रिया मिल सकती है यदि आप समझाते हैं कि आपके चर क्या हैं और आप क्या हासिल करना चाहते हैं। बहुत बार लोग सवाल पूछते हैं और शब्दावली का गलत उपयोग कर रहे हैं और यह संवाद करना कठिन है। बताएं कि चर क्या दर्शाते हैं और आप उनके बारे में क्या जानना चाहते हैं।

अपने अंतिम पैराग्राफ में अपने विवरण पर ध्यान केंद्रित करना ऐसा लगता है जैसे आपका टो आपके द्वारा एकत्रित किए गए नमूनों का एक संकेतक है और कुछ ऐसा नहीं है जिसे आपको इस अर्थ में अनुमानों की आवश्यकता है कि आप टो 1 की उम्मीद करते हैं कि आप किसी तरह से टो 2 से लगातार अलग रहें। टो सिर्फ एक नमूने का संकेत दे रहा है। जब तक आप वास्तव में विश्वास नहीं करते हैं कि टावरों का क्रम मायने रखता है तो आप उस चर के साथ भी परेशान नहीं होते हैं। और अगर वे मायने रखते हैं तो यह एक निश्चित प्रभाव है (और शायद यादृच्छिक, लेकिन पूरी तरह से यादृच्छिक प्रभाव नहीं)। आप कहते हैं कि आप जानना चाहते हैं कि क्या टावर्स दिन-प्रतिदिन परिवर्तनशीलता में बदलते हैं। उत्तर के बारे में कैसे हाँ है? यह यथार्थवादी संभावना के दायरे में नहीं है कि वे दिन-प्रतिदिन बदलती नहीं हैं। यह केवल आपके उपायों का प्रसरण है। आप' फिर से विचरण के हर नमूने के लिए प्रयास करने की अनुमति नहीं है क्योंकि तब आप त्रुटि के लिए बचे हुए किसी भी विचरण को नहीं रोकते हैं। आपके पास एक ओवर-निर्दिष्ट मॉडल होगा। आप प्रत्येक उपाय की रिपोर्टिंग के बिंदु पर होंगे।

यदि स्टेशन दिन-प्रतिदिन बदलता रहता है, तो आप सोच के बारे में एक जैसा बयान देते हैं; बिलकुल यह करता है। लेकिन शायद आप विशिष्ट दिनों का मतलब है? क्या मौसम, चंद्र चक्र, आदि द्वारा किसी दिन समूह बनाए गए थे? जब तक आपके पास कुछ और नहीं है तब तक यह दिन 1 है, यह दिन 2 है, आदि। कैसे पता चलता है कि स्टेशन दिन-प्रतिदिन बदलते रहते हैं, आपको स्टेशनों के अलावा कुछ भी अलग-अलग बताता है? तो उस सवाल का जवाब है, बेशक स्टेशनों के दिन अलग-अलग होते हैं। और निश्चित रूप से टो दिन-प्रतिदिन और स्टेशन से स्टेशन तक भिन्न होते हैं। आप एक साधारण मॉडल के साथ छोड़ दिया है:

aov(y ~ station, data = dat)

एक निश्चित प्रभाव जो आपके यहाँ है, स्टेशन है, बस कई टावरों और कई दिनों में नमूना है। मुझे यकीन नहीं है कि आपको वास्तव में यहां बहु-स्तरीय मॉडलिंग की आवश्यकता है। ऐसा लगता है कि आप अपने मॉडल को ओवर-निर्दिष्ट कर रहे हैं।

यदि आप वास्तव में यादृच्छिक दिन और टो प्रभाव चाहते हैं और ऐसी जानकारी है जिसे आपने यहां निर्दिष्ट नहीं किया है तो आप इसे एक बहु-स्तरीय मॉडल तक विस्तारित कर सकते हैं। यह होगा:

lmer(y ~ station + (two*day|station), data = dat)

हालांकि उस मॉडल का उपयोग करने के लिए आपको प्रत्येक स्टेशन और दिन में कई टावरों की आवश्यकता होती है।


मैं आपके द्वारा कही गई हर बात से सहमत हूं लेकिन मुझे लगता है कि यह एक उत्तर की तुलना में शायद अधिक टिप्पणी है।
मैक्रो

@ जॉन मैं आपके साथ तब तक था जब तक कि "आप कैसे नेस्टिंग करते।" मुझे लगता है कि आप कैसे नेस्टिंग करते हैं इसका वास्तविक बिंदु याद आया। क्या आप और अधिक विस्तार से समझाने के लिए तैयार होंगे? मुझे लगता है कि मैं अभी भी उलझन में हूँ | और इसमें और अधिक देखेंगे। लेकिन आपकी प्रतिक्रिया से, मुझे अभी भी यकीन नहीं है कि कैसे, उदाहरण के लिए, इंगित करें कि स्टेशन (निश्चित) के भीतर टो (यादृच्छिक) नेस्टेड है?
wtree

@ जॉन ओह और स्टेशन को महासागर और टो में रुचि के स्थान / स्थान के रूप में तय किया गया है क्योंकि मैं इन साइटों पर प्लैंकटन टॉव ले रहा हूं जो कि यादृच्छिक हैं जिसमें वे प्रत्येक साइट पर प्लवक में परिवर्तनशीलता के लिए खाते का प्रयास कर रहे हैं और फिर एक्सट्रपलेटेड हैं। एक स्टेशन पर प्लवक की आबादी का प्रतिनिधित्व करने के लिए।
wtree

1
नमूने का प्रत्येक लेबल एक यादृच्छिक चर नहीं है, संपादन देखें।
जॉन

1
मुझे अभी भी लगता है कि टो को उस विवरण को देखते हुए मॉडल में नहीं होना चाहिए। हालांकि दिन अच्छा लगता है।
जॉन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.