क्या कोई रैखिक बनाम अरेखीय मिश्रित प्रभाव पर प्रकाश डाल सकता है?


14

मैं आर सीखने में गोता लगाने वाला हूं और मेरा लर्निंग प्रोजेक्ट भविष्यवाणियों को विकसित करने के लिए एक डेटासेट में मिश्रित- या रैंडम-इफेक्ट रिग्रेशन लागू करने की कोशिश करेगा। मैं इस पोस्ट में लेखक की चिंता को साझा करता हूं कि मिश्रित प्रभाव वाले मॉडल के लिए nlme या lme4 R लाइब्रेरी का चयन कैसे करें? यह सोचकर कि क्या NLME या LME4 अपने आप को परिचित करने के लिए बेहतर पैकेज है। एक और बुनियादी सवाल यह है: रैखिक और nonlinear मिश्रित प्रभाव मॉडलिंग के बीच क्या अंतर है?

बैकग्राउंड के लिए, मैंने अपने MS रिसर्च (MATLAB में, R नहीं) में ME मॉडलिंग लागू की, इसलिए मैं तय किया गया कि कैसे यादृच्छिक बनाम व्यवहार किया जाता है। लेकिन मैं अनिश्चित हूं कि क्या मैंने जो काम किया था उसे रैखिक या nonlinear ME माना जाता था। क्या यह बस इस्तेमाल किए गए समीकरण का कार्यात्मक रूप है, या कुछ और है?


जरूरत पड़ने पर मैं अपने एमएस थीसिस में किए गए काम के बारे में विस्तार से बता सकता हूं।
केविन

जवाबों:


17

रैखिक और nonlinear प्रतिगमन मॉडल के बीच कई अंतर हैं, लेकिन प्राथमिक गणितीय एक यह है कि रैखिक मॉडल मापदंडों में रैखिक होते हैं, जबकि गैर-रेखीय मॉडल मापदंडों में nonlinear होते हैं। पिनहेइरो और बेट्स (2000, पीपी। 284-285), nlmeआर पैकेज के लेखक, ने सुरुचिपूर्ण ढंग से मॉडल चयन में अधिक महत्वपूर्ण विचारों का वर्णन किया:

एक प्रतिगमन मॉडल का चयन करने के तरीके का वर्णन करने के लिए कि कैसे एक प्रतिक्रिया चर सहसंयोजकों के साथ बदलता रहता है, हमेशा एक मॉडल का उपयोग करने का विकल्प होता है, जैसे बहुपद मॉडल, जो मापदंडों में रैखिक होते हैं। एक बहुपद मॉडल के क्रम में वृद्धि करके, कोई भी डेटा के देखे गए सीमा के भीतर सच, आमतौर पर नॉनलाइन, प्रतिगमन फ़ंक्शन के लिए सटीक सटीक अनुमान प्राप्त कर सकता है। ये अनुभवजन्य मॉडल केवल प्रतिक्रिया और सहसंयोजकों के बीच देखे गए संबंधों पर आधारित होते हैं और डेटा को बनाने वाले अंतर्निहित तंत्र के बारे में कोई सैद्धांतिक विचार शामिल नहीं करते हैं। दूसरी ओर, नॉनलाइनियर मॉडल प्रायः यंत्रवत होते हैं, अर्थात प्रतिक्रिया उत्पन्न करने वाले तंत्र के लिए एक मॉडल पर आधारित होते हैं। नतीजतन, एक गैर-मॉडल मॉडल में मॉडल पैरामीटर आमतौर पर एक प्राकृतिक भौतिक व्याख्या है। अनुभवजन्य रूप से व्युत्पन्न होने पर भी, नॉनलाइनर मॉडल आमतौर पर डेटा की ज्ञात विशेषताओं, जैसे कि स्पर्शोन्मुखता और एकरूपता को शामिल करते हैं, और इन मामलों में, अर्ध-यंत्रवत मॉडल के रूप में माना जा सकता है। एक nonlinear मॉडल आम तौर पर एक प्रतियोगी रैखिक मॉडल की तुलना में कम मापदंडों का उपयोग करता है, जैसे कि एक बहुपद, डेटा का अधिक पारिश्रमिक विवरण देता है। Nonlinear मॉडल भी बहुपद मॉडल की तुलना में डेटा की देखी गई सीमा के बाहर प्रतिक्रिया चर के लिए अधिक विश्वसनीय भविष्यवाणियां प्रदान करते हैं। डेटा का अधिक पारिश्रमिक विवरण देना। Nonlinear मॉडल भी बहुपद मॉडल की तुलना में डेटा की देखी गई सीमा के बाहर प्रतिक्रिया चर के लिए अधिक विश्वसनीय भविष्यवाणियां प्रदान करते हैं। डेटा का अधिक पारिश्रमिक विवरण देना। Nonlinear मॉडल भी बहुपद मॉडल की तुलना में डेटा की देखी गई सीमा के बाहर प्रतिक्रिया चर के लिए अधिक विश्वसनीय भविष्यवाणियां प्रदान करते हैं।

Nlme और lme4 संकुल के बीच कुछ बड़े अंतर भी हैं जो रैखिकता के मुद्दे से परे हैं। उदाहरण के लिए, लक्सम का उपयोग करके आप रैखिक या गैर-मॉडल मॉडल फिट कर सकते हैं और, किसी भी प्रकार के लिए, समूह की त्रुटियों के लिए विचरण और सहसंबंध संरचनाओं को निर्दिष्ट करें (जैसे, स्वैच्छिक); lme4 ऐसा नहीं कर सकता। इसके अलावा, यादृच्छिक प्रभावों को या तो पैकेज में तय किया जा सकता है या पार किया जा सकता है, लेकिन यह बहुत आसान है (और अधिक कम्प्यूटेशनल रूप से कुशल) निर्दिष्ट करने और lme4 में यादृच्छिक प्रभाव को पार करने के लिए।

मैं पहले सलाह देता हूं कि a) क्या आपको एक नॉनलाइन मॉडल की आवश्यकता होगी, और b) कि क्या आपको या तो ग्रुप-वर्जन या सहसंबंध संरचनाओं को निर्दिष्ट करने की आवश्यकता होगी। यदि इनमें से कोई भी उत्तर हाँ है, तो आपको nlme का उपयोग करना होगा (यह देखते हुए कि आप R के साथ चिपके हुए हैं)। यदि आप रैखिक मॉडल के साथ बहुत काम करते हैं जो यादृच्छिक प्रभावों को पार कर चुके हैं, या नेस्टेड और यादृच्छिक प्रभावों के जटिल संयोजन हैं, तो lme4 शायद एक बेहतर विकल्प है। आपको दोनों पैकेजों का उपयोग करना सीखना होगा। मैंने पहले lme4 सीखा और फिर महसूस किया कि मुझे nlme का उपयोग करना था क्योंकि मैं लगभग हमेशा ऑटोरेग्रेसिव एरर स्ट्रक्चर्स के साथ काम करता हूं। हालांकि, मैं अभी भी lme4 पसंद करता हूं जब मैं पार किए गए कारकों के प्रयोगों से डेटा का विश्लेषण करता हूं। अच्छी खबर यह है कि lme4 के बारे में मैंने जो कुछ भी सीखा है उसका एक बड़ा सौदा अच्छी तरह से स्मोमी में स्थानांतरित हो गया है। किसी भी तरह से,

संदर्भ

पिनहेइरो, जेसी, और बेट्स, डीएम (2000)। एस और एस-प्लस में मिश्रित-प्रभाव मॉडल । न्यूयॉर्क: स्प्रिंगर-वर्लग।


यह एक उत्कृष्ट प्रतिक्रिया है; विस्तार के लिए बहुत-बहुत धन्यवाद। मुझे आज उस पुस्तक के लिए एक और संदर्भ मिला है, और मैं निश्चित रूप से अब इसे नीचे ट्रैक करूंगा कि मुझे पता है कि मुझे एनएलएमई की आवश्यकता होगी।
केविन

बढ़िया रिस्पांस! पिनहेइरो और बेट्स के आपके स्निपेट ने मुझे आश्वस्त किया है कि मेरे पास आज शाम को लाइब्रेरी से हड़पने के लिए एक पुस्तक है ...
सिद्धांतविज्ञानी

1

लीनियर- नॉनलाइनर भाग के लिए, देखें: इस विषय पर क्रॉसविलेयड लेख , विशेष रूप से चार्ली द्वारा दूसरे स्थान पर दिया गया उत्तर। मुझे नहीं लगता कि मिश्रित प्रभावों से निपटने पर कोई बदलाव होता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.