मिश्रित प्रभाव वाले मॉडल की तुलना और सत्यापन कैसे किया जाना चाहिए?


22

आम तौर पर एक दूसरे के मुकाबले (रैखिक) मिश्रित प्रभाव वाले मॉडल कैसे होते हैं? मुझे पता है कि संभावना अनुपात परीक्षण का उपयोग किया जा सकता है, लेकिन यह काम नहीं करता है अगर एक मॉडल दूसरे सही का 'सबसेट' नहीं है?

क्या मॉडल df का अनुमान हमेशा सीधा होता है? निश्चित प्रभावों की संख्या + विचरण घटकों की संख्या का अनुमान है? क्या हम यादृच्छिक प्रभावों के अनुमानों की अनदेखी करते हैं?

सत्यापन के बारे में क्या? मेरा पहला विचार क्रॉस वेलिडेशन है, लेकिन रैंडम फोल्ड्स डेटा की संरचना को देखते हुए काम नहीं कर सकते हैं। क्या 'किसी एक विषय / समूह को छोड़ना' की पद्धति उपयुक्त है? एक अवलोकन को छोड़ने के बारे में क्या?

Mallows Cp को मॉडल भविष्यवाणी त्रुटि के अनुमान के रूप में व्याख्या किया जा सकता है। एआईसी के माध्यम से मॉडल का चयन भविष्यवाणी की त्रुटि को कम करने का प्रयास करता है (इसलिए सीपीएस और एआईसी को उसी मॉडल को चुनना चाहिए यदि त्रुटियां गॉसियन हैं मेरा मानना ​​है)। क्या इसका मतलब यह है कि भविष्यवाणी त्रुटि के संदर्भ में कुछ गैर-नेस्टेड मॉडल के संग्रह से 'इष्टतम' रैखिक मिश्रित प्रभाव मॉडल लेने के लिए AIC या Cp का उपयोग किया जा सकता है? (बशर्ते वे एक ही डेटा पर फिट हों) क्या BIC में अभी भी उम्मीदवारों के बीच 'सही' मॉडल चुनने की संभावना है?

मैं इस धारणा के भी अधीन हूं कि जब एआईसी या बीआईसी के माध्यम से मिश्रित प्रभाव वाले मॉडल की तुलना करते हैं तो हम केवल गणना में निर्धारित प्रभाव को 'पैरामीटर' के रूप में आंकते हैं, वास्तविक मॉडल डीएफ को नहीं।

क्या इन विषयों पर कोई अच्छा साहित्य है? क्या यह cAIC या mAIC की जाँच के लायक है? क्या उनके पास एआईसी के बाहर विशिष्ट आवेदन है?


2
CAIC या mAIC "AIC के बाहर" के आवेदन से आपका क्या अभिप्राय है? DIC एक व्यापक रूप से उपयोग की जाने वाली भविष्यवाणी की सटीकता है, जिसकी आप जांच कर सकते हैं, जो कि बहुस्तरीय मॉडल में शामिल मापदंडों के "प्रभावी" संख्या द्वारा दंडित करने की कोशिश करता है।
अतिथि

@ सबसे अच्छा मेरा मतलब है, क्या उनके पास विशिष्ट उपयोग है, विशेष प्रकार के मॉडल के लिए कहें? मैं डीआईसी की जांच करूंगा। धन्यवाद।
dcl

जवाबों:


12

मिश्रित मॉडल में मॉडल चयन पर मुख्य समस्या एक मॉडल की स्वतंत्रता (डीएफ) की डिग्री को सही मायने में परिभाषित करना है। मिश्रित मॉडल के डीएफ की गणना करने के लिए, किसी को निश्चित और यादृच्छिक प्रभावों सहित अनुमानित मापदंडों की संख्या को परिभाषित करना होगा। और यह सीधा नहीं है। जिमिंग जियांग और अन्य (2008) द्वारा "मिश्रित मॉडल चयन के लिए बाड़ के तरीके" शीर्षक वाले इस पत्र को ऐसी स्थितियों में लागू किया जा सकता है। एक नया संबंधित काम यह है एक Greven, एस एंड Kneib, टी (2010) द्वारा हकदार "रैखिक मिश्रित मॉडल में सीमांत और सशर्त AIC के व्यवहार पर"। आशा है कि यह मददगार हो सकता है।


मैं उन कागजों की जांच करूंगा। चीयर्स।
dcl

6

मॉडल की तुलना करने का एक तरीका (चाहे मिश्रित या अन्यथा) परिणामों की साजिश करना है। मान लीजिए कि आपने मॉडल ए और मॉडल बी; प्रत्येक से फिट मूल्यों का उत्पादन और एक बिखरे हुए भूखंड में एक दूसरे के खिलाफ उन्हें रेखांकन। यदि मान बहुत समान हैं (अपने निर्णय का उपयोग करते हुए कि वे हैं) तो सरल मॉडल चुनें। एक अन्य विचार यह है कि फिट किए गए मूल्यों और ग्राफ के बीच अंतर को खोजने के लिए स्वतंत्र मूल्यों के खिलाफ इन; आप मतभेदों का घनत्व प्लॉट भी कर सकते हैं। सामान्य तौर पर, मैं मॉडल की तुलना करने के लिए सांख्यिकीय परीक्षणों का उपयोग नहीं करने का एक प्रस्तावक हूं (हालांकि एआईसी और इसके वेरिएंट में निश्चित रूप से गुण हैं) बल्कि निर्णय का उपयोग करते हुए। बेशक, इसका सटीक उत्तर न देने का (डिस) लाभ है।


आप जो वर्णन कर रहे हैं, बस मॉडल की तुलना करना है जब मुख्य उद्देश्य उनकी भविष्य कहनेवाला क्षमता है। इसके अलावा, ग्राफिकल परिणाम एक गाइड करने के लिए बहुत जानकारीपूर्ण हो सकते हैं कि कौन से मॉडल उपयोगी हो सकते हैं, लेकिन, आम तौर पर, वे पूरी तरह से औपचारिक वैज्ञानिक परिणाम नहीं हैं।
५:५५ बजे हगिभानि

2
हाय @ हगबिशानी; मैं सिर्फ टके को उद्धृत करूंगा "गलत प्रश्न के सटीक उत्तर की तुलना में अक्सर सही प्रश्न का बेहतर उत्तर, जो अक्सर अस्पष्ट होता है, जिसे हमेशा सटीक बनाया जा सकता है।" :-)। यह पूरी तरह से अनुरूप यहाँ नहीं है, लेकिन यह कम से कम आंशिक रूप से निशाने पर है
फिर से बहाल करते मोनिका - पीटर Flom

1
मैं आमतौर पर ऐसे प्लॉट करता हूं जैसे आप मॉडल बनाते समय वर्णन करते हैं। लेकिन मैं वास्तव में एक अधिक 'गणितीय' पद्धति की तलाश में था। चीयर्स
DCL

यदि पूर्वानुमानात्मक प्रदर्शन के आधार पर विभिन्न मॉडलों की तुलना की जाती है, तो मेरी समझ यह है कि यादृच्छिक प्रभावों के साथ और बिना मिश्रित मॉडल के लिए अनुमानित मूल्य समान होना चाहिए (यानी, प्रतिगमन गुणांक बिना यादृच्छिक प्रभाव वाले मॉडल में निष्पक्ष होंगे, केवल मानक त्रुटियां बदल जाती हैं)।
राबर्टएफ
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.