शुरू करने के लिए आपको समतुल्यता की अवधारणा को परिभाषित करना होगा । कोई सोच सकता है कि दो मॉडल समान हैं जब वे लगभग एक ही पूर्वानुमान सटीकता का उत्पादन करते हैं (यह समय श्रृंखला और पैनल डेटा के लिए प्रासंगिक होगा), एक और दिलचस्पी हो सकती है यदि मॉडल से फिट करीब हैं । पूर्व अलग-अलग क्रॉस-वैलिडेशन के लिए ऑब्जेक्ट है (जैक-चाकू आमतौर पर या कुछ आउट-ऑफ-सैंपल टेस्ट, रोब accuracy()इस अच्छी तरह से करते हैं), बाद वाले कुछ सूचना मानदंड के न्यूनतमकरण के लिए जाते हैं।
माइक्रोकैनोमेट्रिक्स में विकल्प , हालांकि आप पर भी विचार कर सकते हैं यदि आप छोटे नमूना आकारों के साथ काम कर रहे हैं। ध्यान दें, कि सूचना मानदंड को न्यूनतम करने पर आधारित विकल्प नेस्टेड मॉडल के लिए भी प्रासंगिक है।बी आईसीAIC
कैमरन और त्रिवेदी (अध्याय 8.5 तरीकों की उत्कृष्ट समीक्षा प्रदान करता है) द्वारा एक अच्छी चर्चा को इस पुस्तक में दिया गया है , और अधिक विशिष्ट सैद्धांतिक विवरण यहाँ हांग और प्रेस्टन में पाए जाते हैं ।
मोटे तौर पर, दो मॉडलों को अधिक पारसिमेंटस (अनुमान के लिए कम मापदंडों वाले, इसलिए स्वतंत्रता की अधिक डिग्री) से चुनने को बेहतर माना जाएगा। एक सूचना मानदंड एक विशेष दंड फ़ंक्शन का परिचय देता है जो अतिरिक्त व्याख्यात्मक चर को रेखीय मॉडल में शामिल करने के लिए वैचारिक रूप से समायोजित द्वारा शुरू की गई प्रतिबंधों के समान है ।R2
हालाँकि आप केवल उस मॉडल को चुनने में रुचि नहीं रख सकते हैं जो चयनित सूचना मानदंड को कम करता है। समतुल्यता अवधारणा का अर्थ है कि कुछ परीक्षण आँकड़ा तैयार किया जाना चाहिए। इसलिए आप संभावना अनुपात परीक्षण या तो कॉक्स या वोंग परीक्षण, डेविडसन- मैककिनोन परीक्षण कर सकते हैं। जेLRJ
अंत में, टैग के अनुसार, आप केवल Rकार्यों में रुचि रख सकते हैं :
library(lmtest)
coxtest(fit1, fit2)
jtest(fit1, fit2)
कहाँ fit1और fit2दो गैर नेस्टेड फिट रेखीय प्रतीपगमन मॉडल हैं, coxtestकॉक्स है परीक्षण, और डेविडसन-MacKinnon परीक्षण।जेLRjtestJ