शुरू करने के लिए आपको समतुल्यता की अवधारणा को परिभाषित करना होगा । कोई सोच सकता है कि दो मॉडल समान हैं जब वे लगभग एक ही पूर्वानुमान सटीकता का उत्पादन करते हैं (यह समय श्रृंखला और पैनल डेटा के लिए प्रासंगिक होगा), एक और दिलचस्पी हो सकती है यदि मॉडल से फिट करीब हैं । पूर्व अलग-अलग क्रॉस-वैलिडेशन के लिए ऑब्जेक्ट है (जैक-चाकू आमतौर पर या कुछ आउट-ऑफ-सैंपल टेस्ट, रोब accuracy()
इस अच्छी तरह से करते हैं), बाद वाले कुछ सूचना मानदंड के न्यूनतमकरण के लिए जाते हैं।
माइक्रोकैनोमेट्रिक्स में विकल्प , हालांकि आप पर भी विचार कर सकते हैं यदि आप छोटे नमूना आकारों के साथ काम कर रहे हैं। ध्यान दें, कि सूचना मानदंड को न्यूनतम करने पर आधारित विकल्प नेस्टेड मॉडल के लिए भी प्रासंगिक है।बी आईसीAIC
कैमरन और त्रिवेदी (अध्याय 8.5 तरीकों की उत्कृष्ट समीक्षा प्रदान करता है) द्वारा एक अच्छी चर्चा को इस पुस्तक में दिया गया है , और अधिक विशिष्ट सैद्धांतिक विवरण यहाँ हांग और प्रेस्टन में पाए जाते हैं ।
मोटे तौर पर, दो मॉडलों को अधिक पारसिमेंटस (अनुमान के लिए कम मापदंडों वाले, इसलिए स्वतंत्रता की अधिक डिग्री) से चुनने को बेहतर माना जाएगा। एक सूचना मानदंड एक विशेष दंड फ़ंक्शन का परिचय देता है जो अतिरिक्त व्याख्यात्मक चर को रेखीय मॉडल में शामिल करने के लिए वैचारिक रूप से समायोजित द्वारा शुरू की गई प्रतिबंधों के समान है ।R2
हालाँकि आप केवल उस मॉडल को चुनने में रुचि नहीं रख सकते हैं जो चयनित सूचना मानदंड को कम करता है। समतुल्यता अवधारणा का अर्थ है कि कुछ परीक्षण आँकड़ा तैयार किया जाना चाहिए। इसलिए आप संभावना अनुपात परीक्षण या तो कॉक्स या वोंग परीक्षण, डेविडसन- मैककिनोन परीक्षण कर सकते हैं। जेLRJ
अंत में, टैग के अनुसार, आप केवल R
कार्यों में रुचि रख सकते हैं :
library(lmtest)
coxtest(fit1, fit2)
jtest(fit1, fit2)
कहाँ fit1
और fit2
दो गैर नेस्टेड फिट रेखीय प्रतीपगमन मॉडल हैं, coxtest
कॉक्स है परीक्षण, और डेविडसन-MacKinnon परीक्षण।जेLRjtest
J