किसी विशेष नॉनलाइनर मॉडल के फिट होने का आकलन कैसे करें? [बन्द है]


10

मेरे पास एक nonlinear मॉडल है , जहां मानक सामान्य वितरण का cdf है और f nonlinear है (नीचे देखें)। मैं पैरामीटर के साथ इस मॉडल के फिट की अच्छाई का परीक्षण करना चाहते मेरे डेटा पर ( एक्स 1 , y 1 ) , ( एक्स 2 , y 2 ) , ... , ( एक्स एन , y n )y=Φ((एक्स,))+εΦ(एक्स1,y1),(एक्स2,y2),...,(एक्सn,yn), का पता लगाने के लिए अधिकतम संभावना अनुमान का उपयोग करने के बाद । एक उपयुक्त परीक्षा क्या होगी? मैं इस परीक्षण का उपयोग एक खराब फिट को लेबल करने के लिए करना चाहता हूं और यह निर्धारित करता हूं कि क्या अधिक डेटा एकत्र किया जाना चाहिए।

मैं विचलन, जो संतृप्त मॉडल के खिलाफ इस मॉडल तुलना का उपयोग कर, फिट की भलाई की अपनी इसी परीक्षण के साथ का उपयोग कर देखा है वितरण। क्या यह उचित होगा? मैंने भक्ति के बारे में जो कुछ पढ़ा है, वह ज्यादातर GLMs पर लागू होता है, जो कि मेरे पास नहीं है। यदि विचलन परीक्षण उचित है, तो परीक्षण को वैध बनाने के लिए किन धारणाओं को धारित करना आवश्यक है?χn-12

अपडेट: लिएx>1,a>0मामले में यह मदद करता है।=एक्स-1एक्स2+1एक्स>1,>0


1
उत्तर विश्लेषण के उद्देश्य और आपके द्वारा उपयोग किए गए अंतर्निहित प्रायिकता मॉडल पर निर्भर करता है; कोई अनूठा या सर्वश्रेष्ठ गणितीय उत्तर नहीं है। उदाहरण के लिए, हम फॉर्म y = के मॉडल के लिए अलग से फिट होने की अच्छाई को मापेंगे रूप से एक के लिए की तुलना में y = Φ ( ( एक्स , एक ) ) + ε (साथ iid त्रुटियाँ id )। y=Φ((एक्स,)+ε)y=Φ((एक्स,))+εε
whuber

धन्यवाद। मैंने अपना प्रश्न स्पष्ट कर दिया है। मुझे पता है कि कोई सबसे अच्छा जवाब नहीं है, हालांकि, मैं अभी भी जानना चाहूंगा कि क्या भलाई यहां परीक्षण के लिए उपयुक्त है, और यदि नहीं, तो एक और परीक्षण क्या है जो एक फिट के रूप में चिह्नित करने के लिए उपयुक्त होगा बहुत खराब और कहे जाने वाले डेटा को इकट्ठा करने की जरूरत है (यह मानते हुए कि मॉडल सही है) या यह कहते हुए कि मॉडल डेटा का वर्णन नहीं करता है।
बजे

1
अपने लक्ष्य चर रहा है y0,1 या यह निरंतर है? यदि पूर्व, तो आप के रूप में मॉडल फ्रेम सकता है के बजाय अतिरिक्त त्रुटि अवधि होने के, और वास्तविक के साथ भविष्यवाणी की तुलना y = 0 और y = 1 पाने के लिए सही और गलत सकारात्मक दर, या आधार रेखा मॉडल की तुलना करें जहां पी ( y =)पी(y=1)=Φ((एक्स,))y=0y=1पी(y=1)=y¯, या विचलन, या कई अन्य विकल्प। यदि उत्तरार्द्ध, आप अवशिष्ट के लिए क्या वितरण मान रहे हैं?
जुम्मन

1
बंद करने के लिए मतदान क्योंकि स्पष्टीकरण के लिए अनुरोध अनुत्तरित हो गया है।
व्हीबर

जवाबों:


1

यदि आप R प्लेटफ़ॉर्म का उपयोग कर रहे हैं तो लाइब्रेरी "NP" में "npcmstest" पैकेज का उपयोग करें। चेतावनी: फ़ंक्शन को आपके मॉडल का मूल्यांकन करने में कई मिनट लग सकते हैं।

आप प्रतिक्रिया वितरण और भविष्य कहनेवाला वितरण (यानी केएल विचलन, क्रॉस-एन्ट्रापी, आदि) की सूचना-सिद्धांत संबंधी तुलना पर भी विचार कर सकते हैं।


ऐसा लगता है कि विधि को lmया तो एक मॉडल की आवश्यकता है या glm। नॉनलाइन मॉडल के लिए यह कैसे काम करेगा? (हां, मैं आर का उपयोग कर रहा हूं।) मैंने जोड़ा है कि मेरे सवाल में क्या है जो मदद करता है।
spadequack

@ आप gam(या mgcvपैकेज) का उपयोग कर रहे हैं ? यदि नहीं, तो आपको इसकी जांच करनी चाहिए।
सूर्यास्तसू

1

यहां बताया गया है कि मैं इसे कैसे करूंगा, मूल रूप से संभावना अनुपात परीक्षण। लेकिन याद रखें कि वे फिट परीक्षण की अच्छाई को समझने के लिए "कुंजी" हैं, उन विकल्पों के वर्ग को समझने के लिए जिन्हें आप परीक्षण कर रहे हैं। अब हमारे पास प्रत्येक व्यक्तिगत डेटा बिंदु के लिए संभावना है:

पी(yमैं|एक्समैं,,मैं)=जी(εमैं)=जी(yमैं-मैं)

कहाँ अपने मॉडल में त्रुटि अवधि की संभावना है, और मैं = x मैं - 1जी(ε) ith डेटा बिंदु के लिए मॉडल भविष्यवाणी है, जिसेxiऔरaदिया गयाहै। अब प्रत्येक डेटा बिंदु के लिए(xi,yi)मैं=एक्समैं-1एक्समैं2+1एक्समैं(एक्समैं,yमैं) हम एक चुन सकते हैं ऐसी है कि मैं = y मैं - "संतृप्त मॉडल" के रूप में आप यह कहते हैं। आप ऐसा कर रहे हैं χ 2 परीक्षण यहाँ उपयुक्त, यदि आप केवल एक ही त्रुटि संभावना, के साथ उन लोगों के वर्ग के भीतर विकल्पों की परीक्षण करना चाहते है जी ( ε ) , और आप (likelihoods में से प्रत्येक की स्वतंत्रता है यानी एक और जानते हुए भीमैं=yमैंχ2जी(ε) की भविष्यवाणी करने में कोई मदद नहीं की होगी y मैं , यह देखते हुए एक )। एक्सजे,yजेyमैं


1
यह काम करने वाला नहीं है, क्योंकि संभावना अनुपात परीक्षण की स्वतंत्रता की डिग्री बढ़ती है संतृप्त मॉडल( एन ) केहे(n)
21

0

रैखिक प्रतिगमन संदर्भ में, फिट परीक्षण की भलाई अक्सर एक अधिक जटिल विकल्प के खिलाफ आयोजित की जाती है। यदि आपके पास रैखिक रूप पर्याप्त है तो परीक्षण करने के लिए आपके पास एक रैखिक प्रतिगमन है - कुछ बहुपद शब्दों में फेंकें। चूँकि आपके पास पहले से ही एक गैर-कार्यात्मक कार्यात्मक रूप है, इसलिए आपको जिस जटिल विकल्प पर विचार करना होगा, वह गैर-पैरामीट्रिक प्रतिगमन है । मैं विषय को एक परिचय प्रदान करने की कोशिश नहीं करूंगा, क्योंकि इसके लिए स्वयं की मानसिकता की आवश्यकता है, और यह एक अलग उचित परिचय के लायक है। पैरामीट्रिक बनाम nonparametric regressions, Wooldridge (1992) या Hardle और Mammen (1993) के परीक्षण के लिए , वे बहुत समान चीजें करते हैं। हार्डले ने इस विषय पर एक महान पुस्तक भी लिखी ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.