लॉजिस्टिक रिग्रेशन में अच्छाई-की-फिट परीक्षण; हम किस 'फिट' को परखना चाहते हैं?


12

मैं सवाल और उसके जवाबों की बात कर रहा हूं: लॉजिस्टिक रिग्रेशन से विकसित मॉडल की भविष्यवाणी की क्षमता (संभावना) की तुलना कैसे करें? @ क्लार्क चोंग द्वारा और @ फ्रेंक हरेल द्वारा उत्तर / टिप्पणियां। और होम्स-लेमेशो परीक्षण और टिप्पणियों में की स्वतंत्रता की डिग्री परχ2 सवाल ।

मैंने पेपर DW होसमर, टी। होस्मर, एस। ले सेसी, एस। लेमेशो, "लॉजिस्टिक रिग्रेशन मॉडल के लिए अच्छाई-से-फिट परीक्षण की तुलना", सांख्यिकी में चिकित्सा, वॉल्यूम। 16, 965-980 (1997)

पढ़ने के बाद मैं उलझन में था क्योंकि मैंने जिस प्रश्न का उल्लेख "संभावना (संभावना) पूर्वानुमेय क्षमता) के लिए स्पष्ट रूप से किया था", जो कि मेरे विचार में नहीं है, जैसा कि पेपर सुप्रा लक्ष्य में अच्छाई-की-फिट-टेस्ट क्या है:

जैसा कि हम में से ज्यादातर लोग जानते हैं, लॉजिस्टिक रिग्रेशन व्याख्यात्मक चर और सफलता की संभावना के बीच एस-आकार की कड़ी मानता है, एस-आकार के लिए कार्यात्मक रूप है।

P(y=1|xi)=11+e(β0+iβixi)

यह दिखावा किए बिना कि होसमेर-लेमेशो परीक्षण में कोई कमी नहीं है, मुझे लगता है कि हमें (ए) (संभावना) भविष्य कहनेवाला क्षमता और (बी) ' अच्छाई-की-फिट ' के लिए परीक्षणों के बीच अंतर करना होगा ।

पूर्व का लक्ष्य यह परीक्षण करना है कि क्या संभावनाएं अच्छी तरह से भविष्यवाणी की गई हैं, जबकि अच्छाई-से-फिट परीक्षण परीक्षण करते हैं कि क्या ऊपर के आकार का फ़ंक्शन 'सही' फ़ंक्शन है। अधिक औपचारिक रूप से:

  1. 'संभाव्यता भविष्य कहनेवाला क्षमता परीक्षण' के परीक्षण में यह बताते हुए कि सफलता की संभावनाएँ मॉडल द्वारा अच्छी तरह से बताई गई हैं;H0
  2. जबकि अच्छाई-के-फिट परीक्षणों के लिए है (होस्मर एट अल। देखें) कि एस-आकार का कार्यात्मक रूप सुप्रा सही है। होसमेर एट अल। उन सिमुलेशन का प्रदर्शन करें जहां वे अशक्त से दो प्रकार के विचलन का पता लगाने की शक्ति पाते हैं, ताकि लिंक फ़ंक्शन गलत हो या कि हर में घातांक रैखिक न हो।H0

जाहिर है, यदि उपरोक्त फ़ंक्शन का 'सही' कार्यात्मक रूप है (इसलिए यदि परीक्षण यह निष्कर्ष निकालते हैं कि हम को फिट-ऑफ-टेस्ट के लिए स्वीकार कर सकते हैं ), तो अनुमानित संभावनाएं ठीक होंगी, ...H0

पहली टिप्पणी

... हालाँकि, को स्वीकार करना एक कमजोर निष्कर्ष है जैसा कि इस रूप में बताया गया है कि यदि हम अशक्त परिकल्पना को अस्वीकार करने में विफल रहते हैं? H0

पहला प्रश्न

मेरे पास सबसे महत्वपूर्ण प्रश्न / टिप्पणी यह ​​है कि यदि अच्छाई-की-फिट को अस्वीकार कर दिया जाता है, तो परीक्षण का निष्कर्ष यह है कि कार्यात्मक रूप 'सही' नहीं था, हालांकि, इसका अर्थ यह है कि संभावनाएं हैं अच्छी तरह से भविष्यवाणी नहीं की?H0

दूसरा सवाल

इसके अलावा, मैं होसमेर एट के निष्कर्ष को इंगित करना चाहता हूं। अल; (मैं सार से उद्धृत करता हूं):

'' जब सही मॉडल में द्विघात शब्द होता है तो परीक्षणों के प्रदर्शन की एक परीक्षा होती है, लेकिन केवल रेखीय शब्द वाले एक मॉडल को फिट किया गया है, यह दर्शाता है कि पियर्सन ची-स्क्वायर, अनवीटेड सम-ऑफ-स्क्वेयर, होसमेर-लेमेशो डिकाइल जोखिम का, चिकने अवशिष्ट योगों के वर्गों और स्टुकेल के स्कोर परीक्षण में, 50 प्रतिशत से अधिक शक्ति है, जब रैखिक आकार से मध्यम प्रस्थान का पता लगाने के लिए नमूना आकार 100 है और आकार 500 के नमूने के लिए इन समान विकल्पों के लिए 90 प्रतिशत से अधिक शक्ति है। सभी परीक्षणों में कोई शक्ति नहीं थी जब सही मॉडल में एक द्विबीजपत्री और निरंतर कोवरिएट के बीच बातचीत थी लेकिन केवल निरंतर कोवरिएट मॉडल फिट था। गलत तरीके से निर्दिष्ट लिंक का पता लगाने की शक्ति आकार 100 के नमूनों के लिए खराब थी। आकार 500 स्टुकल के नमूनों के लिए ' एस स्कोर परीक्षण में सबसे अच्छी शक्ति थी लेकिन यह एक असममित लिंक फ़ंक्शन का पता लगाने के लिए केवल 50 प्रतिशत से अधिक था। गलत तरीके से निर्दिष्ट लिंक फ़ंक्शन का पता लगाने के लिए अनवीटेड सम-ऑफ-स्क्वेयर टेस्ट की शक्ति स्टुकल के स्कोर टेस्ट से थोड़ी कम थी ''

क्या मैं इससे निष्कर्ष निकाल सकता हूं कि किस परीक्षण में अधिक शक्ति है या कि होस्मेर-लेमेशो में कम शक्ति है (इन विशिष्ट विसंगतियों का पता लगाने के लिए)?

दूसरी टिप्पणी

पेपर होसमेर एट। अल। कि मैंने विशेष विसंगतियों का पता लगाने के लिए शक्ति, गणना (अनुकरण) का उल्लेख किया है (यदि केवल निर्दिष्ट है तो शक्ति की गणना की जा सकती है)। मेरे विचार से इसका अर्थ यह नहीं है कि इन परिणामों को '' सभी संभावित विकल्पों '' के लिए सामान्यीकृत किया जा सकता है ?H1H1

जवाबों:


5

"फिटनेस की अच्छाई" को कभी-कभी एक अर्थ में प्रयोग किया जाता है जैसे कि स्पष्ट मॉडल गलत-विनिर्देश के विपरीत, "फिट की कमी"; और कभी-कभी किसी अन्य अर्थ में एक मॉडल के भविष्य कहनेवाला प्रदर्शन के रूप में - कितनी अच्छी तरह से पूर्वानुमान टिप्पणियों से मेल खाते हैं। होसमेर-लेमेशो परीक्षण पहले अर्थ में फिट की अच्छाई के लिए है, और हालांकि फिट की कमी का प्रमाण भविष्य कहनेवाला प्रदर्शन (दूसरे अर्थ में गोफ, नागेलकेके के या बैरियर स्कोर द्वारा मापा जाता है ) में सुधार कर सकता है। कोई भी समझदार नहीं है कि जब तक आप विशिष्ट सुधार की कोशिश नहीं करते हैं, तब तक (आमतौर पर बातचीत की शर्तों के साथ या भविष्यवाणियों के साथ एक वक्रतापूर्ण संबंध के लिए अनुमति देने के लिए निरंतर भविष्यवक्ताओं का प्रतिनिधित्व करने के लिए एक या अधिक बहुपक्षीय आधार; कभी-कभी लिंक बदलकर)।R2

अच्छाई-के-फिट परीक्षणों का उद्देश्य विभिन्न विकल्पों के खिलाफ एक विशिष्ट विकल्प के खिलाफ उच्च शक्ति के बजाय उचित शक्ति है; इसलिए विभिन्न परीक्षणों की शक्ति की तुलना करने वाले लोग कुछ विकल्पों को चुनने के लिए व्यावहारिक दृष्टिकोण अपनाते हैं, जो संभावित उपयोगकर्ताओं के लिए विशेष रूप से रुचि रखते हैं (उदाहरण के लिए अक्सर उद्धृत स्टीफंस (1974) देखें, "फिट की भलाई के लिए EDF आँकड़े और कुछ तुलना ", JASA, 69 , 347 )। आप यह निष्कर्ष नहीं निकाल सकते हैं कि एक परीक्षण सभी संभावित विकल्पों के खिलाफ दूसरे की तुलना में अधिक शक्तिशाली है क्योंकि यह कुछ के खिलाफ अधिक शक्तिशाली है।


1
कुछ मामलों में यह दिखाया जा सकता है कि एक परीक्षण 'समान रूप से अधिक शक्तिशाली' है, जिसका अर्थ है कि यह सभी संभावित विकल्पों (सीएफई कार्लिन / रुबिन प्रमेय) के लिए अधिक शक्तिशाली है। लेकिन आप सही हैं कि यह केवल असाधारण मामलों में है और निश्चित रूप से होस्मेर-लेमेशो परीक्षण के लिए सेटिंग में नहीं है।

4
सामान्य तौर पर, "फिटनेस की अच्छाई" को बहुत अधिक जोर दिया जाता है IMHO। एक बेहतर विकल्प यह है कि मॉडल को सामने की ओर फिट किया जाए। यह रैखिकता मान्यताओं को आराम करने के लिए प्रतिगमन स्पाइन का उपयोग करके किया जाता है, और उन इंटरैक्शन को शामिल करता है जो समझ में आता है।
फ्रैंक हैरेल

2
@fcoppens: अच्छी बात है! आप केवल स्केलर पैरामीटर के मानों के तहत विकल्पों को गंभीर रूप से प्रतिबंधित करके UMP परीक्षण प्राप्त करते हैं, और फिर भी हमेशा नहीं। यहां तक ​​कि यह विचार करते हुए कि क्या एक परीक्षण के अनजाने - कम से कम एक अन्य परीक्षण है जिसमें सभी विकल्पों के तहत अधिक से अधिक शक्ति है - को सामान्य-उद्देश्य GOF परीक्षण के लिए विकल्पों को बहुत अधिक प्रतिबंधित करना होगा।
Scortchi - को पुनः स्थापित मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.