कौन सा छद्म- माप लॉजिस्टिक रिग्रेशन (कॉक्स एंड स्नेल या नागेलकेके) के लिए रिपोर्ट करने वाला है?


55

मेरे पास SPSSलॉजिस्टिक रिग्रेशन मॉडल के लिए आउटपुट है। मॉडल फिट होने के लिए आउटपुट दो उपायों की रिपोर्ट करता है, Cox & Snellऔर Nagelkerke

इसलिए, अंगूठे के एक नियम के रूप में, इनमें से कौन से R² you उपाय आपको मॉडल के फिट होने के रूप में रिपोर्ट करेंगे?

या, इनमें से कौन सा फिट इंडेक्स है जो आमतौर पर पत्रिकाओं में रिपोर्ट किया जाता है?


कुछ पृष्ठभूमि: प्रतिगमन कुछ पर्यावरणीय चर (उदाहरण के लिए, स्टीपनेस, वनस्पति कवर, ...) से पक्षी (सपेराकैली) की उपस्थिति या अनुपस्थिति की भविष्यवाणी करने की कोशिश करता है। दुर्भाग्य से, पक्षी बहुत बार दिखाई नहीं दिया (35 हिट से 468 मिसे) इसलिए प्रतिगमन खराब प्रदर्शन करता है। कॉक्स एंड स्नेल .09 है, नागलेकर, .23।

विषय पर्यावरण विज्ञान या पारिस्थितिकी है।


3
उत्कृष्ट यूसीएलए आँकड़े सहायता साइट में विभिन्न छद्म- R ^ 2 'के बारे में बताते हुए एक उत्कृष्ट पृष्ठ है और वे एक-दूसरे से कैसे संबंधित हैं। R2
गूँग - मोनिका

यहां दो लिंक दिए गए हैं जो एक सटीक गैर-पैरामीट्रिक एल्गोरिथ्म पर चर्चा करते हैं जो लॉजिस्टिक प्रतिगमन मॉडल की सटीकता को अधिकतम करता है। यदि आप अपने डेटा के साथ इस पद्धति का उपयोग करते हैं, तो यह नमूना पर लागू होने पर आपके लॉजिस्टिक प्रतिगमन मॉडल के वर्गीकरण के प्रदर्शन को बढ़ा देगा। उदाहरण 1: onlinelibrary.wiley.com/doi/10.1111/j.1540-5915.1991.tb01912.x/… उदाहरण 2: epm.sagepub.com/content/54/1/73/abstract
user31256

जवाबों:


74

आम तौर पर मैं रिपोर्ट नहीं करता। होस्मेर और लेमेशो, अपनी पाठ्यपुस्तक एप्लाइड लॉजिस्टिक रिग्रेशन (2 एड।) में बताते हैं कि क्यों:।R2

सामान्य तौर पर, [ उपाय] फिट किए गए मॉडल से अनुमानित मूल्यों की विभिन्न तुलनाओं पर आधारित होते हैं, [आधार मॉडल] से, कोई डेटा या केवल मॉडल को इंटरसेप्ट नहीं करते हैं और परिणामस्वरूप, अच्छाई का आकलन नहीं करते हैं -fit। हम सोचते हैं कि फिट का एक सही माप फिटेड मॉडल के प्रेक्षित मूल्यों की तुलना में कड़ाई से आधारित है।R2

[पी पर। 164.]

, "छद्म " स्टेट के विभिन्न एमएल संस्करणों के बारे में , वे उल्लेख करते हैं कि यह "नियमित उपयोग के लिए अनुशंसित नहीं है, क्योंकि यह व्याख्या करना आसान नहीं है," लेकिन वे इसका वर्णन करने के लिए बाध्य महसूस करते हैं क्योंकि विभिन्न सॉफ्टवेयर पैकेज इसकी रिपोर्ट करते हैं।आर 2R2R2

वे इस चर्चा को समाप्त करके लिखते हैं,

... लॉजिस्टिक रिग्रेशन में कम मानदंड हैं और यह एक समस्या प्रस्तुत करता है जब रैखिक मानों को देखने के आदी दर्शकों के लिए उनके मूल्यों की रिपोर्ट करना। ... इस प्रकार [पाठ में चल रहे उदाहरणों के संदर्भ में बहस करते हुए] हम फिट लॉजिक मॉडल से परिणामों के साथ मूल्यों के नियमित प्रकाशन की अनुशंसा नहीं करते हैं। हालांकि, वे प्रतिस्पर्धी मॉडल का मूल्यांकन करने के लिए एक सांख्यिकीय के रूप में मॉडल निर्माण राज्य में सहायक हो सकते हैं।आर 2R2R2

[पी पर। 167.]

कुछ बड़े लॉजिस्टिक मॉडल (100k से 300k रिकॉर्ड, 100 - 300 व्याख्यात्मक चर) के साथ मेरा अनुभव बिल्कुल एच एंड एल वर्णन जैसा रहा है। मैं अपने डेटा के साथ अपेक्षाकृत उच्च प्राप्त कर सकता था , लगभग 0.40 तक। ये 3% और 15% (झूठी नकारात्मक और झूठी सकारात्मक, संतुलित, 50% होल्ड-आउट डेटासेट का उपयोग करके पुष्टि की गई) के बीच वर्गीकरण त्रुटि दर के अनुरूप हैं। जैसा कि एच एंड एल ने संकेत दिया, मुझे क्लाइंट (एक परिष्कृत सलाहकार, जो परिचित था ) के बारे में अवगत कराने में बहुत समय बिताना पड़ा और उसे विश्लेषण में जो मामले में ध्यान केंद्रित किया गया, उस पर ध्यान केंद्रित करने के लिए (वर्गीकरण त्रुटि) दरें)। मैं संदर्भ के बिना आपके विश्लेषण के परिणामों का वर्णन करने की गर्मजोशी से अनुशंसा कर सकता हूं , जो कि नहीं की तुलना में गुमराह करने की अधिक संभावना है।आर 2 आर 2 आर 2R2R2R2R2


1
(+1) मैं शुरू में अपनी प्रतिक्रिया का विस्तार करने के बारे में सोच रहा था (जो आपके ठीक बाद आया था), लेकिन निश्चित रूप से आपका जवाब आत्मनिर्भर है।
chl

इसके लिए धन्यवाद, एक ऐसी परियोजना के लिए उपयोगी जो मैं वर्तमान में भी काम कर रहा हूं - और पूरी तरह से समझ में आता है।
ब्रैंडन बर्टेल्सन

1
@whuber: मैं सही क्लासिफ की ओर प्रवृत्त होता हूं। दरों, लेकिन मैंने पाठ्यपुस्तकों और वेबसाइटों में कई संदर्भों को देखा है जो विश्लेषकों को उन पर भरोसा नहीं करने और सावधानी बरतने के लिए चेतावनी देते हैं कि छद्म-आरएससी, इसकी सीमाओं के बावजूद, एक निष्पक्ष मीट्रिक है। मैं अक्सर ऐसा कुछ पढ़ता हूं जो मेरे अपने विश्लेषणों में कुछ हद तक पैदा होता है: एक दिए गए भविष्यवक्ता के अलावा छद्म-आरएससी ऊपर जा सकता है (और अन्य मैट्रिक्स इसके अतिरिक्त से लाभ का संकेत देगा) जबकि सही वर्गीकरण दर विफल हो जाती है, और उस व्यक्ति को बाद वाले पर भरोसा नहीं करना चाहिए। क्या आपने यह कोई विचार दिया है?
rolando2

4
@ rolando2 हां, मेरे पास है। इससे यह सवाल उठता है कि चर को शामिल करने के लिए छद्म- कितना ऊपर जाना चाहिए। मुझे संदेह है कि आपकी "सही वर्गीकरण दर" इन-सैंपल दर को संदर्भित कर सकती है , जो निश्चित रूप से पक्षपाती है। यदि यह सही है, तो आप जो पढ़ते हैं, वह केवल दो हीन आँकड़ों की तुलना करता है। नमूना से बाहर दर छद्म से एक संकेतक कहीं अधिक उपयोगी है । आर 2R2आर2
whuber

1
+1। इसके अलावा, अपने उत्तर के एक सूक्ष्म हिस्से पर विस्तार करने के लिए, आप वर्गीकरण त्रुटि दरों का उल्लेख करते हैं , जो बहुवचन है और सटीकता के साथ भ्रमित नहीं होना चाहिए । कई अलग-अलग प्रकार की गणनाएं हैं जो एक भ्रम मैट्रिक्स से बाहर आ सकती हैं - सटीकता , झूठी सकारात्मक दर , सटीक , आदि - और जिस पर हम ध्यान देते हैं वह आवेदन पर निर्भर करता है। इसके अलावा, आप आउट-ऑफ-सैंपल का अंतर बनाते हैं , जो क्रॉस सत्यापन से अलग है , लेकिन कभी-कभी इसके साथ भ्रमित होता है।
वेन

27

दोनों सूचकांक संघ की ताकत के उपाय हैं (अर्थात कोई भी भविष्यवक्ता, एलआर परीक्षण के अनुसार परिणाम के साथ जुड़ा हुआ है), और इसका उपयोग भविष्य कहनेवाला क्षमता या मॉडल प्रदर्शन को निर्धारित करने के लिए किया जा सकता है। एक एकल भविष्यवक्ता के परिणाम पर एक महत्वपूर्ण प्रभाव पड़ सकता है, लेकिन व्यक्तिगत प्रतिक्रिया की भविष्यवाणी के लिए यह इतना उपयोगी नहीं हो सकता है , इसलिए संपूर्ण रूप से मॉडल के प्रदर्शन का आकलन करने की आवश्यकता है (कु। शून्य मॉडल)। नागलेकरके उपयोगी है क्योंकि इसमें 1.0 का अधिकतम मूल्य है, जैसा कि श्रीकांत ने कहा। यह सामान्यीकृत संस्करण की संभावना अनुपात से गणना की गई है,आर2R 2 LR = 1 - ऍक्स्प ( - LR / n )आर2आरएलआर2=1-exp(-एलआर/n), जिसका संबंध समग्र सहयोग के लिए वाल्ड स्टैटिस्टिक से है, जैसा कि मूल रूप से कॉक्स और स्नेल द्वारा प्रस्तावित है। भविष्य कहनेवाला क्षमता के अन्य सूचक हैं ब्रियर स्कोर, सी इंडेक्स (कॉनकॉर्ड प्रोबेबिलिटी या आरओसी क्षेत्र) या सोमरस डी, बाद के दो पूर्वानुमानात्मक भेदभाव का एक बेहतर उपाय प्रदान करते हैं।

केवल रसद प्रतिगमन में मान्यताओं की है कि कर रहे हैं linearity और additivity (+ स्वतंत्रता)। हालाँकि कई वैश्विक अच्छाई-से-फिट परीक्षण (जैसे होसमेर और लेमशॉ परीक्षण, लेकिन मेरी टिप्पणी @onestop पर देखें ) प्रस्तावित किए गए हैं, उनमें आम तौर पर शक्ति की कमी होती है। मॉडल फिट का आकलन करने के लिए, यह दृश्य मानदंड (स्तरीकृत अनुमान, नॉनपैमेट्रिक स्मूथिंग) पर भरोसा करने के लिए बेहतर है जो अनुमानित और मनाया परिणामों (जैसे गैर-रैखिकता या बातचीत) के बीच स्थानीय या वैश्विक प्रस्थान को स्पॉट करने में मदद करता है, और यह काफी हद तक हैरेल के आरएमएस में विस्तृत है हाथ मिलाना । एक संबंधित विषय पर (अंशांकन परीक्षण), स्टेयरबर्ग ( क्लिनिकल प्रेडिक्शन मॉडल)χ2, 2009) देखे गए परिणामों और अनुमानित संभावनाओं के बीच समझौते का आकलन करने के लिए एक ही दृष्टिकोण को इंगित करता है:

अंशांकन अच्छाई-से-फिट होने से संबंधित है, जो किसी दिए गए डेटा को सेट करने के लिए एक मॉडल की क्षमता से संबंधित है। आमतौर पर, एक भी अच्छाई-में-फिट परीक्षण नहीं है, जिसमें एक भविष्यवाणी मॉडल के फिट की कमी के सभी प्रकार के खिलाफ अच्छी शक्ति है। फिट की कमी के उदाहरण गैर-रैखिकता, बातचीत या रैखिक भविष्यवक्ता और परिणाम के बीच एक अनुचित लिंक फ़ंक्शन से चूक गए हैं। अच्छाई-की-फिट को एक सांख्यिकीय के साथ परीक्षण किया जा सकता है । (पृष्ठ २ 27४)χ2

वह सुचारू रूप से देखे गए परिणामों और अनुमानित संभावनाओं के बीच पूर्ण अंतर पर भरोसा करने का सुझाव देता है या तो कथित तौर पर, या तथाकथित हैरेल ई स्टेटिस्टिक के साथ।

अधिक विवरण हार्लेल की पुस्तक, रिग्रेशन मॉडलिंग स्ट्रेटेजीज (पीपी। 203-205, 230-244, 247-249) में पाया जा सकता है । अधिक हालिया चर्चा के लिए, यह भी देखें

स्टेयरबर्ग, ईडब्ल्यू, विकर्स, ए जे, कुक, एनआर, जेरड्स, टी, गोनेन, एम, ओबुचोव्स्की, एन, पेन्किना, एमजे, और कटान, एमडब्ल्यू (2010)। भविष्यवाणी मॉडल के प्रदर्शन का आकलन, पारंपरिक और उपन्यास उपायों के लिए एक रूपरेखामहामारी विज्ञान , 21 (1) , 128-138।


क्या आप "फिट की अच्छाई" और संघ की ताकत या भविष्यवाणी की क्षमता के बीच अंतर पर विस्तार कर सकते हैं?
एंडी डब्ल्यू

@ और यह इंगित करने के लिए धन्यवाद। मुझे बाद में एहसास हुआ कि मेरा पहला वाक्य वास्तव में अच्छा नहीं है। मैं अपना जवाब अपडेट करूंगा, pls मुझे बताएं कि क्या यह आपके साथ ठीक है।
chl

अद्यतन के लिए धन्यवाद और यह भेद स्पष्ट करता है।
एंडी डब्ल्यू

21

मुझे लगता है कि लॉजिस्टिक रिग्रेशन के लिए किसी भी प्रकार के उपाय के साथ मुख्य समस्या यह है कि आप एक ऐसे मॉडल के साथ काम कर रहे हैं, जिसका ज्ञात शोर मूल्य है। यह मानक रैखिक प्रतिगमन के विपरीत है, जहां शोर स्तर को आमतौर पर अज्ञात माना जाता है। के लिए हम एक चमक संभावना घनत्व समारोह के रूप में लिख सकते हैं:आर2

(yमैं|μमैं,φ)=exp(yमैं(μमैं)-सी(μमैं)φ+(yमैं,φ))

जहाँ व्युत्क्रम लिंक फ़ंक्शन लिए ज्ञात कार्य हैं, और । यदि हम सामान्य GLM अवशिष्ट अवशिष्ट को परिभाषित करते हैं(), सी(), (;)μमैं=जी-1(एक्समैंटीβ)जी-1()

मैं2=2φ(लॉग इन करें[(yमैं|μमैं=yमैं,φ)]-लॉग इन करें[(yमैं|μमैं=μ^मैं,φ)])=2φ[yमैं(yमैं)-yमैं(μ^मैं)-सी(yमैं)+सी(μ^मैं)]
हमारे पास (संभावना अनुपात chi-square के माध्यम से, )χ2=1φΣमैं=1एनमैं2

(Σमैं=1एनमैं2)=(φχ2)(एन-पी)φ

जहां का आयाम है । लॉजिस्टिक रिग्रेशन के लिए हमारे पास , जो ज्ञात है। तो हम इसका उपयोग अवशिष्ट के एक निश्चित स्तर पर निर्णय लेने के लिए कर सकते हैं जो "स्वीकार्य" या "उचित" है। यह आमतौर पर ओएलएस प्रतिगमन के लिए नहीं किया जा सकता है (जब तक कि आपको शोर के बारे में पूर्व जानकारी न हो)। अर्थात्, हम उम्मीद करते हैं कि प्रत्येक अवशिष्ट अवशिष्ट लगभग । बहुत से और यह संभावना है कि एक महत्वपूर्ण प्रभाव मॉडल (अंडर-फिटिंग) से गायब है; बहुत सारे और यह संभावना है कि मॉडल (अति-फिटिंग) में निरर्थक या प्रभाव हैं। (इनका अर्थ मॉडल दुर्व्यवहार भी हो सकता है)।पीβφ=11मैं2»1मैं2«1

अब इसका मतलब है कि छद्म- लिए समस्या यह है कि यह ध्यान में रखने में विफल रहता है कि द्विपद भिन्नता का स्तर अनुमानित है (बशर्ते द्विपद त्रुटि संरचना पर सवाल नहीं उठाया जा रहा है)। इस प्रकार भले ही नागेलकेर से , फिर भी इसे ठीक से नहीं बढ़ाया जाता है। इसके अतिरिक्त, मैं नहीं देख सकता कि इन्हें छद्म क्यों कहा जाता है यदि वे सामान्य बराबर नहीं हैं जब आप एक पहचान लिंक और सामान्य त्रुटि के साथ "GLM" फिट करते हैं। उदाहरण के लिए, सामान्य त्रुटि के लिए बराबर कॉक्स-स्नेल आर-स्क्वेर (REML अनुमान के रूप में विचरण का उपयोग करके) दिया गया है:आर201आर2आर2

आरसीएस2=1-exp(-एन-पीएनआरहेएलएस21-आरहेएलएस2)

जो निश्चित रूप से अजीब लग रहा है।

मुझे लगता है कि बेहतर "फिटनेस की अच्छाई" उपाय अवशिष्ट अवशिष्टों का योग है, । यह मुख्य रूप से है क्योंकि हमारे पास लक्ष्य के लिए लक्ष्य है।χ2


+1 श्रीकांत के जवाब के बाद टिप्पणी में संकेत दिए गए मुद्दों का अच्छा प्रदर्शन ।
whuber

यह देखते हुए कि एक द्विपद जीएलएम पुनरावृत्त कम से कम वर्गों का उपयोग करके फिट होगा, क्यों फिट की गुणवत्ता के माप के रूप में कोई अंतिम आईआरएलएस पुनरावृत्ति के भारित कम से कम वर्गों के आर 2 की रिपोर्ट नहीं कर सकता है जिसके साथ जीएलएम फिट था? जैसा कि सांख्यिकी में है ।stackexchange.com/questions/412580/… ?
टॉम वेन्सलेर्स

16

मुझे टीयू तजूर का लघु पत्र "लॉजिस्टिक रिग्रेशन मॉडल में निर्धारण के गुणांक - एक नया प्रस्ताव: भेदभाव का गुणांक" (2009, अमेरिकी सांख्यिकीविद् ) लॉजिस्टिक मॉडल में दृढ़ संकल्प के गुणांक के लिए विभिन्न प्रस्तावों पर काफी ज्ञानवर्धक लगा। वह पेशेवरों और विपक्ष को उजागर करने के लिए एक अच्छा काम करता है - और निश्चित रूप से एक नई परिभाषा प्रदान करता है। बहुत अनुशंसित है (हालांकि मेरे पास खुद कोई पसंदीदा नहीं है)।


1
उस कागज को इंगित करने के लिए धन्यवाद; किसी तरह मैं इसे याद किया (और यह तब दिखाई दिया जब मैं एक बड़े लॉजिस्टिक रिग्रेशन प्रोजेक्ट के बीच में था!)।
whuber

3
रिकॉर्ड के लिए, यह नई परिभाषा , जिसका अर्थ है कि प्रतिक्रियाओं के लिए अनुमानित मूल्य शून्य से प्रतिक्रियाओं के लिए औसत अनुमानित मूल्य का अनुमान है । यह से । तजुर नागेलकेके छद्म खारिज नहीं करता है , लेकिन यह सुझाव देता है कि द्वारा प्राप्त "सहज अपील" का अभाव है । 1 0 0 1 आर 2 डीडी=π^¯1-π^¯01001आर2डी
whuber

8

मैं भी 'न तो उनमें से' कहने जा रहा था, इसलिए मैंने व्ह्यूबर के उत्तर को रद्द कर दिया।

R ^ 2 की आलोचना करने के साथ ही, होसमेर और लेमेशो ने लॉजिस्टिक रिग्रेशन के लिए अच्छाई के एक वैकल्पिक उपाय का प्रस्ताव रखा जो कभी-कभी उपयोगी होता है। यह डेटा को (कहो) के 10 समूहों को बराबर आकार में विभाजित करने पर आधारित है (या संभव के रूप में निकट के रूप में) अनुमानित संभावना (या समतुल्य, रैखिक भविष्यवक्ता) पर आदेश देकर तब प्रत्येक समूह में सकारात्मक प्रतिक्रियाओं की अपेक्षित संख्या की तुलना करना और ची-चुकता परीक्षण करना। यह 'होसमेर-लेमेशो गुडनेस-ऑफ-फिट टेस्ट' सबसे सांख्यिकीय सॉफ्टवेयर पैकेजों में लागू किया गया है।


3
मूल HL GoF परीक्षण बहुत शक्तिशाली नहीं है, क्योंकि यह निरंतर भविष्यवक्ता पैमाने को समूहों की मनमानी संख्या में वर्गीकृत करने पर निर्भर करता है; एच एंड एल ने निर्णय लेने पर विचार करने का प्रस्ताव दिया, लेकिन जाहिर है कि यह नमूना आकार पर निर्भर करता है, और कुछ परिस्थितियों में (उदाहरण के लिए आईआरटी मॉडल) आप अक्सर बहुत कम लोगों को एक या दोनों पैमाने पर होते हैं जैसे कि कटऑफ असमान रूप से होते हैं। लॉजिस्टिक रिग्रेशन मॉडल, स्टेट के लिए अच्छाई-से-फिट परीक्षणों की तुलना देखें। मेड। 1997 16 (9): 965, j.mp/aV2W6Iχ2
chl

धन्यवाद ची, यह एक उपयोगी रेफरी है, हालांकि आपका j.mp लिंक मुझे BiblioInserm लॉगिन प्रॉम्प्ट पर ले गया। यहाँ एक doi-
onestop

गलत लिंक के लिए क्षमा करें ... मुझे लगता है कि फ्रैंक हार्ले के Designपैकेज में वैकल्पिक एच एंड एल 1 डीएफ टेस्ट की सुविधा है।
chl

3

मैं नागेल्केर को पसंद करूंगा क्योंकि यह मॉडल 1 प्राप्त करता है जब मॉडल पूरी तरह से फिट बैठता है जिससे पाठक को यह पता चलता है कि आपका मॉडल एकदम फिट से कितना दूर है। सही मॉडल फिट के लिए कॉक्स एंड शेल 1 प्राप्त नहीं करता है और इसलिए 0.09 के मूल्य की व्याख्या करना थोड़ा कठिन है। विभिन्न प्रकार के फिट के स्पष्टीकरण के लिए छद्म RSquared के बारे में अधिक जानकारी के लिए इस url को देखें ।


8
एक "सही फिट" किसी भी यथार्थवादी लॉजिस्टिक प्रतिगमन में प्राप्य होने से इतना दूर है कि इसे संदर्भ या मानक के रूप में उपयोग करना अनुचित लगता है।
whuber

1
@whuber True लेकिन आप दो प्रतिस्पर्धी मॉडलों के सापेक्ष प्रदर्शन की तुलना करने के लिए मानक का उपयोग कर सकते हैं। आपके उत्तर में कम R ^ 2 के आपके अंक और इसके निहितार्थ अच्छे अंक हैं, लेकिन यदि आपके पास (जैसे, समीक्षक इसकी मांग करते हैं) R ^ 2 के कुछ रूप का उपयोग करने के लिए तो नागेलकेकर बेहतर है।

1
@ श्रीकांत हां, अभी भी समीक्षकों की समस्या जो को देखना चाहते हैं और बोन्फ्रोनी सुधार हर जगह ...आर2
chl

@ श्रीकांत, @chl: इस थ्रेड को पढ़ने से सभी सॉफ्टवेयर रिपोर्ट में सबसे बड़ा R ^ 2 चुनने की सलाह दी जाएगी; ;-)।
whuber

2
@chl समीक्षकों / ग्राहकों को पुश-बैक की पेशकश करना आवश्यक है, लेकिन कभी-कभी हमें व्यावहारिक भी होना चाहिए। यदि पाठक पर्याप्त मॉडल प्रदर्शन की कमी के रूप में कम आर ^ 2 की गलत व्याख्या नहीं करते हैं तो @whuber द्वारा उठाए गए मुद्दों को कुछ हद तक कम किया जाएगा।

3

छद्म-आर-वर्ग का उपयोग करने के खिलाफ तर्क के बावजूद, कुछ लोग विभिन्न कारणों से कम से कम निश्चित समय में उनका उपयोग जारी रखना चाहते हैं। जो मैंने अपने रीडिंग से आंतरिक किया है (और मुझे खेद है कि मैं इस समय उद्धरण नहीं दे सकता हूं) वह है

  • यदि दोनों C & S और नाग। नीचे हैं। 5, सी एंड एस एक बेहतर गेज होगा;
    यदि वे दोनों ऊपर हैं। 5, नाग। मर्जी; और
    अगर वे लड़खड़ाते हैं। 5, पंट।

इसके अलावा, एक सूत्र जिसके परिणाम अक्सर इन दोनों के बीच आते हैं, एप्लाइड लॉजिस्टिक रिग्रेशन एनालिसिस (सेज) में स्कॉट मेनार्ड ने उल्लेख किया है,

[-2LL0 - (-2LL1)]/-2LL0.

इसे नीचे दिए गए चार्ट में "L" के रूप में दर्शाया गया है।

यहाँ छवि विवरण दर्ज करें


यह चित्र क्या दिखाता है (क्षैतिज अक्ष क्या है?) इसके अलावा, अंतिम सूत्र (जो एक स्केल की संभावना अनुपात की तरह दिखता है) नागेलकेके बिल्कुल भिन्न कैसे है? आर2
11:17

विश्लेषण #: मैंने विभिन्न डेटासेट के साथ विभिन्न विश्लेषणों की कोशिश की। नागलेकरके सूत्र काम नहीं करते, लेकिन मुझे यकीन है कि यह आसानी से उपलब्ध है।
rolando2

पॉल एलीसन Nagelkerke सूत्र है, जो एक ऊपर की ओर से समायोजित कॉक्स एंड स्नेल सूत्र है, पर शामिल किया गया statisticalhorizons.com/2013/02 । उस ब्लॉग को पढ़ने के बाद, और आम तौर पर 2-3 वर्षों में जब से यह चर्चा हुई थी, मैं और अधिक आश्वस्त हो गया हूं कि कॉक्स एंड स्नेल के अंडरस्टिमेट्स ने विचरण को समझाया है और मैं सी एंड एस और नागेलकेकर के औसत परिणाम से बेहतर हूं।
rolando2
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.