मल्टीमोनियल लॉजिस्टिक रिग्रेशन बनाम एक-बनाम-बाकी बाइनरी लॉजिस्टिक रिग्रेशन


36

हम कहते हैं कि हमारे पास कुछ श्रेणियों और स्वतंत्र चर के सेट के साथ एक आश्रित चर । Y

बाइनरी लॉजिस्टिक रिग्रेशन (यानी एक-बनाम-बाकी योजना ) के सेट पर बहुराष्ट्रीय लॉजिस्टिक रिग्रेशन के क्या फायदे हैं ? बाइनरी लॉजिस्टिक रिग्रेशन के सेट से मेरा मतलब है कि प्रत्येक श्रेणी लिए हम लक्ष्य = 1 के साथ अलग बायनरी लॉजिस्टिक रिग्रेशन मॉडल बनाते हैं जब और 0 अन्यथा।yiYY=yi


3
गणितीय रूप से, एक बहुराष्ट्रीय लॉजिट मॉडल एक आधार विकल्प के मुकाबले सभी बाइनरी लॉजिट मॉडल का एक सेट है। लेकिन क्योंकि आप जेनेरिक मापदंडों को ध्वस्त करते हैं और शायद कुछ अन्य लोगों को जोड़ते हैं, एमएनएल हमेशा कम से कम कुशल होगा (और शायद इतना अधिक)। मैं कभी भी द्विपद मॉडल की एक श्रृंखला का उपयोग करने का कोई कारण नहीं देखता हूं।
gregmacfarlane

2
@gmacfarlane: मैंने उन आंकड़ों को अनुकरण करने की कोशिश की है जहां MNL द्विआधारी लॉजिस्टिक रजिस्टरों की श्रृंखला से बेहतर होगा, लेकिन हर बार औसतन गुणवत्ता समान थी। मैं लिफ्ट चार्ट की तुलना कर रहा था और कुछ सिमुलेशन से औसत परिणाम के बाद वे लगभग समान दिखते हैं। शायद आपके पास एक विचार है कि डेटा कैसे उत्पन्न किया जाए ताकि MNL द्विआधारी लॉजिस्टिक रजिस्टरों को हरा दे? हालाँकि MNL को बहुत फायदा हुआ, लेकिन इसके स्कोर की संभावना के रूप में व्याख्या की जा सकती है।
टोमक टार्किंसस्की

मल्टीमोनियल लॉजिस्टिक रिग्रेशन बाइनरी लॉगिट रिग्रेशन का विस्तार है। इसका उपयोग तब किया जाता है जब अध्ययन के निर्भर चर तीन और ऊपर होते हैं, जबकि, द्विआधारी लॉगिट का उपयोग तब किया जाता है जब अध्ययन के निर्भर चर दो होते हैं।

पाठक के लिए: मैं @ julieth के उत्तर को शुरू करने और ttnphns को पढ़ने के बाद अनुसरण करने की सलाह देता हूं। मुझे लगता है कि पूर्व अधिक सीधे मूल प्रश्न का उत्तर देता है लेकिन उत्तरार्द्ध कुछ दिलचस्प संदर्भ जोड़ता है। ttnphns उन विभिन्न विशेषताओं को भी दर्शाता है जो एक लोकप्रिय सॉफ़्टवेयर रूटीन में दोनों के लिए उपलब्ध हैं, जो स्वयं एक दूसरे पर एक का उपयोग करने का एक कारण बन सकता है (देखें gregmacfarlane का कथन)।
बेन ओगोरक

जवाबों:


21

यदि दो से अधिक श्रेणियां हैं, तो दूसरे पर एक प्रतिगमन के "लाभ" के बारे में आपका प्रश्न संभवतः व्यर्थ है यदि आप मॉडल के मापदंडों की तुलना करना चाहते हैं , क्योंकि मॉडल मौलिक रूप से अलग होंगे:Y

logP(i)P(not i)=logiti=linear combination प्रत्येक के लिए द्विआधारी रसद प्रतिगमन, औरi

logP(i)P(r)=logiti=linear combination प्रत्येक के लिए श्रेणी में कई रसद प्रतिगमन, चुना संदर्भ श्रेणी जा रहा है ( )।irir

हालांकि, यदि आपका उद्देश्य केवल संभावना की भविष्यवाणी करने के लिए है प्रत्येक श्रेणी की या तो दृष्टिकोण उचित है, हालांकि वे अलग संभावना अनुमान दे सकता है। संभाव्यता का अनुमान लगाने का सूत्र सामान्य है:i

P(i)=exp(logiti)exp(logiti)+exp(logitj)++exp(logitr) , जहाँ सभी श्रेणियां हैं और यदि को संदर्भ के रूप में चुना जाता है तो इसका । तो, बाइनरी लॉजिस्टिक के लिए कि एक ही सूत्र । मल्टीमोनियल लॉजिस्टिक अप्रासंगिक विकल्पों की स्वतंत्रता की धारणा (हमेशा यथार्थवादी नहीं) पर निर्भर करता है जबकि बाइनरी लॉजिस्टिक भविष्यवाणियों की एक श्रृंखला नहीं होती है।i,j,,rrexp(logit)=1P(i)=exp(logiti)exp(logiti)+1


एक अलग विषय यह है कि के द्विभाजित होने की स्थिति में बहुपद और बाइनरी लॉजिस्टिक रिग्रेशन के बीच तकनीकी अंतर क्या हैं । क्या परिणामों में कोई अंतर होगा? ज्यादातर समय कोविरेट्स की अनुपस्थिति में परिणाम समान होंगे, फिर भी, एल्गोरिदम और आउटपुट विकल्पों में अंतर हैं। SPSS में उस मुद्दे के बारे में अभी मुझे SPSS सहायता उद्धृत करें:Y

बाइनरी लॉजिस्टिक रिग्रेशन मॉडल को लॉजिस्टिक रिग्रेशन प्रक्रिया या मल्टिनोमियल लॉजिस्टिक रिग्रेशन प्रक्रिया का उपयोग करके फिट किया जा सकता है। प्रत्येक प्रक्रिया में विकल्प उपलब्ध नहीं हैं। एक महत्वपूर्ण सैद्धांतिक भेद यह है कि लॉजिस्टिक रिग्रेशन प्रक्रिया व्यक्तिगत मामले स्तर पर डेटा का उपयोग करके सभी पूर्वानुमानों, अवशिष्टों, प्रभाव आंकड़ों और अच्छाई-से-फिट परीक्षणों का उत्पादन करती है, भले ही डेटा कैसे दर्ज किया गया हो और कोवरिएट पैटर्न की संख्या हो या न हो। इन मामलों की कुल संख्या की तुलना में छोटा है, जबकि बहुराष्ट्रीय उपस्कर प्रतिगमन प्रक्रिया आंतरिक रूप से मामलों को भविष्यवाणियों के लिए समान सहसंयोजक पैटर्न के साथ उप-योग बनाने के लिए बनाती है, इन उप-योगों के आधार पर भविष्यवाणियां, अवशिष्ट, और अच्छाई-से-फिट परीक्षण।

लॉजिस्टिक रिग्रेशन निम्नलिखित अनूठी विशेषताएं प्रदान करता है:

• मॉडल के लिए फिटनेस की होस्मेर-लेमेशो परीक्षण

• स्टेप वाइज विश्लेषण करता है

• मॉडल पैरामीटरीकरण को परिभाषित करने के लिए विरोधाभास

• वर्गीकरण के लिए वैकल्पिक कट अंक

• वर्गीकरण प्लॉट

• मामलों के एक सेट आउट मामलों के एक सेट पर फिट किया गया मॉडल

• भविष्यवाणियों, अवशिष्टों, और आँकड़ों को प्रभावित करता है

मल्टीमोनियल लॉजिस्टिक रिग्रेशन निम्नलिखित अनूठी विशेषताएं प्रदान करता है:

• मॉडल के फिट होने के लिए पियर्सन और डिविज़न ची-स्क्वायर टेस्ट

• अच्छाई-के-फिट परीक्षणों के लिए डेटा के समूहन के लिए उप-जनसंख्या की विशिष्टता

• उप-योगों द्वारा गणना, अनुमानित की गई गिनती और अवशिष्ट की सूची

• अधिक फैलाव के लिए विचरण अनुमानों का सुधार

• पैरामीटर का सहसंयोजक मैट्रिक्स अनुमान लगाता है

• मापदंडों के रैखिक संयोजनों का परीक्षण

• नेस्टेड मॉडल के स्पष्ट विनिर्देश

विभेदित चर का उपयोग करके फिट 1-1 सशर्त लॉजिस्टिक प्रतिगमन मॉडल से मेल खाता है


मुझे पता है कि ये मॉडल अलग होंगे, लेकिन मुझे नहीं पता कि कौन सी स्थिति बेहतर है। मैं दूसरे तरीके से सवाल पूछूंगा। यदि आपको एक कार्य दिया गया है: प्रत्येक व्यक्ति के लिए संभावना की भविष्यवाणी करते हैं कि कुछ मोबाइल फोन कंपनी पसंदीदा है (मान लें कि हर एक के पास पसंदीदा मोबाइल फोन कंपनी है)। आप उन तरीकों में से किसका उपयोग करेंगे और दूसरे एक से अधिक फायदे क्या हैं?
टोमेक टारसिनेस्की

@ टोमेक ने अपने उत्तर का थोड़ा विस्तार किया
ttnphns

हालांकि मुझे लगता है कि @ जूलियट ओपी के मूल प्रश्न का सबसे अच्छा जवाब है, मैं आपको अपरिवर्तनीय विकल्प की स्वतंत्रता की शुरूआत के लिए धन्यवाद देता हूं। एक प्रश्न मेरे पास अभी भी है कि क्या अलग लॉजिस्टिक्स वास्तव में इसके आसपास मिलता है; विकिपीडिया लेख जिसका आप उल्लेख प्रोबेट और "नेस्टेड लॉजिट" से करते हैं IIA के उल्लंघन की अनुमति के रूप में
बेन ओगोरक

क्या आप बता सकते हैं कि संदर्भ श्रेणी के विकल्प के साथ मॉडल को कैसे फिट किया जाए? श्रेणी , क्या हम केवल उस डेटा के सबसेट का उपयोग करते हैं जो या तो संदर्भ श्रेणी या श्रेणी , ? r मैं मैं आरiriir
user21359

13

शीर्षक के कारण, मैं यह मान रहा हूं कि "कई लॉजिस्टिक रिग्रेशन के फायदे" का अर्थ है "बहुराष्ट्रीय रिग्रेशन"। मॉडल के एक साथ फिट होने पर अक्सर फायदे होते हैं। इस विशेष स्थिति का वर्णन एगेस्टी (श्रेणीबद्ध डेटा विश्लेषण, 2002) पृष्ठ 273 में किया जाता है। संक्षेप में (एग्रैस्टी), आप एक संयुक्त मॉडल से अनुमानों को एक स्तरीकृत मॉडल से अलग होने की उम्मीद करते हैं। अलग-अलग लॉजिस्टिक मॉडल में बड़ी मानक त्रुटियां होती हैं, हालांकि यह बहुत बुरा नहीं हो सकता है जब परिणाम के सबसे लगातार स्तर को संदर्भ स्तर के रूप में सेट किया जाता है।


धन्यवाद! मैं इस पुस्तक को खोजने की कोशिश करूंगा, unfortunatelly google.books केवल पेज 268 तक सामग्री प्रदान करता है।
टोमेक टारसिनेस्की

@TomekTarczynski I ने अनुच्छेद से प्रासंगिक जानकारी को संक्षेप में प्रस्तुत किया है, इसलिए आपको इस प्रश्न से संबंधित कोई और जानकारी पुस्तक को देखने से नहीं मिल सकती है (हालांकि पुस्तक महान है इसलिए आपको अन्य अच्छी जानकारी मिलेगी)।
जूलियट

4
एगेस्टी पुस्तक के उद्धरण: "अलग-फिटिंग अनुमान जे -1 लॉगिट के एक साथ फिटिंग के लिए एमएल अनुमान से भिन्न हैं। वे कम कुशल हैं, बड़ी मानक त्रुटियों के लिए प्रवृत्त हैं। हालांकि, बेज और ग्रे 1984 ने दिखाया कि दक्षता हानि। तब मामूली होता है जब प्रतिक्रिया श्रेणी में व्यापकता होती है, आधार रेखा होती है। "
फ्रेंक डर्नोनकोर्ट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.