लॉजिस्टिक रिग्रेशन में श्रेणियों के प्रभाव और उनके प्रसार की कल्पना करने का सबसे अच्छा तरीका क्या है?


11

मुझे एक सार्वजनिक राय सर्वेक्षण डेटा का उपयोग करके एक उम्मीदवार के वोट के मुख्य भविष्यवक्ताओं के बारे में जानकारी प्रस्तुत करने की आवश्यकता है। मैंने उन सभी चरों का उपयोग करके लॉजिस्टिक रिग्रेशन चलाया है जिनकी मुझे परवाह है, लेकिन मुझे यह जानकारी पेश करने का अच्छा तरीका नहीं मिल रहा है।

मेरा क्लाइंट केवल प्रभाव के आकार के बारे में परवाह नहीं करता है, लेकिन प्रभाव के आकार और इस तरह की विशेषता के साथ आबादी के आकार के बीच बातचीत के बारे में।

मैं एक ग्राफ़ में इससे कैसे निपट सकता हूं? कोई सुझाव?

यहाँ एक उदाहरण है:

चर SEX (पुरुष = 1) का जब आश्रित चर वोट / नॉट इन ए प्रत्याशी 2.3 है, जो कि एक बड़ा नंबर है, जिसे एक्सपेंडेनेट होने के बाद और अनुपात अनुपात या संभाव्यता के रूप में माना जाता है। हालांकि, जिस समाज में यह सर्वेक्षण चलाया गया था, उसमें केवल 30% पुरुष थे। इसलिए, हालांकि आदमी ने इस उम्मीदवार का काफी समर्थन किया, लेकिन उनकी संख्या एक उम्मीदवार के लिए महत्वपूर्ण है जो एक प्रमुख चुनाव जीतने की कोशिश कर रहा है।β


FWIW, "इंटरैक्शन" शब्द का उपयोग गलत है (देखें, उदाहरण के लिए यहां या यहां )। मैं कुछ कहना चाहूंगा, '... लेकिन उन स्थितियों की पहचान करने के बारे में जहां प्रभाव का आकार बड़ा है और इस तरह की विशेषता के साथ जनसंख्या का आकार बड़ा है'।
गूँग - मोनिका

जवाबों:


10

मैं @PeterFlom से सहमत हूं कि उदाहरण विषम है, लेकिन इसे एक तरफ स्थापित करते हुए, मुझे लगता है कि व्याख्यात्मक चर स्पष्ट है। यदि यह लगातार सत्य है, तो यह इसे बहुत सरल करता है। मैं इन प्रभावों को प्रस्तुत करने के लिए मोज़ेक भूखंडों का उपयोग करूँगा । मोज़ेक प्लॉट सशर्त अनुपात को लंबवत प्रदर्शित करता है, लेकिन प्रत्येक श्रेणी की चौड़ाई नमूने में इसके सीमांत (यानी बिना शर्त) अनुपात के सापेक्ष मापी जाती है।

यहाँ टाइटैनिक आपदा के आंकड़ों के साथ एक उदाहरण दिया गया है, जो R का उपयोग करके बनाया गया है:

data(Titanic)

sex.table   = margin.table(Titanic, margin=c(2,4))
class.table = margin.table(Titanic, margin=c(1,4))
round(prop.table(t(sex.table), margin=2), digits=3)
#          Sex
# Survived  Male Female
#      No  0.788  0.268
#      Yes 0.212  0.732
round(prop.table(t(class.table), margin=2), digits=3)
#           Class
# Survived   1st   2nd   3rd  Crew
#      No  0.375 0.586 0.748 0.760
#      Yes 0.625 0.414 0.252 0.240

windows(height=3, width=6)
  par(mai=c(.5,.4,.1,0), mfrow=c(1,2))
  mosaicplot(sex.table,   main="")
  mosaicplot(class.table, main="")

यहाँ छवि विवरण दर्ज करें

बाईं ओर, हम देखते हैं कि महिलाओं के जीवित रहने की बहुत अधिक संभावना थी, लेकिन पुरुषों ने बोर्ड पर लगभग 80% लोगों के लिए जिम्मेदार था। इसलिए पुरुष बचे लोगों के प्रतिशत में वृद्धि का मतलब होगा कि महिला जीवित बचे लोगों के प्रतिशत में भी अधिक से अधिक जीवन की बचत हुई। यह कुछ हद तक आपके उदाहरण के अनुरूप है। दाईं ओर एक और उदाहरण है जहां चालक दल और स्टीयरेज ने लोगों का सबसे बड़ा अनुपात बनाया, लेकिन जीवित रहने की संभावना सबसे कम थी। (इसके लायक क्या है, यह इन आंकड़ों का पूर्ण विश्लेषण नहीं है, क्योंकि टाइटैनिक पर वर्ग और लिंग गैर-स्वतंत्र भी थे, लेकिन यह इस प्रश्न के लिए विचारों का वर्णन करने के लिए पर्याप्त है।)


5

मैं थोड़ा उत्सुक हूँ कि किस समाज में केवल 10% पुरुष थे ... लेकिन ...

एक चीज जो आप कर सकते हैं वह है ऑड्स रेशियो को प्लॉट करना और प्रत्येक को नमूने के आकार के साथ लेबल करना।

यदि आप चाहते हैं कि दोनों चर ग्राफ़िकल रूप से दर्शाए जाएं, तो आप एक धुरी चार्ट बना सकते हैं, जिसमें y अक्ष पर प्रत्येक बुलबुले की स्थिति के साथ ऑड्स अनुपात के आकार और बबल के क्षेत्र का नमूना आकार के आनुपातिक होता है।


7
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.