लॉजिस्टिक रिग्रेशन से ऑड्स अनुपात के लिए आत्मविश्वास अंतराल उत्पन्न करने के विभिन्न तरीके


12

मैं अध्ययन कर रहा हूं कि लॉजिस्टिक रिग्रेशन में प्राप्त गुणांक से बाधाओं के अनुपात के लिए 95% विश्वास अंतराल का निर्माण कैसे किया जाए। इसलिए, लॉजिस्टिक रिग्रेशन मॉडल पर विचार करते हुए,

log(p1p)=α+βx

ऐसी है कि x=0 और नियंत्रण समूह के लिए x=1 मामले के लिए समूह।

मैं पहले से ही पढ़ा है यह है कि सबसे आसान तरीका के लिए एक 95% सीआई के निर्माण के लिए β तो हम घातीय समारोह, यह है कि आवेदन किया,

β^±1.96×SE(β^)exp{β^±1.96×SE(β^)}

मेरे प्रश्न हैं:

  1. इस प्रक्रिया को सही ठहराने वाला सैद्धांतिक कारण क्या है? मुझे पता है कि odds ratio=exp{β} और अधिकतम संभावना अनुमानक अपरिवर्तनीय हैं। हालाँकि, मैं इन तत्वों के बीच संबंध नहीं जानता।

  2. क्या डेल्टा विधि पिछली प्रक्रिया के समान 95% विश्वास अंतराल उत्पन्न कर सकती है? डेल्टा विधि का प्रयोग,

    exp{β^}˙N(β, exp{β}2Var(β^))

    फिर,

    exp{β^}±1.96×exp{β}2Var(β^)

    यदि नहीं, तो सबसे अच्छी प्रक्रिया कौन सी है?


1
मुझे CI के लिए बूटस्ट्रैप भी पसंद है, अगर मेरे पास पर्याप्त आकार के पैरामीटर मान या प्रशिक्षण डेटा हैं।
EngrStudent

2
ऐसा करने का एक बेहतर तरीका है, आँकड़े देखें ।stackexchange.com
questions

जवाबों:


7
  1. प्रक्रिया के लिए औचित्य के लिए MLE की asymptotic सामान्य है केन्द्रीय सीमा प्रमेय को शामिल तर्क से और परिणाम।β

  2. डेल्टा विधि MLE के आसपास फ़ंक्शन के रैखिक (यानी पहले क्रम टेलर) के विस्तार से आती है। इसके बाद हम MLE की अस्मितावादी सामान्यता और निष्पक्षता की अपील करते हैं।

अस्वाभाविक रूप से दोनों एक ही उत्तर देते हैं। लेकिन व्यावहारिक रूप से, आप उसी का पक्ष लेंगे जो सामान्य रूप से अधिक निकट दिखता है। इस उदाहरण में, मैं पहले वाले का पक्ष लूंगा क्योंकि उत्तरार्द्ध कम सममित होने की संभावना है।


3

ISL के एक उदाहरण पर विश्वास अंतराल विधियों की तुलना

तिब्शीरानी, ​​जेम्स, हस्ती की पुस्तक "इंट्रोडक्शन टू स्टैटिस्टिकल लर्निंग" , वेज डेटा पर बहुपद लॉजिस्टिक रिग्रेशन डिग्री 4 के लिए आत्मविश्वास अंतराल के पेज 267 पर एक उदाहरण प्रदान करती है । पुस्तक का उद्धरण:

हम डिग्री -4 बहुपद के साथ लॉजिस्टिक रिग्रेशन का उपयोग कर बाइनरी इवेंट का मॉडल तैयार करते हैं । अनुमानित रूप से 95% विश्वास अंतराल के साथ, $ 250,000 से अधिक वेतन की फिट होने की संभावित संभावना को नीले रंग में दिखाया गया है।wage>250

नीचे इस तरह के अंतराल के निर्माण के लिए दो तरीकों का एक त्वरित पुनर्कथन है और साथ ही उन्हें खरोंच से कैसे लागू किया जाए, इस पर टिप्पणी की गई है

Wald / समापन बिंदु परिवर्तन अंतराल

  • रैखिक संयोजन के लिए विश्वास अंतराल के ऊपरी और निचले सीमा की गणना करें (Wald CI का उपयोग करके)xTβ
  • संभावनाओं को प्राप्त करने के लिए समापन बिंदु लिए एक मोनोटोनिक परिवर्तन लागू करें ।F(xTβ)

चूंकि के एक monotonic परिवर्तन हैएक्स टी βPr(xTβ)=F(xTβ)xTβ

[Pr(xTβ)LPr(xTβ)Pr(xTβ)U]=[F(xTβ)LF(xTβ)F(xTβ)U]

संक्षेप में इसका मतलब है कि कंप्यूटिंग और फिर निचले और ऊपरी सीमा प्राप्त करने के लिए परिणाम में लॉगिट परिवर्तन लागू करना:βTx±zSE(βTx)

[exTβzSE(xTβ)1+exTβzSE(xTβ),exTβ+zSE(xTβ)1+exTβ+zSE(xTβ),]

मानक त्रुटि कम्प्यूटिंग

अधिकतम संभावना सिद्धांत हमें बताता है कि प्रतिगमन गुणांक के सहसंयोजक मैट्रिक्स का उपयोग करके के अनुमानित संस्करण की गणना की जा सकती हैΣxTβΣ

Var(xTβ)=xTΣx

जैसा कि डिजाइन मैट्रिक्स और मैट्रिक्स को परिभाषित करेंवीXV

X = [1x1,1x1,p1x2,1x2,p1xn,1xn,p]    V = [π^1(1π^1)000π^2(1π^2)000π^n(1π^n)]

जहां का मूल्य है के लिए वें चर वें टिप्पणियों और भविष्यवाणी की संभावना अवलोकन के लिए प्रतिनिधित्व करता । जे मैं π मैं मैंxi,jjiπ^ii

सहसंयोजक मैट्रिक्स तब पाया जा सकता है: और मानक त्रुटि के रूप में एस ( एक्स टी β ) = Σ=(XTVX)1SE(xTβ)=Var(xTβ)

भविष्यवाणी की संभावना के लिए 95% विश्वास अंतराल को तब प्लॉट किया जा सकता है

यहाँ छवि विवरण दर्ज करें


डेल्टा विधि विश्वास अंतराल

दृष्टिकोण के एक रैखिक सन्निकटन के विचरण की गणना करने के लिए है और इसका उपयोग बड़े नमूना आत्मविश्वास अंतराल के निर्माण के लिए किया जाता है।F

Var[F(xTβ^)]FT Σ F

कहाँ ढाल और अनुमानित सहसंयोजक मैट्रिक्स है। ध्यान दें कि एक आयाम में: ΣΣ

F(xβ)β=F(xβ)xβxββ=xf(xβ)

कहाँ के व्युत्पन्न है । यह बहुभिन्नरूपी मामले में सामान्यीकरण करता हैएफfF

Var[F(xTβ^)]fT xT Σ x f

हमारे मामले में F लॉजिस्टिक फ़ंक्शन है (जिसे हम निरूपित करेंगे ) जिसका व्युत्पन्न हैπ(xTβ)

π(xTβ)=π(xTβ)(1π(xTβ))

अब हम ऊपर गणना किए गए संस्करण का उपयोग करके एक विश्वास अंतराल का निर्माण कर सकते हैं।

C.I.=[Pr(xβ^)zVar[π(xβ^)]Pr(xβ^)+zVar[π(xβ^)]]

बहुभिन्नरूपी मामले के लिए वेक्टर रूप में

C.I.=[π(xTβ^)±z(π(xTβ^)(1π(xTβ^)))TxT  Var[β^]  x  π(xTβ^)(1π(xTβ^))]
  • ध्यान दें कि में एकल डेटा बिंदु का प्रतिनिधित्व करता है , अर्थात डिज़ाइन मैट्रिक्स की एक पंक्तिआर पी + 1 एक्सxRp+1X

यहाँ छवि विवरण दर्ज करें


एक खुला हुआ समापन

दोनों संभावनाओं के लिए सामान्य क्यूक्यू भूखंडों पर एक नज़र और नकारात्मक लॉग ऑड्स बताते हैं कि न तो सामान्य रूप से वितरित किए जाते हैं। क्या यह अंतर समझा सकता है?

यहाँ छवि विवरण दर्ज करें

स्रोत:


1

अधिकांश उद्देश्यों के लिए सबसे सरल तरीका संभवतः सबसे अच्छा है, जैसा कि इस पृष्ठ पर एक लॉग ट्रांसफ़ॉर्म के संदर्भ में चर्चा की गई है । सांख्यिकीय पैमाने पर किए गए सांख्यिकीय परीक्षणों और विश्वास अंतराल (CI) के साथ उस लॉग पैमाने पर परिभाषित किए गए विश्लेषण के रूप में अपने आश्रित चर के बारे में सोचें। बाधाओं के अनुपात में पिछला परिवर्तन बस उन परिणामों को एक पैमाने पर रखना है जो एक पाठक अधिक आसानी से समझ सकता है। यह भी किया जाता है, उदाहरण के लिए, कॉक्स उत्तरजीविता विश्लेषण में, जहां प्रतिगमन गुणांक (और 95% सीआई) जोखिम अनुपात और उनके सीआई को प्राप्त करने के लिए प्रतिपादक हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.