दो अनुपातों के अनुपात में आत्मविश्वास अंतराल


20

मेरे पास दो अनुपात हैं (उदाहरण के लिए, नियंत्रण लेआउट में एक लिंक पर क्लिकथ्रू दर (CTR) और प्रयोगात्मक लेआउट में एक लिंक पर CTR), और मैं इन अनुपातों के अनुपात के आसपास 95% विश्वास अंतराल की गणना करना चाहता हूं।

मैं यह कैसे करु? मुझे पता है कि मैं इस अनुपात के विचरण की गणना करने के लिए डेल्टा विधि का उपयोग कर सकता हूं, लेकिन मुझे यकीन नहीं है कि इसके अलावा क्या करना है। मुझे विश्वास अंतराल के मध्य बिंदु के रूप में क्या उपयोग करना चाहिए (मेरा मनाया अनुपात, या अपेक्षित अनुपात जो अलग है), और मुझे इस अनुपात के आसपास कितने मानक विचलन लेने चाहिए?

क्या मुझे डेल्टा विधि के विचरण का उपयोग करना चाहिए? (मैं वास्तव में विचरण के बारे में परवाह नहीं करता हूं, सिर्फ एक आत्मविश्वास अंतराल।) क्या मुझे केस 1 का उपयोग करते हुए फिएलर के प्रमेय का उपयोग करना चाहिए (क्योंकि मैं अनुपात कर रहा हूं, मुझे लगता है कि मैं सामान्य वितरण आवश्यकता को पूरा करता हूं)? क्या मुझे सिर्फ बूटस्ट्रैप नमूने की गणना करनी चाहिए?


1
आपके पास एक मौलिक समस्या है: अधिकांश अनुपातों में शून्य होने का एक सकारात्मक मौका है, जहां से अनुपात (स्वतंत्र अनुपात में) अपरिभाषित होने का एक सकारात्मक मौका है। यह अनुमानित तरीकों (डेल्टा विधि की तरह) के लिए गंभीर कठिनाइयों को प्रस्तुत कर सकता है और सुझाव देता है कि सामान्य सन्निकटन को अधिक स्पष्ट रूप से देखा जाना चाहिए और सामान्य से अधिक कठोरता से परीक्षण किया जाना चाहिए।
whuber

जोसेफ एल। फ्लीस, ब्रूस लेविन, मायुंघी चो पाइक: सांख्यिकीय तरीके दरों और अनुपात के लिए [1] सापेक्ष जोखिम पर चर्चा करते हैं, जो दो दरों का भागफल है। मेरे पास पुस्तक नहीं है, इसलिए मैं केवल विषय सूचकांक और सामग्री की तालिका द्वारा जा सकता हूं, लेकिन शायद आपके पुस्तकालय में यह है। [१]: onlinelibrary.wiley.com/book/10.1002/0471445428
सेलबाइट्स मोनिका

निश्चित रूप से एक प्रतिशतक बूटस्ट्रैप सबसे अच्छा तरीका होगा?
पीटर एलिस

जवाबों:


19

महामारी विज्ञान में ऐसा करने का मानक तरीका (जहां अनुपात का अनुपात आमतौर पर जोखिम अनुपात के रूप में संदर्भित किया जाता है ) पहले अनुपात में परिवर्तन करना है, डेल्टा विधि का उपयोग करके लॉग पैमाने पर एक विश्वास अंतराल की गणना करें और एक सामान्य वितरण मान लें। फिर वापस बदलना। यह अनट्रॉन्ड स्केल पर डेल्टा विधि का उपयोग करने की तुलना में मध्यम नमूना आकारों में बेहतर काम करता है, हालांकि यह अभी भी खराब व्यवहार करेगा यदि किसी समूह में घटनाओं की संख्या बहुत कम है, और पूरी तरह से विफल रहता है यदि दोनों समूहों में कोई घटना नहीं है।

अगर कुल में से दो समूहों में और सफलताएँ और , तो अनुपात के अनुपात के लिए स्पष्ट अनुमानएक्स 2 n 1 एन 2 θ = एक्स 1 / n 1x1x2n1n2

θ^=x1/n1x2/n2.

डेल्टा विधि का उपयोग करना और दो समूहों को स्वतंत्र मानना ​​और सफलताओं को द्विपद रूप से वितरित किया जाता है, आप उस इसका वर्ग-मूल लेने से मानक त्रुटि मिलती है । यह मानते हुए कि सामान्य रूप से वितरित किया जाता है, के लिए एक 95% विश्वास अंतराल है इस Exponentiating अनुपात के अनुपात के लिए एक 95% विश्वास अंतराल देता है के रूप मेंएसई ( लॉग θ ) लॉग ऑन θ लोग इन θ लोग इन θ ± 1.96 एसई ( लॉग θ ) θ θ exp [ ± 1.96 एसई (

Var(logθ^)=1/x11/n1+1/x21/n2.
SE(logθ^)logθ^logθ
logθ^±1.96SE(logθ^).
θ
θ^exp[±1.96SE(logθ^)].

5
यह बहुत अच्छा काम करता है बशर्ते और बड़े (कई सौ या अधिक) और और बहुत छोटे न हों (c। या अधिक)। अन्यथा, अंतराल बहुत बड़ा हो जाता है। यह भी मामलों के इलाज के लिए किसी तरह की जरूरत है और । यह पता चला दोनों मुद्दों पर एक दृष्टिकोण निरंतरता-सुधार की तरह साथ संबोधित किया जा सकता: ऐड दोनों को , जोड़ने दोनों को , और आगे बढ़ें। दोनों फिर इस सीआई आश्चर्यजनक रूप से अच्छा प्रदान की जाती है हैं या अधिक से अधिक, परवाह किए बिनाएन 2 एन 1 पी 1 एन 2 पी 2 10 एक्स 2 = 0 एक्स मैं = n मैं 1 / 2 एक्स मैं 1 n मैं पी मैं n मैं 4 n मैंn1n2n1p1n2p210x2=0xi=ni1/2xi1nipini4 के आकार के । ni
whuber

@whuber: "निरंतरता-सुधार-जैसा दृष्टिकोण" - विशेष रूप से एक सामान्य चाल के लिए 1/2 का उपयोग है? (जैसा कि कुछ अन्य छोटे छद्म स्वर के विपरीत है।) जिस तरह से आपने इसे संक्षिप्त किया है वह 1/2 ध्वनि को किसी तरह से मुद्रित करता है =) - यह है?
रांगेयिन

दिलचस्प सवाल, रैगेटिन। इस मामले में, नहीं: मैंने एक उपयुक्त शुरुआती मूल्य खोजने के लिए प्रयोग किया (इसका अर्थ है "यह पता चला है कि")। 1/2 सार्वभौमिक रूप से मान्य नहीं है; और कुछ संयोजनों के लिए , अन्य मूल्य थोड़ा बेहतर काम करेंगे। अनुमानक के वितरण का एक सैद्धांतिक अध्ययन एक अलग प्रारंभिक मूल्य सुझा सकता है। n मैंxini
whuber

इस मामले में विचरण मानक त्रुटि का वर्गमूल क्यों है, मानक विचलन नहीं?
मिको

2
@onestop क्या यह किसी R पैकेज में लागू किया गया है?
बोगडान वासीलेस्कु
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.