क्यों एक संभावना-अनुपात परीक्षण ची-चुकता वितरित किया जाता है?


34

क्यों संभावना अनुपात परीक्षण वितरित ची-चुकता का परीक्षण आँकड़ा है?

2(ln Lalt modelln Lnull model)χdfaltdfnull2



14
संदर्भ के लिए धन्यवाद। यहाँ मेरे पास से एक है : ysts.stackexchange.com/faq#etiquette
Dr. Beeblebrox

5
वहाँ "हास्य की अपनी भावना लाओ" नोटिस। मेरा अशिष्ट होने का इरादा नहीं था, लेकिन इस प्रश्न का उत्तर अपेक्षाकृत थकाऊ होगा और इसमें मूल रूप से, उस लेख की सामग्री (या कुछ बेहतर आंकड़े पाठ्यपुस्तकों) शामिल होंगे। यदि आप इनमें से किसी एक में स्पष्टीकरण के साथ अपनी सटीक समस्या बताते हैं, तो मुझे आपकी मदद करने में खुशी होगी।
निक सब्बे

2
विल्क्स के मूल पेपर का सीधा लिंक बिना किसी भुगतान के।
ayorgo

जवाबों:


23

जैसा कि @Nick द्वारा उल्लेख किया गया है यह विल्क्स प्रमेय का परिणाम है । लेकिन ध्यान दें कि परीक्षण आंकड़ा है asymptotically -distributed, नहीं χ 2 -distributed।χ2χ2

मैं इस प्रमेय से बहुत प्रभावित हूं क्योंकि यह बहुत व्यापक संदर्भ में है। संभावना के साथ एक सांख्यिकीय मॉडल पर विचार करें जहां y वेक्टर की टिप्पणियों है n पैरामीटर के साथ एक वितरण से स्वतंत्र दोहराया टिप्पणियों θ एक submanifold से संबंधित बी 1 के आर डी के साथ आयाम मंद ( बी 1 ) = एस । चलो बी 0बी 1 एक submanifold साथ आयाम हो मंद ( बी 0l(θy)ynθB1Rddim(B1)=sB0B1 । कल्पना कीजिए कि आप परीक्षण कर रहे हैं में रुचि रखने वाले एच 0 : { θ बी 0 }dim(B0)=mH0:{θB0}

संभावना अनुपात है डिविज़नडी(y)=2लॉग(lr(y)) को परिभाषित करें। फिरविल्क्स की प्रमेयकहती है कि, सामान्य नियमितता मान्यताओं के तहत,d(y)asymptoticallyribut2-distributed withs-mकी स्वतंत्रता की डिग्री है जबH0सही होता है।

lr(y)=supθB1l(θy)supθB0l(θy).
d(y)=2log(lr(y))d(y)χ2smH0

यह विल्क के मूल पेपर में @Nick द्वारा उल्लिखित सिद्ध है। मुझे लगता है कि यह पेपर पढ़ना आसान नहीं है। विल्क्स ने बाद में एक पुस्तक प्रकाशित की, शायद उनकी प्रमेय की सबसे आसान प्रस्तुति। विलियम्स की उत्कृष्ट पुस्तक में एक छोटा सा प्रमाण दिया गया है ।


3
दुख की बात है कि इस प्रमेय का उल्लेख सैमुअल एस। विलक्स
स्टीफन लॉरेंट

5
ओह स्टीफन पर आते हैं। यह विकिपीडिया है, आप इसे संपादित कर सकते हैं और इसमें सुधार कर सकते हैं!
StasK

1
@StasK मुझे पता है कि लेकिन मैंने कभी कोशिश नहीं की। और मैं पहले से ही अपने जीवन का बहुत समय आँकड़ों और गणित के साथ बिताता हूँ;)
स्टीफन लॉरेंट

क्या इस बात का कोई अंतर्विरोध है कि 2 भक्ति की परिभाषा में लॉग के सामने क्यों है?
उपयोगकर्ता 56834

@ Programmer2134 यह एक दूसरे ऑर्डर टेलर विस्तार से लिया गया है।
फ्रैंक वेल

25

मैं निक सब्बे की कठोर टिप्पणी करता हूं, और मेरा संक्षिप्त जवाब है, यह नहीं है । मेरा मतलब है, यह केवल सामान्य रैखिक मॉडल में है। बिल्कुल परिस्थितियों के किसी भी अन्य प्रकार के लिए, सटीक वितरण एक नहीं है । कई स्थितियों में, आप उम्मीद कर सकते हैं कि विल्क्स के प्रमेय की स्थिति संतुष्ट हो, और फिर asymptotically लॉग-लाइबिलिटी अनुपात परीक्षण आँकड़े वितरण में χ 2 में परिवर्तित हो । विल्क्स की प्रमेय की शर्तों की सीमाएं और उल्लंघनों की अवहेलना बहुत अधिक है।χ2χ2

  1. प्रमेय आईआईडी डेटा मान लिया गया उम्मीद ऐसे समय श्रृंखला या असमान संभावना सर्वेक्षण के नमूने (जिसके लिए likelihoods खराब परिभाषित कर रहे हैं, वैसे भी रूप में आधारित डेटा के साथ मुद्दों; "नियमित" χ 2 तरह के आकस्मिक तालिकाओं में स्वतंत्रता परीक्षण के रूप में परीक्षण, व्यवहार करने एक योग के रूप Σ कश्मीर एक कश्मीर वी कश्मीर , वी कश्मीर ~ आईआईडी χ 2 1 ( राव और स्कॉट )। आईआईडी डेटा के लिए, एक कश्मीर = 1 , और योग बन जाता χ 2 । लेकिन गैर स्वतंत्र डेटा के लिए, यह नहीं है अब मामला है।χ2kakvk,vki.i.d.χ12ak=1χ2
  2. प्रमेय सही मान को पैरामीटर स्पेस के इंटीरियर में होना मानता है। यदि आपके पास काम करने के लिए यूक्लिडियन स्थान है, तो यह कोई समस्या नहीं है। हालांकि, कुछ समस्याओं में, प्राकृतिक प्रतिबंध, इस तरह के विचरण के रूप में उत्पन्न हो सकती है 0 या के बीच -1 और 1. सहसंबंध अगर सही पैरामीटर एक सीमा है, तो asymptotic वितरण का एक मिश्रण है χ 2 स्वतंत्रता के विभिन्न डिग्री के साथ, इस अर्थ में कि परीक्षण का cdf (cdfs 2001 का एंड्रयूज , प्लस टू और इसी अवधि के उनके दो या तीन से अधिक कागजात का योग है , इतिहास के साथ चेरोफ़ 1954 में वापस जा रहा है )।χ2
  3. प्रमेय मानता है कि सभी प्रासंगिक व्युत्पन्न गैर-शून्य हैं। इसे कुछ अशुभ समस्याओं और / या मापदंडों के साथ चुनौती दी जा सकती है, और / या ऐसी स्थितियां जब कोई पैरामीटर अशक्त के तहत पहचाना नहीं जाता है। मान लीजिए आप एक गाऊसी मिश्रण मॉडल है, और अपने अशक्त एक घटक है बनाम दो अलग-अलग घटकों के विकल्प एन ( μ 1 , σ 2 1 ) + ( 1 - ) एन ( μ 2 , σ 2 2 )N(μ0,σ02)fN(μ1,σ12)+(1f)N(μ2,σ22)एक मिश्रण अंश के साथ । अशक्त जाहिरा तौर पर विकल्प में नीडिंत है, लेकिन यह विभिन्न तरीकों से में व्यक्त किया जा सकता है: के रूप में = 0 (इस स्थिति में मानकों μ 1 , σ 2 1 की पहचान नहीं कर रहे हैं), = 1 (इस स्थिति में μ 2 , σ 2 2 की पहचान नहीं कर रहे हैं), या μ 1 = μ 2 , σ 1 = σ 2 (इस स्थिति में ff=0μ1,σ12f=1μ2,σ22μ1=μ2,σ1=σ2fपहचानी नह) ं है। यहां, आप यह भी नहीं कह सकते हैं कि आपके परीक्षण में कितनी डिग्री की स्वतंत्रता होनी चाहिए, क्योंकि आपके पास अलग-अलग संख्या में प्रतिबंध हैं जो इस बात पर निर्भर करते हैं कि आप कैसे नेस्टिंग का मानकीकरण करते हैं। इस पर जियाहुआ चेन का काम देखें, उदाहरण के लिए सीजेएस 2001
  4. ठीक काम करता है, तो वितरण सही ढंग से निर्दिष्ट किया गया है हो सकता है। लेकिन अगर यह नहीं था, तो परीक्षण फिर से टूट जाएगा। संरचनात्मक समीकरण सहसंयोजक मॉडलिंग के रूप में जाना जाने वाले बहुभिन्नरूपी विश्लेषण के सबरेआ (बड़े पैमाने पर सांख्यिकीविदों द्वारा उपेक्षित) में, बहुभिन्नरूपी सामान्य वितरण को अक्सर मान लिया जाता है, लेकिन भले ही संरचना सही हो, वितरण अलग-अलग होने पर परीक्षण गलत होगा। Satorra और Bentler 1995 बताते हैं कि वितरण हो जाएगा Σ k एक कश्मीर वी कश्मीर , वी कश्मीर ~ आईआईडी χ 2 1 , मेरी बात 1 में गैर स्वतंत्र डेटा के साथ के रूप में ही कहानी है, लेकिन वे भी जता चुके हैं कि कैसेχ2kakvk,vki.i.d.χ12 रों मॉडल की संरचना और वितरण के चौथे क्षणों पर निर्भर हैं।ak
  5. परिमित नमूने लिए, स्थितियों संभावना अनुपात का एक बड़ा वर्ग में है बार्टलेट-correctible : जबकि के लिए आकार का एक नमूना n , और एफ ( एक्स , χ 2 ) के वितरण समारोह किया जा रहा χ 2 Prob[d(y)x]=F(x;χd2)[1+O(n1)]nF(x;χd2)χd2वितरण, नियमित रूप से संभावना समस्याओं के लिए आप एक निरंतर पा सकते हैं ऐसी है कि पी आर बी [ ( y ) / ( 1 + / n ) एक्स ] = एफ ( एक्स , χ 2 ) [ 1 + हे ( n - 2 ) ] , यानी, सटीकता के उच्च क्रम के लिए। तो χ bProb[d(y)/(1+b/n)x]=F(x;χd2)[1+O(n2)]χ2परिमित नमूनों के लिए सन्निकटन में सुधार किया जा सकता है (और यदि आप जानते हैं तो यकीनन सुधार किया जाना चाहिए)। निरंतर मॉडल की संरचना पर निर्भर करता है, और कभी-कभी सहायक मापदंडों पर, लेकिन अगर यह लगातार अनुमान लगाया जा सकता है, तो वह काम करता है, कवरेज के क्रम में सुधार करने में भी।b

इन और इसी तरह की गूढ़ बातों की समीक्षा के लिए संभावना के संदर्भ में, स्मिथ 1989 देखें ।


1
धन्यवाद! बहुत शिक्षाप्रद। "केवल सामान्य लीनियर मॉडल में है" से आपका क्या तात्पर्य है ? फिशर टेस्ट के लिए जब और बी 1 रैखिक उप-स्थान होते हैं, तो डिवोर्स फिशर स्टेटिस्टिक का एक मोनोटोन फ़ंक्शन होता है, और यह केवल एसिम्पटोटिक χ 2 हैB0B1 χ2
स्टीफन लॉरेंट

ज्ञात प्रसरण के साथ, मुझे जोड़ना चाहिए।
19
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.