फिट टेस्ट की अच्छाई: एंडरसन के बारे में सवाल-डार्लिंग टेस्ट और क्रैमेर-वॉन मेंस कसौटी


10

मैं फिट परीक्षणों की भलाई के लिए वेब पेज पढ़ रहा हूं, जब मैं एंडरसन-डार्लिंग परीक्षण और क्रामर-वॉन मिज़ कसौटी पर आया था

अब तक मुझे वह बात मिल गई थी; ऐसा लगता है कि एंडरसन-डार्लिंग परीक्षण और Cramér-von Mises मानदंड समान हैं, बस एक अलग वज़निंग फ़ंक्शन पर आधारित है । इसके अलावा वॉट्सन टेस्ट नाम के क्रैमेर-वॉन मिल्स कसौटी का एक संस्करण है ।w

मूल रूप से मेरे यहाँ दो प्रश्न हैं

  1. इन दो तरीकों के बारे में कई Google परिणाम नहीं हैं; क्या वे अभी भी अत्याधुनिक हैं? या पहले से ही कुछ बेहतर दृष्टिकोणों द्वारा प्रतिस्थापित किया गया है?

    शापिरो-विल्क, कोलमोगोरोव-स्मिरनोव, लिलीफोरस और एंडरसन-डार्लिंग परीक्षणों की शक्ति तुलनाओं पर इस पत्र के अनुसार, यह एक आश्चर्य की बात है , ईडी काफी अच्छा प्रदर्शन कर रहा है; हमेशा Lilliefors और KS से बेहतर, और SW परीक्षण के बहुत करीब, जो विशेष रूप से सामान्य वितरण के लिए डिज़ाइन किया गया है।

  2. इस तरह के परीक्षणों के लिए आत्मविश्वास अंतराल क्या है?

    AD, CM और Watson परीक्षणों के लिए, मैंने विकी पृष्ठों पर परिभाषित परीक्षण आँकड़े चर को देखा, लेकिन विश्वास अंतराल नहीं पाया।

    KS परीक्षण के लिए चीजें बस अधिक सीधी हैं: विकी पृष्ठ पर , विश्वास अंतराल द्वारा परिभाषित किया गया है , जिसे के संचयी वितरण फ़ंक्शन से परिभाषित किया गया है । केα

जवाबों:


4

फिट की भलाई के लिए कोई भी अत्याधुनिक नहीं हो सकता है (उदाहरण के लिए सामान्य विकल्पों में कोई यूएमपी परीक्षण मौजूद नहीं होगा, और वास्तव में कुछ भी करीब नहीं आता है - यहां तक ​​कि अत्यधिक माना जाने वाला सर्वग्राही परीक्षणों में कुछ स्थितियों में भयानक शक्ति होती है)।

सामान्य तौर पर जब एक टेस्ट स्टैटिस्टिक का चयन करते हैं तो आप विचलन के प्रकारों का चयन करते हैं जो कि टेस्ट स्टैटिस्टिक्स का पता लगाना और उसका उपयोग करना सबसे महत्वपूर्ण है जो उस नौकरी के लिए अच्छा है। कुछ परीक्षण बहुत सारे दिलचस्प विकल्पों में से एक बहुत अच्छी तरह से करते हैं, जो उन्हें सभ्य डिफ़ॉल्ट विकल्प बनाते हैं, लेकिन यह उन्हें "कला की स्थिति" नहीं बनाता है।

एंडरसन डार्लिंग अभी भी बहुत लोकप्रिय है, और अच्छे कारण के साथ। Cramer-von Mises परीक्षण इन दिनों बहुत कम उपयोग किया जाता है (मेरे आश्चर्य के लिए क्योंकि यह आमतौर पर Kolmogorov-Smirnov से बेहतर है, लेकिन एंडरसन-डार्लिंग की तुलना में सरल है - और अक्सर बीच में मतभेदों की तुलना में बेहतर शक्ति होती है " बंटवारा)

ये सभी परीक्षण कुछ प्रकार के विकल्पों के खिलाफ पूर्वाग्रह से ग्रस्त हैं, और उन मामलों को खोजना आसान है जहां एंडरसन-डार्लिंग अन्य परीक्षणों की तुलना में बहुत खराब (बहुत, वास्तव में) करते हैं। (जैसा कि मैं सुझाव देता हूं, यह उन सभी पर शासन करने के लिए एक परीक्षण से अधिक 'घोड़ों के लिए पाठ्यक्रम' है)। इस मुद्दे पर अक्सर थोड़ा विचार किया जाता है (जो मेरे लिए सबसे ज्यादा मायने रखता है?), दुर्भाग्य से।

आपको इनमें से कुछ पोस्टों में कुछ मूल्य मिल सकते हैं:

क्या शापिरो-विलक सबसे अच्छा सामान्यता परीक्षण है? यह एंडरसन-डार्लिंग जैसे अन्य परीक्षणों से बेहतर क्यों हो सकता है?

2 नमूना कोलमोगोरोव-स्मिरनोव बनाम एंडरसन-डार्लिंग बनाम क्रामर-वॉन-मिसेस (लगभग दो-नमूना परीक्षण लेकिन कई बयानों पर

वितरण के बीच कोलमोगोरोव के लिए प्रेरणा (अधिक सैद्धांतिक चर्चा लेकिन व्यावहारिक प्रभाव के बारे में कई महत्वपूर्ण बिंदु हैं)


मुझे नहीं लगता कि आप Cramer-von Mises और Anderson Darline आँकड़ों में cdf के लिए एक विश्वास अंतराल बनाने में सक्षम होंगे, क्योंकि मानदंड केवल सबसे बड़े के बजाय सभी विचलन पर आधारित हैं।


मैंने "स्टेट ऑफ़ द आर्ट" का अर्थ कुछ ऐसा निकाला जो ऐसा उपयोग करता है जो अश्लील नहीं है। कई अच्छाई-की-फिट परिभाषाओं का अस्तित्व हमें संकेत करना चाहिए कि अच्छाई-फिट एक एकल अवधारणा नहीं है। विचार करें कि "अच्छा" इस बात पर निर्भर करता है कि हम क्यों "प्रतिगमन" कर रहे हैं। मान लें कि हम प्रभाव ए का एक सर्वश्रेष्ठ भविष्यवक्ता प्राप्त करने के लिए मॉडल ए को डेटा बी में फिट कर रहे हैं। फिर "अच्छा" सी नहीं बी का सबसे अच्छा भविष्यवक्ता है। हालांकि, अक्सर यह सवाल है कि बी और सी के अंतर को कैसे अनदेखा किया जाता है।
कार्ल

1
@Carl आप एक शब्दकोश (या विकिपीडिया) की जांच करना चाहते हैं कि आमतौर पर कला किस स्थिति में होती है - वाक्यांश की आपकी व्याख्या यह नहीं है कि अधिकांश लोग वाक्यांश को कैसे पढ़ते हैं। डिक्शनर्स इस तरह की बातें कहते हैं: " विकास में सबसे हालिया चरण, नवीनतम विचारों को शामिल करना " और " एक निश्चित समय में विकास का उच्चतम स्तर " और " नवीनतम तकनीक का उपयोग करते हुए बढ़त "। इस संदर्भ में - फिट की अच्छाई का परीक्षण - वाक्यांश का अर्थ है "सबसे अच्छा हम संभवतः अभी कर सकते हैं"। मैं जोर देकर कहता हूं कि ऐसा कुछ नहीं है जो आप वास्तव में किसी एक परीक्षण के बारे में कह सकें। ... ctd
Glen_b -Reinstate मोनिका

2
... उदाहरण के लिए, हम कह सकते हैं कि लोकप्रिय परीक्षण जैसे कि शपीरो-विल्क (जबकि परीक्षण सामान्यता में बहुत लोकप्रिय) के पास मोटे तौर पर बेहतर शक्ति वाले प्रतियोगी हैं (जैसे शापिरो और चेन 1995 देखें) - लेकिन हर स्थिति में नहीं। परीक्षण का कोई सबसे अच्छा विकल्प नहीं है (और इसलिए, कोई वास्तविक 'कला की स्थिति')। निश्चित रूप से मैं इस बात से सहमत हूं कि जो सबसे अच्छा है (कला का राज्य) परिस्थितियों पर निर्भर करता है --- यही मेरे उत्तर की बात है; संभव जवाब असंख्य हैं - एक स्थिति में कुछ अच्छा दूसरे में बहुत खराब हो सकता है। यह जानने के लिए भुगतान करता है कि परीक्षण "अच्छा क्या है" के लिए पूछने के बजाय अच्छा प्रदर्शन करते हैं जैसे कि यह एक ही बात थी।
Glen_b -Reinstate मोनिका

सच है, आपकी परिभाषा अधिक सही है। हालांकि, तरीकों के परीक्षणों की तुलना में कई अधिक विधियां हैं, और "कला की स्थिति" काफी हद तक काल्पनिक है, अर्थात, "कला" में कोई "राज्य" नहीं है, यह सभी नायक हैं। इस तरह के एक नेबुली पॉज़िट का कोई भी जवाब नहीं है। मैंने yes हाँ ’कहा और आपने 'नहीं’ कहा और हम दोनों ने एक ही बात कही।
कार्ल

BTW, प्रश्न "कला की स्थिति" या "प्रतिस्थापित" था जिसका मैंने अर्थ लिया "अप्रचलित, या अप्रचलित नहीं"। तो मेरे जवाब के लिए एक संदर्भ था जो संदर्भ था "कृपया मान लें कि 'कला की स्थिति' और 'प्रतिस्थापित' विलोम हैं, और कृपया उनमें से किसी एक को चुनें।" आप सही हैं कि वे विलोम नहीं हैं, मैं संदर्भ में जवाब दे रहा था और आपने सवाल का जवाब देने के लिए चुना। तो, मेरा विनम्र जवाब था। और, मैं आपके उत्तर के लिए वोट करने जा रहा हूं, क्योंकि मुझे लगता है कि यह जानकारीपूर्ण है, अगर अति विनम्र नहीं है।
कार्ल

2

n=400 Kolmogorov-Smirnov परीक्षण की तुलना में अधिक शक्तिशाली संचयी घनत्व फ़ंक्शन अच्छाई-की-फिट परीक्षण है और टी-परीक्षण से अधिक या कम शक्ति हो सकती है। ची-स्क्वॉयर को कम सेल काउंट के साथ कठिनाई होती है, इसलिए रेंजिंग प्रतिबंधों का उपयोग फिटिंग पूंछ के लिए किया जाता है।

** प्रश्न १: ... क्या ... ये दो विधियाँ हैं ... अभी भी अत्याधुनिक हैं? या पहले से ही कुछ बेहतर दृष्टिकोणों द्वारा प्रतिस्थापित किया गया है? प्रश्न 2 ऐसे परीक्षणों के लिए आत्मविश्वास अंतराल क्या है? **

उत्तर: वे कला के राज्य हैं। हालाँकि, कभी-कभी हम चाहते हैं कि आत्मविश्वास अंतराल संभव न हो। जब इन तरीकों की एक दूसरे से तुलना करते हैं तो हम आत्मविश्वास अंतराल के बजाय शक्ति की बात करते हैं। कभी-कभी अच्छाई-की-फिट का विश्लेषण एआईसी, बीआईसी और अन्य मानदंडों का उपयोग करके किया जाता है, जो कि अच्छी फिटिंग की संभावनाओं के विपरीत होता है, और कभी-कभी अच्छाई-के-फिट की कसौटी अप्रासंगिक होती है, उदाहरण के लिए, जब अच्छाई-फिट फिट करने के लिए मापदंड नहीं है । बाद के मामले में, हमारा प्रतिगमन लक्ष्य एक भौतिक मात्रा हो सकता है जो फिटिंग से संबंधित नहीं है, उदाहरण के लिए, टीके-जीवी देखें


एनबी द एंडरसन-डार्लिंग परीक्षण क्रैमर-वॉन मीज़ टेस्ट का एक भारित संस्करण है; और, यह किसी भी निरंतर वितरण के लिए उपयुक्त है।
Scortchi - को पुनः स्थापित मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.