क्या कोलमोगोरोव-स्मिरनोव परीक्षण असतत वितरण के साथ वैध है?


29

मैं एक नमूने की तुलना कर रहा हूं और यह जांच रहा हूं कि क्या यह कुछ, असतत, वितरण के रूप में वितरित करता है। हालाँकि, मुझे पूरा यकीन नहीं है कि Kolmogorov-Smirnov लागू होता है। विकिपीडिया को लगता है कि इसका मतलब यह नहीं है। यदि यह नहीं है, तो मैं नमूने के वितरण का परीक्षण कैसे कर सकता हूं?


+1 गलती से (कई) संबंधों के साथ केएस टेस्ट को डेटा पर लागू करने का एक सुंदर उदाहरण एक एक्सेल आँकड़े ऐड-ऑन के लिए वास्तविक पृष्ठ पर दिया गया है। परीक्षण /… । परिणाम कई कारणों से गलत है। कैवेट लेक्टर!
whuber

असतत अशक्त वितरण के लिए केएस-परीक्षण उपलब्ध हैं: en.wikipedia.org/wiki/…
Astrid

जवाबों:


14

यह असतत वितरण पर लागू नहीं होता है। उदाहरण के लिए http://www.itl.nist.gov/div898/handbook/eda/section3/eda35g.htm देखें ।

क्या कोई कारण है कि आप फिट परीक्षण के ची-स्क्वायर अच्छाई का उपयोग नहीं कर सकते हैं? अधिक जानकारी के लिए http://www.itl.nist.gov/div898/handbook/eda/section3/eda35f.htm देखें ।


घुसपैठ के लिए खेद है, लेकिन मुझे वास्तव में समझ में नहीं आता है कि यह केवल निरंतर वितरण (केएस और अन्य सत्यापन परीक्षणों) पर क्यों लागू होता है। क्या कोई मुझे यह तथ्य समझा सकता है?
मौरिजियो

6
@ मौरिज़ियो - केएस परीक्षण आँकड़ा सभी निरंतर वितरणों के तहत समान वितरण है , लेकिन यदि वास्तविक वितरण निरंतर नहीं है, और कोई यह मानकर एक स्तर परीक्षण का निर्माण करने की कोशिश करता है कि वितरण निरंतर है, तो परीक्षण का वास्तविक स्तर से कम हो । (सीएफ लेहमन एंड रोमानो टेस्टिंग स्टैटिस्टिकल हाइपोथेसिस, तीसरा संस्करण , पृष्ठ 584)। आप अभी भी केएस आंकड़े के आधार पर एक स्तर परीक्षण कर सकते हैं , लेकिन आपको अनुकरण के लिए महत्वपूर्ण मूल्य, उदाहरण के लिए कुछ अन्य तरीका खोजना होगा। ααα
डेविड आरटी

एक असतत केएस-परीक्षण है: stat.yale.edu/~jay/EmersonMaterials/DiscreteGOF.pdf
Astrid

7

जैसा कि आंकड़ों में अक्सर होता है, यह इस बात पर निर्भर करता है कि आपका क्या मतलब है

  1. यदि आपका मतलब है "मैं एक असतत वितरण से खींचे गए नमूने पर अपने परीक्षण सांख्यिकीय की गणना करता हूं और फिर मानक तालिकाओं को देखता हूं" तो आपको एक सही प्रकार की त्रुटि मिलेगी जिसे आपने चुना था (संभवतः बहुत कम)।

    वितरण कितना "असतत" पर निर्भर करता है। यदि किसी एक परिणाम की संभावना काफी कम है (इसलिए डेटा में बंधे-मूल्य का अनुपात कम होने की उम्मीद होगी) तो यह बहुत ज्यादा मायने नहीं रखेगा - बहुत से लोगों को 5 चलाने में कोई समस्या नहीं होगी 4.5% पर% परीक्षण कहते हैं। उदाहरण के लिए, यदि आप [1,1000] पर एक असतत वर्दी का परीक्षण कर रहे हैं, तो आपको शायद चिंता करने की आवश्यकता नहीं है।

    लेकिन अगर किसी मूल्य के बंधे होने की उच्च संभावना है, तो I त्रुटि दर के प्रकार पर प्रभाव को चिह्नित किया जा सकता है। यदि आप 0.05 चाहते हैं तो आपको 0.005 का महत्व स्तर मिलता है, जो कि एक मुद्दा हो सकता है, क्योंकि यह शक्ति पर प्रभाव डालेगा।

  2. यदि इसके बजाय आपका मतलब है "मैं एक असतत वितरण से खींचे गए नमूने पर अपने परीक्षण सांख्यिकीय की गणना करता हूं और फिर एक उपयुक्त महत्वपूर्ण मूल्य का उपयोग करता हूं / मेरी स्थिति के लिए एक उपयुक्त पी-मूल्य की गणना करें" (उदाहरण के लिए, क्रमपरिवर्तन परीक्षण के माध्यम से), फिर परीक्षण निश्चित रूप से इस मायने में मान्य है कि आपको सही प्रकार की त्रुटि दर मिल जाएगी - टेस्ट स्टेटिस्टिक की विसंगति तक, बिल्कुल। (हालांकि आपके विशेष उद्देश्य के लिए बेहतर परीक्षण हो सकते हैं, जैसे कि आमतौर पर निरंतर मामले में होते हैं।)

    ध्यान दें कि परीक्षण-सांख्यिकी का वितरण स्वयं वितरण-मुक्त नहीं है, लेकिन एक क्रमपरिवर्तन-परीक्षण उस मुद्दे से बचता है।

इसलिए कभी-कभी असतत वितरण के साथ भी मानक तालिकाओं का उपयोग करना ठीक होता है, और जब ठीक नहीं भी होता है, तो भी यह परीक्षण सांख्यिकीय नहीं होता है क्योंकि आपके द्वारा उपयोग किए जाने वाले महत्वपूर्ण मानों / पी-मानों का यही मुद्दा है।


ग्लेन हमेशा की तरह, आपका जवाब उच्च गुणवत्ता वाला है। लेकिन शायद इसके बारे में सबसे अच्छी बात यह है कि आपने वास्तव में इस पोस्ट में मेरे द्वारा किए गए मजाक को "सांख्यिकी पर आधारित" कहा है! आंकड़े.stackexchange.com/questions/182442/…
कहना है कि मोनिका

1
@ user777 जो आकस्मिक नहीं था; यह मुझे चकित करता है, और मैं सोच रहा था कि मैं इस प्रश्न को "अच्छी तरह से पढ़ता हूं, यह निर्भर करता है" ... इसलिए मैंने स्पष्ट रूप से यह कहना सुनिश्चित किया कि आपकी पोस्ट को प्रतिध्वनित किया जाए।
Glen_b -Reinstate मोनिका

1
मेरी शाम बस बेहतर हुई। चीयर्स!
साइकोरैक्स का कहना है कि मोनिका

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.