क्या मैं दो अनुभवजन्य वितरणों की तुलना करने के लिए कोलमोगोरोव-स्मिरनोव का उपयोग कर सकता हूं?


16

क्या दो अनुभवजन्य वितरणों की तुलना करने के लिए कोल्मोगोरोव-स्मिरनोव अच्छाई-से-फिट परीक्षण का उपयोग करना ठीक है यह निर्धारित करने के लिए कि क्या वे समान अंतर्निहित वितरण से आए हैं, बजाय एक अनुभवजन्य वितरण की पूर्व-निर्दिष्ट संदर्भ वितरण से तुलना करने के लिए?

मुझे यह एक और तरीका पूछने की कोशिश करें। मैं एक स्थान पर कुछ वितरण से एन नमूने एकत्र करता हूं। मैं दूसरे स्थान पर एम नमूने एकत्र करता हूं। डेटा निरंतर है (प्रत्येक नमूना 0 और 10 के बीच एक वास्तविक संख्या है, कहते हैं) लेकिन सामान्य रूप से वितरित नहीं किया जाता है। मैं परीक्षण करना चाहता हूं कि क्या ये एन + एम नमूने सभी एक ही अंतर्निहित वितरण से आते हैं। क्या इस उद्देश्य के लिए कोलमोगोरोव-स्मिर्नोव परीक्षण का उपयोग करना उचित है?

विशेष रूप से, मैं नमूनों से अनुभवजन्य वितरण और नमूनों से अनुभवजन्य वितरण गणना कर सकता हूं । फिर, मैं और बीच की दूरी को मापने के लिए Kolmogorov-Smirnov परीक्षण आंकड़े की गणना कर सकता हूं : यानी, गणना करें, और फिट की भलाई के लिए कोलमोगोरोव-स्मिरनोव परीक्षण में डी का उपयोग मेरे परीक्षण सांख्यिकीय के रूप में करें। क्या यह एक उचित दृष्टिकोण है?एफ0एनएफ1एफ0एफ1डी=सुड़कनाएक्स|एफ0(एक्स)-एफ1(एक्स)|डी

(मैं कहीं और पढ़ता हूं कि फिट की भलाई के लिए कोलमोगोरोव-स्मिरनोव परीक्षण असतत वितरण के लिए मान्य नहीं है , लेकिन मैं मानता हूं कि मुझे यह समझ में नहीं आया कि इसका क्या मतलब है या यह क्यों सच हो सकता है। क्या इसका मतलब है कि मेरा प्रस्तावित दृष्टिकोण एक बुरा है? )

या, आप इसके बजाय कुछ और सलाह देते हैं?


मुझे आश्चर्य है कि क्या यहाँ @ Glen_b की टिप्पणियों के आधार पर ( आँकड़ें ।stackexchange.com/questions/362/… ), किसी को अनुभवजन्य वितरण की तुलना करने के लिए KS परीक्षण का उपयोग नहीं करना चाहिए क्योंकि जब पैरामीटर का अनुमान लगाया जाता है तो KS परीक्षण का उपयोग नहीं किया जाना चाहिए? )।
रुसलपिएरेस

जवाबों:


19

यह ठीक है, और काफी उचित है। इसे दो-नमूना कोलमोगोरोव-स्मिर्नोव परीक्षण के रूप में जाना जाता है । सुपरनॉर्म द्वारा दो वितरण कार्यों के बीच अंतर को मापने हमेशा समझदार होता है, लेकिन एक औपचारिक परीक्षण करने के लिए आप इस परिकल्पना के तहत वितरण जानना चाहते हैं कि दो नमूने स्वतंत्र हैं और प्रत्येक अंतर्निहित वितरण से प्रत्येक iid है। सामान्य विषम सिद्धांत पर भरोसा करने के लिए आपको अंतर्निहित सामान्य वितरण (अनुभवजन्य वितरणों की नहीं) की निरंतरता की आवश्यकता होगी। अधिक विवरण के लिए ऊपर से जुड़ा विकिपीडिया पृष्ठ देखें।

आर में, आप उपयोग कर सकते हैं ks.test, जो छोटे नमूना आकारों के लिए सटीक गुण की गणना करता है । पी


8
आर में आप भी एक बूटस्ट्रैप एस परीक्षण कर सकते हैं sekhon.berkeley.edu/matching/ks.boot.html जो निरंतरता आवश्यकता से छुटकारा हो जाता है
डॉ जी

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.