2 अनुभवजन्य असतत वितरण के बीच अंतर के लिए टेस्ट


14

मेरे पास परीक्षण डेटा है जहां मेरे पास असतत वितरण से कई बड़े नमूने हैं जो मैं अनुभवजन्य वितरण के रूप में उपयोग कर रहा हूं। मैं परीक्षण करना चाहता हूं कि क्या वितरण वास्तव में अलग हैं और उन वितरणों के लिए साधनों में क्या अंतर है जो वास्तव में अलग हैं।

चूंकि वे असतत वितरण हैं, मेरी समझ यह है कि कोलमोगोरोव-स्मिरनोव परीक्षण अंतर्निहित निरंतरता की धारणा के कारण अमान्य है। क्या ची-चुकता परीक्षण सही परीक्षण होगा कि क्या वितरण वास्तव में अलग हैं?

साधनों में अंतर के लिए मैं किस परीक्षण का उपयोग करूंगा? क्या डिस्ट्रीब्यूशन से नमूना लेना और अंतर लेना बेहतर होगा और फिर अंतर के वितरण पर विश्लेषण करना होगा?


हाँ χ2-टेस्ट सही है। इस प्रश्न का स्वीकृत उत्तर उस पर विस्तृत है। वितरण 1 = कलश 1 और वितरण 2 = कलश 2 । वहाँ, यादृच्छिक चर के मूल्य रंग हैं और आपके मामले में शायद कुछ और है, जैसे असतत संख्या।
जॉर्ज शेंबेल

धन्यवाद प्रतिक्रिया देना के लिए। क्या ची-स्क्वेर्ड टेस्ट से इस बात की पुष्टि होती है कि वितरण भिन्न हैं या नहीं?
1933 में

क्या डिस्ट्रीब्यूशन से नमूना लेने और अंतर लेने के लिए बेहतर दृष्टिकोण होगा और फिर अंतर पर विश्लेषण करेंगे?
वाल्डहुड

जवाबों:


13

1) कोलमोगोरोव-स्मिरनोव अभी भी इस्तेमाल किया जा सकता है, लेकिन यदि आप सारणीबद्ध महत्वपूर्ण मानों का उपयोग करते हैं तो यह रूढ़िवादी होगा (जो केवल एक समस्या है क्योंकि यह आपके पावर वक्र को नीचे धकेलता है)। सांख्यिकीय के क्रमपरिवर्तन वितरण को प्राप्त करने के लिए बेहतर है, ताकि आपके महत्व का स्तर वही हो जो आप उन्हें चुनते हैं। यह केवल एक बड़ा अंतर होगा अगर बहुत सारे संबंध हैं। यह परिवर्तन वास्तव में लागू करना आसान है। (लेकिन केएस परीक्षण केवल इस तरह की तुलना संभव नहीं है; यदि कोई भी किसी भी तरह से क्रमपरिवर्तन वितरण की गणना कर रहा है, तो अन्य विकल्प हैं)

2) असतत डेटा के लिए फिट परीक्षणों की वेनिला ची-स्क्वायर अच्छाई आम तौर पर, मेरे दिमाग में, एक बहुत बुरा विचार है। यदि शक्ति के उपरोक्त संभावित नुकसान ने आपको केएस परीक्षण का उपयोग करना बंद कर दिया है, तो ची-स्क्वायर के साथ समस्या अक्सर बहुत खराब होती है - यह सबसे महत्वपूर्ण जानकारी को बाहर फेंक देता है, जो कि श्रेणियों (अवलोकन मूल्यों) के बीच क्रमबद्धता है, इसकी शक्ति का बचाव करते हुए इसे उन विकल्पों में फैलाकर, जो ऑर्डर देने पर विचार नहीं करते हैं, ताकि यह चिकनी विकल्पों का पता लगाने में खराब हो - जैसे स्थान का बदलाव और उदाहरण के लिए पैमाना)। ऊपर के भारी संबंधों के बुरे प्रभावों के बावजूद, कई मामलों में केएस परीक्षण में अभी भी बेहतर शक्ति है (जबकि अभी भी टाइप I त्रुटि दर कम है)।

आदेश को ध्यान में रखने के लिए ची-स्क्वायर को भी संशोधित किया जा सकता है (ऑर्थोगोनल पॉलीओनियम्स के माध्यम से रैखिक, द्विघात, घन आदि घटकों में विभाजन को कम करने के लिए केवल कुछ आदेशों का उपयोग करें - 4 से 6 सामान्य विकल्प हैं)। रैपर और बेस्ट (और अन्य) के पेपर इस दृष्टिकोण पर चर्चा करते हैं, जो नेमैन-बार्टन के चिकनी परीक्षणों से निकलता है। यह एक अच्छा तरीका है, लेकिन अगर आपके पास इसके लिए सॉफ्टवेयर तक पहुंच नहीं है, तो थोड़ी सी सेटिंग हो सकती है।

या तो संशोधित दृष्टिकोण ठीक होना चाहिए, लेकिन यदि आप या तो दृष्टिकोण को संशोधित नहीं करने जा रहे हैं, तो जरूरी नहीं कि ची-वर्ग KS परीक्षण से बेहतर होगा - कुछ स्थितियों में यह बेहतर हो सकता है ... या यह काफी हद तक बदतर हो सकता है।

यदि संबंध भारी नहीं हैं (यानी डेटा द्वारा लिए गए बहुत सारे मूल्य हैं), तो मैं केएस को इस प्रकार मानूंगा। यदि वे उदारवादी हैं, तो मैं क्रमचय वितरण की गणना करना चाहूंगा। यदि वे बहुत भारी हैं (यानी डेटा केवल कुछ अलग मान लेते हैं), सादा ची-वर्ग प्रतिस्पर्धी हो सकता है।


चेतावनी के लिए धन्यवाद। जब मैं केएस टेस्ट या ची-
स्क्वायड
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.