"टाई मौजूद नहीं होना चाहिए" आर में एक-नमूना कोलमगोरोव-स्मिरनोव परीक्षण में


12

मैं आर में MYDATA की सामान्यता का परीक्षण करने के लिए कोलमोगोरोव-स्मिरनोव परीक्षण का उपयोग करने जा रहा हूं। यह एक उदाहरण है कि मैं क्या करता हूं

 ks.test(MYDATA,"pnorm",mean(MYDATA),sd(MYDATA))

यहाँ परिणाम आर मुझे देता है:

 data:  MYDATA
 D = 0.13527, p-value = 0.1721
 alternative hypothesis: two-sided

 Warning message:
 In ks.test(MYDATA, "pnorm", mean(MYDATA), sd(MYDATA)) :
    ties should not be present for the Kolmogorov-Smirnov test

मुझे लगता है कि एक समस्या है, इस चेतावनी में "संबंध" का क्या मतलब है?


2
आप इस सामान्य परीक्षण को क्यों करना चाहते हैं? ज्यादातर मामलों में, एक चर की सामान्यता का परीक्षण करना बहुत बेकार है , हालांकि एक प्रतिगमन के बाद अवशिष्टों की सामान्यता का परीक्षण करना महत्वपूर्ण हो सकता है।
एड्म

2
बिना संबंधों के भी, केएस परीक्षण सामान्य सामान्यता के लिए एक परीक्षण नहीं है, लेकिन पूरी तरह से निर्दिष्ट वितरण के लिए (आप डेटा के माध्यम और एसडी का अनुमान लगा रहे हैं)। आपके पी-वैल्यू बकवास होंगे। Lilliefors परीक्षण के संदर्भ के लिए हमारी साइट खोजें
Glen_b -Reinstate Monica

जवाबों:


10

आपको यहां दो समस्याएं हैं:

केएस परीक्षण एक सतत वितरण के लिए है और इसलिए MYDATA में कोई संबंध (दोहराया मान) नहीं होना चाहिए।

केएस परीक्षण अंतर्निहित सिद्धांत आपको डेटा से वितरण के मापदंडों का अनुमान लगाने की अनुमति नहीं देता है जैसा कि आपने किया है। Ks.test के लिए मदद यह बताती है।


ks.testएक दो-नमूना मामले में क्यों चाहता है कि संबंधों को दोनों से हटा दिया जाए xऔर y? मेरा मतलब है, मैं कोई संबंध में है xऔर y( unique(x)और unique(y)), लेकिन दो वैक्टर आम में एक मूल्य है। संबंधों में ही मूल्यों के बीच विचार किया जा नहीं करना चाहिए xऔर में y?
नेमसेई

@ नीमसी यदि आपके पास कोई नया प्रश्न है, तो कृपया प्रश्न पूछें बटन का उपयोग करके इसे पूछें।
mdewey

मैं इस हालांकि एक अलग प्रश्न होने के लिए पर्याप्त नहीं था, लेकिन यहाँ यह है: stats.stackexchange.com/questions/389151/...
NEMESI

5

जैसा कि @mdewey द्वारा समझाया गया है, डेटा से मापदंडों का आकलन करते समय KS परीक्षण उपयुक्त नहीं है। आप निम्न कोड का उपयोग कर सकते हैं, जो सामान्यता के लिए एंडरसन-डार्लिंग परीक्षण पर निर्भर करता है, और आपको माध्य और stddev की आपूर्ति करने की आवश्यकता नहीं है। यह परीक्षण Lilliefors परीक्षण की तुलना में सटीकता में अधिक मजबूत है।

install.packages("nortest")
library(nortest)
ad.test(MYDATA)

"सटीकता" एक संकीर्ण लेकिन पथभ्रष्ट खोज के लिए हो सकती है। दोनों मामलों में, इन परीक्षणों में से अधिकांश के आवेदन सबसे खराब बेकार हैं और अधिकांश मामलों में भ्रामक हैं। लोगों को अक्सर प्रतिगमन विधियों के बारे में मान्यताओं की गलत समझ वाले व्यक्तियों द्वारा उनका उपयोग करना सिखाया जाता है। मैं केएस-परीक्षण की सापेक्ष कमजोरी का पता लगाता हूं कि यह वास्तव में "बेहतर" होगा कि इसका उपयोग करने के लिए अधिक शक्तिशाली विकल्प क्योंकि इसके परिणाम भोले उपयोगकर्ता को भ्रमित करने की कम संभावना होगी।
डबिन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.