मेरा वितरण सामान्य है; Kolmogorov-Smirnov परीक्षण सहमत नहीं है


15

मेरे पास कुछ डेटा की सामान्यता के साथ एक समस्या है: मैंने कोलमोगोरोव परीक्षण किया है जो कहता है कि यह पी = .0000 के साथ नहीं है, मुझे समझ में नहीं आता है: मेरे वितरण का तिरछा होना = - 497, और द कर्टोसिस = -0,024

यहाँ मेरे वितरण की साजिश है जो बहुत सामान्य लग रहा है ...

(मेरे पास तीन स्कोर हैं, और इस स्कोर में से प्रत्येक कोलमोगोरोव परीक्षण के महत्वपूर्ण पी-मूल्य के साथ सामान्य नहीं है ... मुझे वास्तव में समझ में आया है)

यहाँ छवि विवरण दर्ज करें

यहाँ छवि विवरण दर्ज करें


11
आप कैसे जानते हैं कि यह सामान्य है? यह मुझे सामान्य नहीं लगता। यह बाएं-तिरछा दिखता है।
mark999

1
आप सामान्यता के लिए परीक्षण क्यों कर रहे हैं?
जैक आइडल

जवाबों:


39
  1. आपके पास यह सुनिश्चित करने के लिए कोई आधार नहीं है कि आपका डेटा सामान्य है। भले ही आपका तिरछापन और अतिरिक्त कर्टोसिस दोनों बिल्कुल 0 थे , ऐसा नहीं है मतलब कि आपके डेटा सामान्य हैं। जबकि अपेक्षित मूल्यों से दूर तिरछापन और कर्टोसिस गैर-सामान्यता को इंगित करता है, लेकिन कांसेप्ट धारण नहीं करता है। गैर-सामान्य वितरण होते हैं जिनमें सामान्य रूप से समान तिरछापन और कुर्तोसिस होता है। एक उदाहरण पर यहां चर्चा की गई है , जिसका घनत्व नीचे पुन: प्रस्तुत किया गया है:
    डगमगाना 2.3

    जैसा कि आप देखते हैं, यह विशिष्ट रूप से बिमोडल है। इस मामले में, वितरण सममित है, इसलिए जब तक पर्याप्त क्षण मौजूद हैं, विशिष्ट तिरछा माप 0 होगा (वास्तव में सभी सामान्य उपाय होंगे)। कर्टोसिस के लिए, इस क्षेत्र के करीब से 4 क्षणों में योगदान कर्टोसिस को छोटा बनाने के लिए होता है, लेकिन पूंछ अपेक्षाकृत भारी होती है, जो इसे बड़ा बनाने के लिए जाती है। यदि आप सही का चयन करते हैं, तो कुर्तोसिस उसी मूल्य के साथ आता है जो सामान्य के लिए है।

  2. आपका नमूना तिरछापन वास्तव में -0.5 के आसपास है, जो हल्के बाएं-तिरछापन का विचारोत्तेजक है। आपका हिस्टोग्राम और QQ प्लॉट दोनों समान संकेत देते हैं - एक हल्के से बाएं-तिरछा वितरण। (इस तरह के हल्के तिरछेपन से सामान्य सामान्य-सिद्धांत प्रक्रियाओं में से अधिकांश के लिए समस्या होने की संभावना नहीं है।)

  3. आप गैर-सामान्यता के कई अलग-अलग संकेतकों को देख रहे हैं, जिन्हें आपको प्राथमिकता से सहमत होने की उम्मीद नहीं करनी चाहिए , क्योंकि वे वितरण के विभिन्न पहलुओं पर विचार करते हैं; छोटे हल्के गैर-सामान्य नमूनों के साथ, वे अक्सर असहमत होंगे।


अब बड़े सवाल के लिए: * आप सामान्यता के लिए परीक्षण क्यों कर रहे हैं ? *

[टिप्पणियों से प्रतिक्रिया में संपादित:]

मैं वास्तव में निश्चित नहीं हूं, हालांकि मुझे एनोवा करने से पहले चाहिए

यहां कई बिंदु बनाए जाने हैं।

मैं। सामान्यता ANOVA की एक धारणा है यदि आप इसका इस्तेमाल अनुमान के लिए कर रहे हैं (जैसे कि परिकल्पना परीक्षण), लेकिन यह विशेष रूप से बड़े नमूनों में गैर-सामान्यता के प्रति संवेदनशील नहीं है - हल्के गैर-सामान्यता थोड़े परिणाम के होते हैं और नमूना आकार वितरण को बढ़ाते हैं। अधिक गैर-सामान्य हो जाएं और परीक्षण केवल थोड़ा प्रभावित हो सकता है।

ii। आप प्रतिक्रिया (DV) की सामान्यता का परीक्षण करते दिखाई देते हैं। DV का (बिना शर्त) वितरण ही ANOVA में सामान्य नहीं माना जाता है। आप सशर्त वितरण के बारे में धारणा की तर्कशीलता का आकलन करने के लिए अवशिष्टों की जांच करते हैं (यानी, सामान्य मान लिया गया मॉडल में इसका त्रुटि शब्द) - यानी आपको सही चीज़ नहीं दिख रही है। दरअसल, क्योंकि चेक अवशिष्ट पर किया जाता है, आप इसे मॉडल फिटिंग के बाद करते हैं, बजाय पहले से।

iii। औपचारिक परीक्षण बेकार के बगल में हो सकता है। यहां रुचि का सवाल है 'गैर-सामान्यता की डिग्री मेरे अनुमान को प्रभावित करने वाली डिग्री कितनी बुरी है?', जिसकी परिकल्पना परीक्षण वास्तव में जवाब नहीं देता है। जैसा कि नमूना आकार बड़ा हो जाता है, परीक्षण सामान्य से अधिक तुच्छ अंतर का पता लगाने में सक्षम हो जाता है, जबकि एनोवा में महत्व स्तर पर प्रभाव छोटा और छोटा हो जाता है। यही है, यदि आपका नमूना आकार काफी बड़ा है, तो सामान्यता का परीक्षण ज्यादातर आपको बता रहा है कि आपके पास एक बड़ा नमूना आकार है, जिसका अर्थ है कि आपको चिंता करने के लिए बहुत कुछ नहीं हो सकता है। कम से कम एक क्यूक्यू प्लॉट के साथ आपके पास यह आकलन है कि यह कितना सामान्य है।

iv। उचित नमूना आकारों में, अन्य धारणाएं - जैसे विचरण और स्वतंत्रता की समानता - आम तौर पर हल्के गैर-सामान्यता से बहुत अधिक होती है। पहले अन्य मान्यताओं के बारे में चिंता करें ... लेकिन फिर से, औपचारिक परीक्षण सही प्रश्न का उत्तर नहीं दे रहा है

v। यह चुनना कि आप एक परिकल्पना परीक्षण के परिणाम के आधार पर एक एनोवा या कुछ अन्य परीक्षण करते हैं या नहीं, केवल इस बात पर निर्णय लेने की तुलना में बदतर गुण होते हैं जैसे कि धारणा धारण नहीं करती है। (विभिन्न प्रकार के तरीके हैं जो डेटा पर एक-तरफ़ा एनोवा-जैसे विश्लेषणों के लिए उपयुक्त हैं, जिन्हें सामान्य नहीं माना जाता है कि आप का उपयोग कर सकते हैं जब भी आपको नहीं लगता कि आपके पास सामान्यता मानने का कारण है। कुछ के पास बहुत अच्छी शक्ति है। सामान्य तौर पर, और सभ्य सॉफ्टवेयर के साथ उनसे बचने का कोई कारण नहीं है।)

[मेरा मानना ​​है कि मेरे पास इस अंतिम बिंदु के लिए एक संदर्भ था लेकिन मैं अभी इसका पता नहीं लगा सकता; अगर मुझे लगता है कि मैं वापस आने और इसे लगाने की कोशिश करूँगा]


मैंने आपका हिस्टोग्राम लगभग 12 मिनट 48 अधिकतम 60 दिखाते हुए पढ़ा है, इसलिए मिनट से मोड 36 है, मोड से अधिकतम 12 है। एक को इस तरह के विवरणों में बहुत अधिक नहीं पढ़ना चाहिए, लेकिन वे पूरी तरह से बाएं तिरछा के अनुरूप हैं।
निक कॉक्स

10

कोलमोगोरोव-स्मिरनोव टेस्ट में काफी हद तक शक्ति होती है जब नमूनों का आकार बड़ा होता है, इसलिए अशक्त परिकल्पना को अस्वीकार करना आसान हो सकता है कि आपका डेटा सामान्यता से अलग नहीं है। दूसरे शब्दों में, परीक्षण कभी-कभी सुझाव देगा कि बड़े नमूनों में वितरण सामान्य नहीं है, भले ही यह अधिकांश इरादों के लिए सामान्य हो।

इसे टी-टेस्ट की तरह समझें। यदि आपके पास दो आबादी है जो ऊंचाई में केवल एक मिलीमीटर के हजारवें हिस्से से भिन्न होती है, तो एक अविश्वसनीय रूप से बड़े नमूने सांख्यिकीय रूप से समर्थन करेंगे कि ये भिन्न हैं, भले ही अंतर अर्थहीन हो।

शायद आप अपने डेटा की सामान्यता निर्धारित करने के लिए अन्य तरीकों पर भरोसा कर सकते हैं। आपके द्वारा उपयोग किए जाने वाले भूखंड दो अच्छे उदाहरण हैं, साथ ही तिरछा / कुर्तोसिस मूल्य भी हैं।

यह अन्य विषय विशेष रूप से संबंधित लगता है: क्या सामान्यता परीक्षण 'अनिवार्य रूप से बेकार' है?


ओह ठीक है, यह सही है, मेरे नमूने का आकार बहुत बड़ा है (n = 660), क्या कोई अन्य परीक्षण है जो विशाल नमूना आकार से कम पक्षपाती हैं?
बू

इस साइट पर एक खोज करें और आप प्रासंगिक उत्तर पा सकते हैं। आँकड़े.स्टैकएक्सचेंज. com
questions/

13
परीक्षण बड़े नमूना आकार से पक्षपाती नहीं हैं।
पीटर फ्लॉम - मोनिका

10

कोलमोगोरोव-स्मिर्नोव परीक्षण वितरण-मुक्त है जब अशक्त परिकल्पना पूरी तरह से निर्दिष्ट की जाती है - यदि डेटा से माध्य और विचरण का अनुमान लगाया जाता है, तो सामान्यता का परीक्षण करते समय लिलिफ़ोर्स वेरिएंट का उपयोग करना सुनिश्चित करें (यदि आपको आवश्यक है)। यह अन्य जवाब हासिल करने के लिए नहीं है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.