क्या मैं तिरछा और गैर-सामान्य डेटा के साथ जेड-स्कोर का उपयोग कर सकता हूं? [बन्द है]


12

मैं पूर्ण चक्र समय के कुछ हिस्सों के बीच तुलना करने के लिए मानक z- स्कोर का उपयोग करके कुछ प्रक्रिया चक्र समय डेटा और स्केलिंग के साथ काम कर रहा हूं।

क्या मुझे कुछ अन्य परिवर्तन का उपयोग करना चाहिए क्योंकि डेटा भारी-तिरछा / गैर-सामान्य है? ('आउटलेर्स' कभी भी नकारात्मक समय नहीं ले सकता है और अक्सर 'औसत' की तुलना में अधिक समय लेता है)

Z- स्कोर का उपयोग करना अभी भी "काम" लगता है ...

###############
# R code    
###############
mydata <- rweibull(1000,1,1.5)
hist(mydata)
hist(scale(mydata))

5
आप वास्तव में क्या पूछ रहे हैं? बेशक, आप अभी भी -score की गणना कर सकते हैं , लेकिन आप इसके लिए क्या उपयोग करने की कोशिश कर रहे हैं? माध्य से मानक विचलन की संख्या (जो कि -score है) कुछ स्थितियों में विशेष रूप से उपयोगी आँकड़ा नहीं हो सकती है। zzz
मैक्रो

जवाबों:


5

यदि X अत्यधिक तिरछा है तो Z आँकड़ा सामान्य रूप से वितरित नहीं किया जाएगा (या t यदि मानक विचलन का अनुमान लगाया जाना चाहिए। तो Z का प्रतिशतता मानक सामान्य नहीं होगा। इसलिए उस अर्थ में यह काम नहीं करता है।


मेरी समझ से, X का अत्यधिक तिरछा होना मतलब है कि नमूना का आकार बहुत बड़ा नहीं था (केंद्रीय सीमा प्रमेय)। हालाँकि, मुझे यकीन नहीं है, कि Z स्टेटिस्टिक काम करने के लिए जनसंख्या को खुद को सामान्य होना चाहिए या नहीं। क्या यह?
आंद्रेज गिस

1
ओपी जनसंख्या वितरण की बात कर रहा है न कि माध्य वितरण की। इसलिए नमूना आकार और केंद्रीय सीमा प्रमेय लागू नहीं होता है।
माइकल आर। चेरिक

2

R कोड काम करेगा, लेकिन z- स्कोर लगभग उतना ही सार्थक होगा जितना कि वाक्य "अंगूर फव्वारे की कलम को हल्के से गूंथ रहे हैं।" यह एक वैध वाक्य है, लेकिन सार्थक कुछ भी व्यक्त नहीं करता है।

आपके R कोड को देखते हुए, ऐसा लगता है कि आपको लगता है कि आपका डेटा Weibull वितरित है। उस स्थिति में, मैं सिर्फ वीबुल स्टैटिस्टिक्स का उपयोग करूंगा और जब तक कि आपके पास पूरी तरह से न हो, तब तक कुछ भी पैमाना नहीं। भले ही z- स्कोर हर इंट्रो सांख्यिकी वर्ग में पढ़ाया जाता है, लेकिन इसका मतलब यह नहीं है कि आपको हर समय उनका उपयोग करना चाहिए, और विशेष रूप से यदि आपके पास सममित डेटा नहीं है।


1

यदि जनसंख्या सामान्य रूप से वितरित नहीं की जाती है। उस स्थिति में, बार (X) {नमूना माध्य} का वितरण केंद्रीय सीमा प्रमेय के अनुसार एक सामान्य वितरण का दृष्टिकोण करता है; बड़े नमूना आकार के लिए। हालांकि सैद्धांतिक रूप से हम कहते हैं कि हम छात्र के टी का उपयोग कर रहे हैं, लेकिन उच्च मूल्यों के लिए (नमूना आकार या स्वतंत्रता की डिग्री), टी वितरण और जेड वितरण लगभग बराबर हैं।


-4

आपका डेटा एक Z-TEST के लिए आवश्यक नहीं है। (TOWNEND, 2002) होवरेव, वरुण ने अपोलिक्वाटी एक्वैल के बारे में बताया। अपने दो डैटसेट पर एक एफ-टेस्ट से बाहर ले जाने के लिए, और अगर आपके पास अपरोक्ष तरीके हैं, तो जेड टेस्ट परिणाम का उपयोग किया जाता है। यदि नहीं, तो डेटा को ट्रांसफ़ॉर्म करें।


9
सवाल यह है कि वेरिएबल का परिवर्तन एक परीक्षण नहीं है, इसलिए मुझे नहीं लगता कि आपका उत्तर लागू होता है। इसके अलावा, यह संभवतः अधिक जानकारीपूर्ण है यदि आप केवल नाम-वर्ष के संदर्भ के बजाय पूर्ण संदर्भ देते हैं और कुछ लोग SHOUTING के खिलाफ आपत्ति करते हैं।
मार्टन बुइस

मैं @MaartenBuis से सहमत हूं लेकिन उसके विपरीत मैं इसे कम कर दूंगा।
एरिक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.