मेरे पास 7 दिनों के दौरान व्यक्तियों द्वारा किए गए कार्यों की संख्या से युक्त एक डेटा सेट है। इस प्रश्न के लिए विशिष्ट कार्रवाई प्रासंगिक नहीं होनी चाहिए। यहाँ डेटा सेट के लिए कुछ वर्णनात्मक आँकड़े दिए गए हैं:
यहाँ डेटा का एक हिस्टोग्राम है:
डेटा के स्रोत को देखते हुए, मुझे लगा कि यह एक पॉइसन वितरण के लिए उपयुक्त होगा। हालांकि, मतलब iance विचरण, और हिस्टोग्राम बाईं ओर भारी है। इसके अतिरिक्त, मैंने goodfit
R में परीक्षण चलाया और मिला:
> gf <- goodfit(actions,type="poisson", method = "MinChisq") <br>
> summary(gf) <br>
Goodness-of-fit test for poisson distribution <br>
X^2 df P(> X^2) <br>
Pearson 2.937599e+248 771 0
अधिकतम संभावना विधि ने भी पी-मान प्राप्त किया है = 0. शून्य परिकल्पना को मानते हुए: डेटा एक पॉइसन वितरण (दस्तावेज इसे निर्दिष्ट नहीं करता है) से मेल खाता है, तो goodfit
परीक्षण कहता है कि हमें शून्य परिकल्पना को अस्वीकार करना चाहिए, इसलिए डेटा नहीं करता है पोइसन वितरण का मिलान करें।
क्या वह विश्लेषण सही है? यदि हां, तो क्या आपको लगता है कि वितरण इस डेटा को फिट करेगा?
मेरा अंतिम लक्ष्य यह देखने के लिए है कि 2 नमूनों के बीच क्रियाओं की संख्या की तुलना करना है कि क्या साधन अलग हैं; क्या वितरण की जाँच आवश्यक है? मेरी समझ यह है कि विशिष्ट परीक्षण (z-, t-, परीक्षण) पॉसों के वितरण के लिए काम नहीं करते हैं। यदि वास्तव में पॉइज़न-वितरित डेटा है तो मुझे किस परीक्षण का उपयोग करना चाहिए?