मेरे पास 7 दिनों के दौरान व्यक्तियों द्वारा किए गए कार्यों की संख्या से युक्त एक डेटा सेट है। इस प्रश्न के लिए विशिष्ट कार्रवाई प्रासंगिक नहीं होनी चाहिए। यहाँ डेटा सेट के लिए कुछ वर्णनात्मक आँकड़े दिए गए हैं:
यहाँ डेटा का एक हिस्टोग्राम है:

डेटा के स्रोत को देखते हुए, मुझे लगा कि यह एक पॉइसन वितरण के लिए उपयुक्त होगा। हालांकि, मतलब iance विचरण, और हिस्टोग्राम बाईं ओर भारी है। इसके अतिरिक्त, मैंने goodfitR में परीक्षण चलाया और मिला:
> gf <- goodfit(actions,type="poisson", method = "MinChisq") <br>
> summary(gf) <br>
Goodness-of-fit test for poisson distribution <br>
X^2 df P(> X^2) <br>
Pearson 2.937599e+248 771 0
अधिकतम संभावना विधि ने भी पी-मान प्राप्त किया है = 0. शून्य परिकल्पना को मानते हुए: डेटा एक पॉइसन वितरण (दस्तावेज इसे निर्दिष्ट नहीं करता है) से मेल खाता है, तो goodfitपरीक्षण कहता है कि हमें शून्य परिकल्पना को अस्वीकार करना चाहिए, इसलिए डेटा नहीं करता है पोइसन वितरण का मिलान करें।
क्या वह विश्लेषण सही है? यदि हां, तो क्या आपको लगता है कि वितरण इस डेटा को फिट करेगा?
मेरा अंतिम लक्ष्य यह देखने के लिए है कि 2 नमूनों के बीच क्रियाओं की संख्या की तुलना करना है कि क्या साधन अलग हैं; क्या वितरण की जाँच आवश्यक है? मेरी समझ यह है कि विशिष्ट परीक्षण (z-, t-, परीक्षण) पॉसों के वितरण के लिए काम नहीं करते हैं। यदि वास्तव में पॉइज़न-वितरित डेटा है तो मुझे किस परीक्षण का उपयोग करना चाहिए?