इस तरह की परिस्थितियों में ची-स्क्वायर की कम शक्ति के स्पष्ट मुद्दे को छोड़कर, डेटा को दूर करके अनिर्दिष्ट मापदंडों के साथ कुछ घनत्व के लिए परीक्षण के ची-स्क्वायर अच्छाई करने की कल्पना करें।
संक्षिप्तता के लिए, मान लें कि अज्ञात माध्य के साथ एक घातांक वितरण और कहते हैं कि 100 का एक नमूना आकार।
बिन में अपेक्षित टिप्पणियों की एक उचित संख्या प्राप्त करने के लिए कुछ खाते में डेटा लेने की आवश्यकता होगी (जैसे अगर हमने माध्य से 6 डिब्बे नीचे और 4 इसके ऊपर चुना है, जो अभी भी डेटा-आधारित बिन सीमाओं का उपयोग करेगा) ।
लेकिन डेटा को देखने के आधार पर डिब्बे का यह उपयोग संभवतः शून्य के तहत परीक्षण सांख्यिकीय के वितरण को प्रभावित करेगा।
मैंने इस तथ्य के बारे में बहुत चर्चा की है कि - यदि मापदंडों को बॉनड डेटा से अधिकतम संभावना द्वारा अनुमानित किया जाता है - तो आप अनुमानित पैरामीटर प्रति 1 df खो देते हैं (फिशर बनाम कार्ल पियर्सन के लिए वापस डेटिंग एक मुद्दा) - लेकिन मुझे याद नहीं है डेटा के आधार पर बिन सीमाओं को खोजने के बारे में कुछ भी पढ़ना। (यदि आप उन्हें अनवांटेड डेटा से अनुमान लगाते हैं, तो साथ परीक्षण आँकड़ा का वितरण और बीच कहीं होता है ।)
क्या यह डेटा-आधारित विकल्प बिनता के महत्व स्तर या शक्ति को प्रभावित करता है? क्या कुछ दृष्टिकोण हैं जो दूसरों की तुलना में अधिक मायने रखते हैं? यदि कोई प्रभाव पड़ता है, तो क्या यह कुछ ऐसा है जो बड़े नमूनों में चला जाता है?
यदि इसका एक प्रभावशाली प्रभाव पड़ता है, तो यह ची-स्क्वेर्ड परीक्षण का उपयोग करने के लिए प्रतीत होता है जब पैरामीटर कई मामलों में लगभग बेकार हैं (अभी भी काफी कुछ ग्रंथों में वकालत किए जाने के बावजूद), जब तक कि आपके पास एक अच्छा नहीं था -प्रियोरी पैरामीटर का अनुमान।
मुद्दों या संदर्भों की चर्चा (अधिमानतः उनके निष्कर्ष के उल्लेख के साथ) उपयोगी होगी।
संपादित करें, मुख्य प्रश्न के लिए एक तरफ बहुत अधिक:
यह मेरे साथ होता है कि घातीय * के विशिष्ट मामले के लिए संभावित समाधान हैं (और वर्दी इसके बारे में सोचते हैं), लेकिन मैं अभी भी बिन सीमाओं को चुनने वाले प्रभाव के अधिक सामान्य मुद्दे में दिलचस्पी रखता हूं।
* उदाहरण के लिए, घातीय के लिए, एक छोटी से छोटी अवलोकन का उपयोग कर सकते हैं (कहते हैं कि यह के बराबर है ) जहां डिब्बे जगह (के बाद से सबसे छोटी अवलोकन मतलब के साथ घातीय है की एक बहुत ही किसी न किसी विचार प्राप्त करने ), और फिर घातांक के लिए शेष अंतर ( ) का परीक्षण करें। बेशक, μ का बहुत खराब अनुमान हो सकता है, और इसलिए खराब बिन विकल्प, हालांकि मुझे लगता है कि एक व्यक्ति दो या तीन टिप्पणियों को लेने के लिए पुनरावर्ती तर्क का उपयोग कर सकता है जिसमें से उचित डिब्बे चुनने के लिए और फिर उन सबसे छोटे क्रम के आंकड़ों के सबसे ऊपर के शेष टिप्पणियों के अंतर का परीक्षण करने के लिए exponentiality)