सैंपल स्प्लिटिंग शायद आंकड़े के वितरण के साथ समस्या को कम कर सकता है, लेकिन यह इसे दूर नहीं करता है।
आपका विचार इस मुद्दे से बचता है कि अनुमान जनसंख्या मूल्यों के सापेक्ष 'बहुत करीब' होंगे क्योंकि वे एक ही नमूने पर आधारित हैं।
आप उस समस्या से नहीं बच रहे हैं जिसका वे अभी भी अनुमान लगा रहे हैं। परीक्षण आँकड़ा का वितरण सारणीबद्ध नहीं है।
इस मामले में यह नाटकीय रूप से कम करने के बजाय, नल के नीचे अस्वीकृति दर को बढ़ाता है।
एक बेहतर विकल्प एक परीक्षण का उपयोग करना है जहां पैरामीटर ज्ञात नहीं हैं, जैसे कि शापिरो विलक।
यदि आप एक कोलमोगोरोव-स्मिर्नोव प्रकार के परीक्षण के लिए तैयार हैं, तो आप लिलीफोरस के परीक्षण का दृष्टिकोण ले सकते हैं।
यही है, केएस आँकड़ा का उपयोग करना है लेकिन परीक्षण आँकड़ा का वितरण मापदंडों के आकलन के प्रभाव को दर्शाता है - पैरामीटर अनुमान के तहत परीक्षण आँकड़ा के वितरण का अनुकरण करना। (यह अब वितरण-मुक्त नहीं है, इसलिए आपको प्रत्येक वितरण के लिए नए तालिकाओं की आवश्यकता है।)
http://en.wikipedia.org/wiki/Lilliefors_test
लिलिफ़ोर्स ने सामान्य और घातीय मामले के लिए सिमुलेशन का उपयोग किया, लेकिन आप इसे किसी भी विशिष्ट वितरण के लिए आसानी से कर सकते हैं; आर जैसे कुछ में 10,000 या 100,000 नमूनों का अनुकरण करना और अशक्त के तहत परीक्षण सांख्यिकीय का वितरण प्राप्त करना क्षणों की बात है।
[एंडरसन-डार्लिंग पर विचार करने के लिए एक विकल्प हो सकता है, जिसमें एक ही मुद्दा है, लेकिन जो - डी'ऑगोस्टिनो और स्टीफंस ( गुडनेस-ऑफ-फिट-तकनीक ) द्वारा पुस्तक को देखते हुए इसके प्रति कम संवेदनशील लगता है। आप लिलीफोरस विचार को अनुकूलित कर सकते हैं, लेकिन वे अपेक्षाकृत सरल समायोजन का सुझाव देते हैं जो काफी अच्छी तरह से काम करता है।]
लेकिन अभी भी अन्य दृष्टिकोण हैं; उदाहरण के लिए, फिट की अच्छाई के सहज परीक्षणों के परिवार हैं (उदाहरण के लिए रेनर और बेस्ट द्वारा पुस्तक देखें) जो कि कई विशिष्ट मामलों में पैरामीटर अनुमान से निपट सकते हैं।
* प्रभाव अभी भी बहुत बड़ा हो सकता है - शायद इससे बड़ा आमतौर पर स्वीकार्य माना जाएगा; मोमो इसके बारे में चिंता व्यक्त करने के लिए सही है। यदि एक उच्च प्रकार I त्रुटि दर (और एक चापलूसी शक्ति वक्र) एक समस्या है, तो यह एक सुधार नहीं हो सकता है!