मोटे तौर पर बोलना (केवल फिट परीक्षण की भलाई में नहीं, बल्कि कई अन्य स्थितियों में), आप बस यह निष्कर्ष नहीं निकाल सकते हैं कि अशक्त सही है, क्योंकि ऐसे विकल्प हैं जो किसी भी दिए गए नमूना आकार में नल से प्रभावी रूप से अप्रभेद्य हैं।
यहां दो वितरण हैं, एक मानक सामान्य (हरी ठोस रेखा), और एक समान दिखने वाला (90% मानक सामान्य, और 10% मानकीकृत बीटा (2,2), जो लाल धराशायी रेखा के साथ चिह्नित है):
लाल एक सामान्य नहीं है। कहते हैं पर , हम, अंतर खोलना की संभावना बहुत कम है, इसलिए हम चाहते हैं कि डेटा ज़ोर एक सामान्य वितरण से नहीं तैयार कर रहे हैं कर सकते हैं - क्या हुआ अगर यह लाल एक के बजाय की तरह एक गैर सामान्य वितरण से कर रहे थे?n = 100
समान लेकिन बड़े मापदंडों के साथ मानकीकृत दांव के छोटे अंश एक सामान्य से अलग देखने के लिए बहुत कठिन होंगे।
लेकिन यह देखते हुए कि वास्तविक डेटा लगभग रहे हैं कभी नहीं , कुछ सरल वितरण से अगर हम एक आदर्श ओरेकल (या प्रभावी रूप से अनंत नमूना आकार) था, हम अनिवार्य रूप से होता है हमेशा परिकल्पना है कि डेटा के लिए कुछ सरल वितरणात्मक रूप से थे अस्वीकार करते हैं।
जैसा कि जॉर्ज बॉक्स ने प्रसिद्ध रूप से कहा , " सभी मॉडल गलत हैं, लेकिन कुछ उपयोगी हैं। "
उदाहरण के लिए, सामान्यता का परीक्षण करें। यह हो सकता है कि डेटा वास्तव में एक सामान्य से कुछ के करीब से आए, लेकिन क्या वे कभी बिल्कुल सामान्य होंगे? वे शायद कभी नहीं हैं।
इसके बजाय, परीक्षण के उस रूप के साथ आप जो सबसे अच्छी उम्मीद कर सकते हैं वह वह स्थिति है जिसका आप वर्णन करते हैं। (देखें, उदाहरण के लिए, पद सामान्यता परीक्षण अनिवार्य रूप से बेकार है? लेकिन यहां कई अन्य पोस्ट हैं जो संबंधित बिंदु बनाते हैं)
यही कारण है मैं अक्सर लोगों को यह सवाल वे वास्तव में रुचि रखते हैं करने के लिए सुझाव का हिस्सा है (जो अक्सर के लिए कुछ नजदीक है 'वितरण करने के लिए अपने डेटा पास पर्याप्त हैं है कि मैं उस आधार पर उपयुक्त अनुमान कर सकते हैं?') आमतौर पर है अच्छा-से-फिट परीक्षण द्वारा उत्तर नहीं दिया गया। सामान्यता के मामले में, अक्सर वे संभावित प्रक्रियाएँ जिन्हें वे लागू करना चाहते हैं (टी-परीक्षण, प्रतिगमन आदि) बड़े नमूनों में काफी अच्छी तरह से काम करते हैं - अक्सर तब भी जब मूल वितरण बिल्कुल स्पष्ट रूप से गैर-सामान्य होता है - बस जब एक अच्छाई का फिट परीक्षण सामान्यता को अस्वीकार करने की बहुत संभावना होगी । यह एक ऐसी प्रक्रिया का उपयोग करने से कम है जो आपको यह बताने की सबसे अधिक संभावना है कि आपका डेटा गैर-सामान्य है जब प्रश्न कोई मायने नहीं रखता है।एफ
ऊपर की छवि पर फिर से विचार करें। लाल वितरण गैर-सामान्य है, और वास्तव में बड़े नमूने के साथ हम एक नमूना से आधारित सामान्यता के परीक्षण को अस्वीकार कर सकते हैं ... लेकिन बहुत छोटे नमूना आकार, प्रतिगमन और दो नमूना टी-परीक्षण (और कई अन्य परीक्षण) पर इसके अलावा) इतनी अच्छी तरह से व्यवहार करेंगे क्योंकि यह उस गैर-सामान्यता के बारे में चिंता करने के लिए भी थोड़ा-बहुत बेकार कर देगा।
μ = μ0
आप विचलन के कुछ विशेष रूपों को निर्दिष्ट करने में सक्षम हो सकते हैं और समतुल्यता परीक्षण जैसे कुछ को देख सकते हैं, लेकिन यह फिट की अच्छाई के साथ एक तरह से मुश्किल है क्योंकि एक वितरण के करीब आने के लिए बहुत सारे तरीके हैं, लेकिन एक परिकल्पना से अलग है, और अलग है अंतर के रूपों के विश्लेषण पर अलग-अलग प्रभाव पड़ सकते हैं। यदि विकल्प एक व्यापक परिवार है जिसमें एक विशेष मामले के रूप में शून्य शामिल है, तो तुल्यता परीक्षण अधिक समझ में आता है (उदाहरण के लिए, गामा के खिलाफ परीक्षण घातांक) - और वास्तव में, "दो एकतरफा परीक्षण" दृष्टिकोण के माध्यम से किया जाता है, और हो सकता है कि औपचारिक रूप से "करीब पर्याप्त" होने का एक तरीका हो (या यह होगा कि क्या गामा मॉडल सच थे, लेकिन वास्तव में फिट परीक्षण की एक साधारण अच्छाई द्वारा खारिज कर दिया जाना लगभग निश्चित रूप से होगा,
फिट परीक्षण की भलाई (और अक्सर अधिक मोटे तौर पर, परिकल्पना परीक्षण) वास्तव में केवल स्थितियों की एक सीमित सीमा के लिए उपयुक्त है। आमतौर पर लोग जिस सवाल का जवाब देना चाहते हैं, वह इतना सटीक नहीं होता है, लेकिन कुछ हद तक अस्पष्ट और कठिन होता है - लेकिन जैसा कि जॉन टुके ने कहा, " सही सवाल का लगभग एक बेहतर जवाब, जो अक्सर अस्पष्ट होता है, एक सटीक उत्तर की तुलना में। गलत सवाल, जिसे हमेशा सटीक बनाया जा सकता है। "
अन्य अस्पष्ट प्रश्नों की संवेदनशीलता का आकलन करने के लिए अधिक अस्पष्ट प्रश्न का उत्तर देने के लिए उचित दृष्टिकोण में अनुकरण और पुन: नमूनाकरण जांच शामिल हो सकती है, जो अन्य स्थितियों की तुलना में विचार कर रहे हैं, जो उपलब्ध डेटा के साथ यथोचित संगत हैं।
ε