वितरण परिकल्पना परीक्षण - यदि आप अपनी अशक्त परिकल्पना को "स्वीकार" नहीं कर सकते हैं तो यह करने का क्या मतलब है?


26

विभिन्न परिकल्पना परीक्षण, जैसे कि GOF परीक्षण, कोलमोगोरोव-स्मिरनोव, एंडरसन-डार्लिंग, आदि इस मूल प्रारूप का पालन करते हैं:χ2

एच0 : डेटा दिए गए वितरण का अनुसरण करता है।

एच1 : डेटा दिए गए वितरण का पालन नहीं करता है।

आमतौर पर, कोई यह दावा करता है कि कुछ दिए गए डेटा कुछ दिए गए वितरण का अनुसरण करते हैं, और यदि कोई को अस्वीकार करता है , तो डेटा कुछ स्तर पर दिए गए वितरण के लिए एक अच्छा फिट नहीं है। αएच0α

लेकिन क्या होगा अगर हम को अस्वीकार नहीं करते हैं ? मुझे हमेशा सिखाया गया है कि कोई भी "स्वीकार" नहीं कर सकता है , इसलिए मूल रूप से, हम को अस्वीकार करने के लिए सबूत नहीं देते हैं । यही है, कोई सबूत नहीं है कि हम अस्वीकार करते हैं कि डेटा दिए गए वितरण का पालन करते हैं।एच एच एच0एच0एच0

इस प्रकार, मेरा प्रश्न यह है कि यदि हम किसी दिए गए वितरण का पालन करते हैं या नहीं, तो क्या हम निष्कर्ष नहीं निकाल सकते हैं कि इस तरह के परीक्षण करने का क्या मतलब है?


1
यह केवल उत्तर देने के लिए बहुत लुभावना है "परीक्षण का क्या मतलब है [सामान्य रूप से] अगर कोई अशक्त परिकल्पना को स्वीकार नहीं कर सकता है।" सभी मामलों में, सांख्यिकीय परीक्षण निर्णय लेने का एकमात्र आधार नहीं है। इसके बजाय, हम एक निर्णय लेते हैं और टाइप I / II त्रुटियों के जोखिम / लागत को निर्धारित करने के लिए डेटा का उपयोग करते हैं। यदि हमने उपयोगी ग्राफिक्स, QQplots और भविष्य कहे जाने वाले आँकड़ों के साथ केवल गुणवत्ता या डिग्री की उपयुक्तता को संक्षेप में प्रस्तुत किया है, तो हमें "शून्य को स्वीकार करने" के जोखिम के रूप में उचित रूप से सलाह दी जाएगी।
एडमों

@ अदमो जब मैंने यह तीन साल पहले पूछा था, मैंने अभी अंडरग्रेजुएट गणित (स्टैटस जोर) की डिग्री पूरी की थी। अब क्योंकि मैं एक एमएस स्टैटस प्रोग्राम का आधा हिस्सा हूं और कुछ पेशेवर काम कर रहा हूं, अब मैं इसे समझता हूं। यह वास्तव में दुर्भाग्यपूर्ण है कि बहुत सारे अंडरग्रेजुएट प्रोग्राम में कैसे आँकड़े पढ़ाए जाते हैं, लेकिन मैं पचाता हूँ।
शहनाई

जवाबों:


37

मोटे तौर पर बोलना (केवल फिट परीक्षण की भलाई में नहीं, बल्कि कई अन्य स्थितियों में), आप बस यह निष्कर्ष नहीं निकाल सकते हैं कि अशक्त सही है, क्योंकि ऐसे विकल्प हैं जो किसी भी दिए गए नमूना आकार में नल से प्रभावी रूप से अप्रभेद्य हैं।

यहां दो वितरण हैं, एक मानक सामान्य (हरी ठोस रेखा), और एक समान दिखने वाला (90% मानक सामान्य, और 10% मानकीकृत बीटा (2,2), जो लाल धराशायी रेखा के साथ चिह्नित है):

यहाँ छवि विवरण दर्ज करें

लाल एक सामान्य नहीं है। कहते हैं पर , हम, अंतर खोलना की संभावना बहुत कम है, इसलिए हम चाहते हैं कि डेटा ज़ोर एक सामान्य वितरण से नहीं तैयार कर रहे हैं कर सकते हैं - क्या हुआ अगर यह लाल एक के बजाय की तरह एक गैर सामान्य वितरण से कर रहे थे?n=100

समान लेकिन बड़े मापदंडों के साथ मानकीकृत दांव के छोटे अंश एक सामान्य से अलग देखने के लिए बहुत कठिन होंगे।

लेकिन यह देखते हुए कि वास्तविक डेटा लगभग रहे हैं कभी नहीं , कुछ सरल वितरण से अगर हम एक आदर्श ओरेकल (या प्रभावी रूप से अनंत नमूना आकार) था, हम अनिवार्य रूप से होता है हमेशा परिकल्पना है कि डेटा के लिए कुछ सरल वितरणात्मक रूप से थे अस्वीकार करते हैं।

जैसा कि जॉर्ज बॉक्स ने प्रसिद्ध रूप से कहा , " सभी मॉडल गलत हैं, लेकिन कुछ उपयोगी हैं। "

उदाहरण के लिए, सामान्यता का परीक्षण करें। यह हो सकता है कि डेटा वास्तव में एक सामान्य से कुछ के करीब से आए, लेकिन क्या वे कभी बिल्कुल सामान्य होंगे? वे शायद कभी नहीं हैं।

इसके बजाय, परीक्षण के उस रूप के साथ आप जो सबसे अच्छी उम्मीद कर सकते हैं वह वह स्थिति है जिसका आप वर्णन करते हैं। (देखें, उदाहरण के लिए, पद सामान्यता परीक्षण अनिवार्य रूप से बेकार है? लेकिन यहां कई अन्य पोस्ट हैं जो संबंधित बिंदु बनाते हैं)

यही कारण है मैं अक्सर लोगों को यह सवाल वे वास्तव में रुचि रखते हैं करने के लिए सुझाव का हिस्सा है (जो अक्सर के लिए कुछ नजदीक है 'वितरण करने के लिए अपने डेटा पास पर्याप्त हैं है कि मैं उस आधार पर उपयुक्त अनुमान कर सकते हैं?') आमतौर पर है अच्छा-से-फिट परीक्षण द्वारा उत्तर नहीं दिया गया। सामान्यता के मामले में, अक्सर वे संभावित प्रक्रियाएँ जिन्हें वे लागू करना चाहते हैं (टी-परीक्षण, प्रतिगमन आदि) बड़े नमूनों में काफी अच्छी तरह से काम करते हैं - अक्सर तब भी जब मूल वितरण बिल्कुल स्पष्ट रूप से गैर-सामान्य होता है - बस जब एक अच्छाई का फिट परीक्षण सामान्यता को अस्वीकार करने की बहुत संभावना होगी । यह एक ऐसी प्रक्रिया का उपयोग करने से कम है जो आपको यह बताने की सबसे अधिक संभावना है कि आपका डेटा गैर-सामान्य है जब प्रश्न कोई मायने नहीं रखता है।एफ

ऊपर की छवि पर फिर से विचार करें। लाल वितरण गैर-सामान्य है, और वास्तव में बड़े नमूने के साथ हम एक नमूना से आधारित सामान्यता के परीक्षण को अस्वीकार कर सकते हैं ... लेकिन बहुत छोटे नमूना आकार, प्रतिगमन और दो नमूना टी-परीक्षण (और कई अन्य परीक्षण) पर इसके अलावा) इतनी अच्छी तरह से व्यवहार करेंगे क्योंकि यह उस गैर-सामान्यता के बारे में चिंता करने के लिए भी थोड़ा-बहुत बेकार कर देगा।

μ=μ0

आप विचलन के कुछ विशेष रूपों को निर्दिष्ट करने में सक्षम हो सकते हैं और समतुल्यता परीक्षण जैसे कुछ को देख सकते हैं, लेकिन यह फिट की अच्छाई के साथ एक तरह से मुश्किल है क्योंकि एक वितरण के करीब आने के लिए बहुत सारे तरीके हैं, लेकिन एक परिकल्पना से अलग है, और अलग है अंतर के रूपों के विश्लेषण पर अलग-अलग प्रभाव पड़ सकते हैं। यदि विकल्प एक व्यापक परिवार है जिसमें एक विशेष मामले के रूप में शून्य शामिल है, तो तुल्यता परीक्षण अधिक समझ में आता है (उदाहरण के लिए, गामा के खिलाफ परीक्षण घातांक) - और वास्तव में, "दो एकतरफा परीक्षण" दृष्टिकोण के माध्यम से किया जाता है, और हो सकता है कि औपचारिक रूप से "करीब पर्याप्त" होने का एक तरीका हो (या यह होगा कि क्या गामा मॉडल सच थे, लेकिन वास्तव में फिट परीक्षण की एक साधारण अच्छाई द्वारा खारिज कर दिया जाना लगभग निश्चित रूप से होगा,

फिट परीक्षण की भलाई (और अक्सर अधिक मोटे तौर पर, परिकल्पना परीक्षण) वास्तव में केवल स्थितियों की एक सीमित सीमा के लिए उपयुक्त है। आमतौर पर लोग जिस सवाल का जवाब देना चाहते हैं, वह इतना सटीक नहीं होता है, लेकिन कुछ हद तक अस्पष्ट और कठिन होता है - लेकिन जैसा कि जॉन टुके ने कहा, " सही सवाल का लगभग एक बेहतर जवाब, जो अक्सर अस्पष्ट होता है, एक सटीक उत्तर की तुलना में। गलत सवाल, जिसे हमेशा सटीक बनाया जा सकता है। "

अन्य अस्पष्ट प्रश्नों की संवेदनशीलता का आकलन करने के लिए अधिक अस्पष्ट प्रश्न का उत्तर देने के लिए उचित दृष्टिकोण में अनुकरण और पुन: नमूनाकरण जांच शामिल हो सकती है, जो अन्य स्थितियों की तुलना में विचार कर रहे हैं, जो उपलब्ध डेटा के साथ यथोचित संगत हैं।

ε


ग्लेन, यह एक महान जवाब है। क्या "अधिक अस्पष्ट प्रश्न का उत्तर देने के लिए उचित दृष्टिकोण" पर अधिक संसाधन हैं? ऐसे काम किए गए उदाहरणों को देखना बहुत अच्छा होगा जहां लोग जवाब दे रहे हैं "क्या मेरा डेटा मेरे उद्देश्यों के लिए एक्स को वितरित करने के लिए पर्याप्त है?" प्रसंग में।
स्टम्पी जो पीट

2
@StumpyJoePete यहां अधिक अस्पष्ट (लेकिन थोड़ा अलग) प्रश्न के उत्तर का एक उदाहरण है , जहां सिमुलेशन का उपयोग मोटे तौर पर न्याय करने के लिए किया जाता है कि तिरछा (घातांक, कहते हैं) के साथ टी-टेस्ट को लागू करने के लिए किस प्रकार का नमूना उचित हो सकता है डेटा। फिर एक अनुवर्ती प्रश्न में ओपी नमूने के बारे में अधिक जानकारी के साथ आया (यह असतत था, और जैसा कि यह निकला, "घातीय" की तुलना में बहुत अधिक तिरछा होगा), ... (ctd)
Glen_b -Reinstone Monica

2
(ctd) ... इस मुद्दे को और अधिक विस्तार से , फिर से सिमुलेशन का उपयोग करके पता लगाया गया । बेशक, व्यवहार में यह सुनिश्चित करने के लिए और अधिक 'आगे और पीछे' होने की जरूरत है कि यह व्यक्ति की वास्तविक जरूरतों के अनुरूप हो, न कि उनके प्रारंभिक विवरण से।
Glen_b -Reinstate Monica

धन्यवाद! ठीक उसी तरह की चीज है जिसकी मुझे तलाश थी।
स्टम्पी जो पीट सिप

17

मैंने दूसरा @ Glen_b का उत्तर दिया और कहा कि सामान्य रूप से "सबूतों के अभाव में सबूत नहीं होना अनुपस्थिति है" समस्या परिकल्पना परीक्षण और बनाता हैपी-उनके लगने से कम उपयोगी। आकलन अक्सर अच्छाई-में-फिट आकलन के लिए भी एक बेहतर दृष्टिकोण है। एक उपाय के रूप में कोलमोगोरोव-स्मिर्नोव दूरी का उपयोग कर सकते हैं। त्रुटि के एक मार्जिन के बिना इसका उपयोग करना मुश्किल है। रूढ़िवादी दृष्टिकोण मॉडलिंग को निर्देशित करने के लिए केएस दूरी की ऊपरी आत्मविश्वास सीमा को ले जाएगा। यह (ठीक से) बहुत अनिश्चितता का कारण बनेगा, जिससे किसी को यह निष्कर्ष निकालना पड़ सकता है कि पहली जगह में एक मजबूत तरीका चुनना पसंद किया जाता है। उस के साथ, और मूल लक्ष्य पर वापस, जब व्यक्ति अनुभवजन्य वितरण की तुलना में अधिक से अधिक कहता है, 2 संभव पैरामीट्रिक रूपों, अंतिम सज्जित वितरण के सही संस्करण में अनुभवजन्य संचयी वितरण फ़ंक्शन की तुलना में कोई बेहतर सटीकता नहीं है। इसलिए यदि वितरण के चयन को चलाने के लिए कोई विषय वस्तु सिद्धांत नहीं है,


3
मैं इस कारण से थाह नहीं लगा सकता; यहाँ कुछ बेहतरीन बिंदु हैं। यह मदद करता है अगर नीचे उतरने वाला व्यक्ति बताएगा कि उन्हें समस्या क्या है। शायद हम कुछ सीखेंगे।
Glen_b -Reinstate मोनिका

9

2

मुझे लगता है कि यह अकादमिक कार्य और व्यावहारिक निर्णय लेने के बीच के अंतर को स्पष्ट करने के लिए एक आदर्श उदाहरण है। अकादमिक सेटिंग्स (जहां मैं हूं) में, आप किसी भी तरह से जब तक आप इसे दूसरों के द्वारा उचित समझा जाता है, तब तक बहस कर सकते हैं। इसलिए, अनिवार्य रूप से हम एक-दूसरे के साथ अंतहीन, कभी-कभी गोलाकार, अर्ध-बर्गी के साथ समाप्त होते हैं। इस मायने में, यह लोगों को काम करने के लिए कुछ प्रदान करता है।

हालांकि, यदि आप वास्तव में वास्तव में निर्णय लेने की स्थिति में हैं, तो उत्तर निश्चित रूप से हां या नहीं है। निर्णय निर्माता के रूप में आपकी प्रतिष्ठा को नुकसान होगा। बेशक, एक विकल्प बनाने में न केवल आंकड़े शामिल हैं, बल्कि कभी-कभी जुआ और विश्वास की छलांग का एक तत्व भी शामिल है। संक्षेप में, इस तरह का व्यायाम निर्णय लेने के लिए कुछ हद तक उपयोगी है। हालांकि, क्या इस परिकल्पना परीक्षण पर पूरी तरह से अपने निर्णय पर भरोसा करना एक पूरी तरह से अलग कहानी है।


2
यह IMHO सही नहीं है। मैंने जो सबसे अच्छी किताब पढ़ी है, वह बताती है कि कोई भी निर्णय के हर चरण में अनिश्चितता को हमेशा शामिल करके बेहतर निर्णय लेता है, वह है नैट सिल्वर द सिग्नल और शोर । उदाहरण के लिए, जीतने वाले पोकर खिलाड़ी वे होते हैं, जो कभी नहीं मानते कि किसी निश्चित हाथ की संभावना 0 या 1. है
फ्रैंक हरेल

1
@FrankHarrell मैं सोच रहा हूं कि आप कैसे सवाल का जवाब देंगे कि क्या सड़क का निर्माण करना है, क्या शेयर खरीदना है। यह हां या ना का सवाल है। उन सवालों के प्रकार हैं जिन्हें वास्तविक निर्णय निर्माताओं को जवाब देने की आवश्यकता है।
LaTeXFan

1
@FrankHarrell निश्चित रूप से आँकड़े निर्णय लेने में मदद करने में एक भूमिका निभाता है। हालांकि, मजबूती के दृष्टिकोण से, हम जो कुछ भी कर रहे हैं वह वास्तविकता का अनुमान है। वहाँ गणित के टन कर रहे हैं बस के लिए जिम्मेदार नहीं है। और यह वह जगह है जहां अन्य साधन वृत्ति की तरह खेलते हैं।
LaTeXFan

1
पी

1
@FrankHarrell आपकी टिप्पणियों के लिए धन्यवाद। मुझे लगता है कि अपरिवर्तनीय निर्णयों के बीच आपका अंतर है और अन्यथा एक अच्छा बिंदु है। संक्षेप में, यह समस्या के समय आयाम के बारे में है। समय की एक छोटी अवधि के भीतर, अधिकांश निर्णय अपरिवर्तनीय हैं। ऐसा ही हुआ जब लोगों को कॉल करने के लिए मौके पर रखा गया। दूसरी ओर, यदि हम एक लंबी अवधि के दृष्टिकोण को वहन कर सकते हैं, तो आप सही हैं - एक प्रणाली होना बेहतर है जो परिस्थितियों में परिवर्तन का जवाब दे सकती है। फिर भी, कुछ क्षति, या तो वित्तीय या भौतिक, अपरिहार्य है।
LaTeXFan

2

मुद्दा यह है कि शुद्ध सांख्यिकीय दृष्टिकोण से आप स्वीकार नहीं कर सकते , लेकिन व्यवहार में आप करते हैं। उदाहरण के लिए, यदि आप मूल्य-पर-जोखिम या इसी तरह के उपायों का उपयोग करके पोर्टफोलियो के जोखिम का अनुमान लगा रहे हैं , तो पोर्टफोलियो वापसी वितरण काफी महत्वपूर्ण है। ऐसा इसलिए है क्योंकि जोखिम आपके वितरण की पूंछ द्वारा परिभाषित किया गया है।

पाठ्य पुस्तक के मामलों में, सामान्य वितरण अक्सर उदाहरण के लिए उपयोग किया जाता है। हालांकि, यदि आपके पोर्टफोलियो रिटर्न में वसा-पूंछ है (जो वे अक्सर करते हैं), सामान्य वितरण सन्निकटन जोखिमों को कम करेगा। इसलिए, रिटर्न की जांच करना और यह तय करना महत्वपूर्ण है कि आप सामान्य सन्निकटन का उपयोग करने जा रहे हैं या नहीं। ध्यान दें, यह जरूरी नहीं कि सांख्यिकीय परीक्षण चल रहे हों, यह QQ- प्लॉट या अन्य साधन हो सकते हैं। हालांकि, आपको रिटर्न और अपने रिटर्न मॉडल के विश्लेषण के आधार पर कुछ बिंदु पर निर्णय करना होगा और या तो सामान्य या नहीं का उपयोग करना होगा।

इसलिए, सभी व्यावहारिक उद्देश्यों के लिए, वास्तव में अस्वीकार करने का मतलब है कि कठोर सांख्यिकीय अर्थों में नहीं स्वीकार करना चाहिए । आप सामान्य को स्वीकार करने जा रहे हैं और अपनी गणनाओं में इसका उपयोग करते हैं, जो कि ऊपरी प्रबंधन को दैनिक आपके नियामकों, लेखा परीक्षकों आदि को दिखाया जाएगा । इस मामले में अस्वीकार न करना हर दृष्टि से बहुत दूरगामी परिणाम है, इसलिए यह इस प्रकार है मूर्खतापूर्ण सांख्यिकीय परिणाम की तुलना में अधिक शक्तिशाली।


0

अदालत में कोई भी प्रतिवादी कभी निर्दोष नहीं है। वे या तो दोषी हैं (निर्दोषों की अशक्त परिकल्पना को अस्वीकार) या दोषी नहीं हैं (निर्दोषता के अनुमान को अस्वीकार नहीं करते हैं)।

अभावों का अभाव अनुपस्थिति का प्रमाण नहीं है।


-1

इस प्रकार, मेरा प्रश्न यह है कि यदि हम किसी दिए गए वितरण का पालन करते हैं या नहीं, तो क्या हम निष्कर्ष नहीं निकाल सकते हैं कि इस तरह के परीक्षण करने का क्या मतलब है?

यदि आपके पास तुलना करने के लिए एक वैकल्पिक वितरण (या वितरण का सेट) है, तो यह एक उपयोगी उपकरण हो सकता है।

मैं कहूंगा: मेरे पास हाथ पर टिप्पणियों का एक सेट है जो मुझे लगता है कि सामान्य रूप से वितरित किया जा सकता है। (मुझे ऐसा लगता है क्योंकि मैंने एक समान चरित्र की टिप्पणियों को देखा है कि मैं संतुष्ट सामान्य रूप से सामान्य वक्र का पालन कर रहा था।) मुझे यह भी लगता है कि वे सामान्य वक्र का पालन नहीं कर सकते हैं लेकिन कुछ नियमित गैर-सामान्य वक्र हैं। (मुझे लगता है कि यह हो सकता है क्योंकि मैंने इस तरह के डेटा के शरीर देखे हैं जो सामान्य वक्र का पालन नहीं करते हैं, लेकिन जो उदाहरण के लिए, तिरछा, आदि थे) 3 I फिर फॉल-लोइंग लाइनों के साथ एक जांच करें: यदि अवलोकन एक सामान्य वितरण से आते हैं, मैं होने के रूप में कितनी बार इस तरह के एक ची-वर्ग होगा? निष्कर्ष है, "काफी मुश्किल से सौ में केवल दो बार।" मैं तब एक जांच करता हूं, कहा नहीं जाता है और गणना नहीं की जाती है, लेकिन मेरा मानना ​​है कि एक मान्य तर्क के पूरा होने के लिए बिल्कुल आवश्यक है, निम्नानुसार है: यदि वितरण गैर-सामान्य है, तो यह अनुभव, ची-स्क्वायर अंतर के कारण होता है, अक्सर होता है। (मुझे केवल यह कल्पना करना है कि गैर-सामान्य वक्र में वितरण का मनाया गया तिरछा चरित्र है।) इसलिए मैं इस सिद्धांत पर सामान्य परिकल्पना को अस्वीकार करता हूं कि मैं स्वीकार करता हूं कि वैकल्पिक विकल्पों में से एक माना जाता है जिस पर अनुभवी घटना अधिक होगी बार-बार। मैं कहता हूं कि अशक्त परिकल्पना की अस्वीकृति केवल एक विकल्प को स्वीकार करने की इच्छा पर मान्य है (यह विकल्प सभी मामलों में ठीक से परिभाषित नहीं है)। ) इसलिए मैं इस सिद्धांत पर सामान्य परिकल्पना को खारिज करता हूं कि मैं स्वीकार करता हूं कि वैकल्पिक में से एक परिकल्पना है जिस पर अनुभवी घटना अधिक बार होगी। मैं कहता हूं कि अशक्त परिकल्पना की अस्वीकृति केवल एक विकल्प को स्वीकार करने की इच्छा पर मान्य है (यह विकल्प सभी मामलों में ठीक से परिभाषित नहीं है)। ) इसलिए मैं इस सिद्धांत पर सामान्य परिकल्पना को खारिज करता हूं कि मैं स्वीकार करता हूं कि वैकल्पिक में से एक परिकल्पना है जिस पर अनुभवी घटना अधिक बार होगी। मैं कहता हूं कि अशक्त परिकल्पना की अस्वीकृति केवल एक विकल्प को स्वीकार करने की इच्छा पर मान्य है (यह विकल्प सभी मामलों में ठीक से परिभाषित नहीं है)।

अब मेरे द्वारा वर्णित तर्क की पंक्ति, जो मैंने हमेशा की तरह वर्णित की है, के साथ विपरीत है, यह बताती है कि मेरी डिक्री तीसरे और चौथे मामलों में दिनचर्या से अलग क्यों है।

तीसरे मामले के संबंध में, जब मैंने ची-स्क्वायर परीक्षण की कोशिश की है, मैं इस निष्कर्ष पर पहुंचा हूं, कि सामान्यता से कोई अंतर नहीं होने की परिकल्पना पर, इतने बड़े ची-वर्ग के साथ वितरण शायद ही कभी होता। अब तक हम ठीक उसी स्थिति में हैं जैसे हम दूसरे मामले में इस बिंदु पर थे। लेकिन अब मुझे इस संभावना की जांच करने दें कि यह अनुभव तब होगा जब मूल आपूर्ति एक नियमित गैर-सामान्य एक थी। क्या यह अनुभव अधिक बार होगा? ऐसा कहने का कोई कारण नहीं है। वितरण पूरी तरह से सममित है, यानी, तिरछा शून्य है (मतलब के प्रत्येक पक्ष पर लगभग 50 प्रतिशत मामले थे), और विभिन्न वर्गों में अपेक्षित आवृत्तियों से अंतर की एक सरसरी परीक्षा से पता चलता है कि वे सीस नहीं हैं- मंदिर, प्लस विचलन और माइनस विचलन यादृच्छिक क्रम में वैकल्पिक होते हैं। इस तरह के वितरण को किसी भी प्रशंसनीय गैर-सामान्य वक्र से अक्सर उम्मीद नहीं की जाती है। इसलिए हमारे पास सामान्य वक्र की अस्वीकृति के लिए कोई कारण नहीं है।

मेरा विचार यह है कि किसी वैकल्पिक विकल्प को तैयार करने की इच्छा को छोड़कर अशक्त परिकल्पना को अस्वीकार करने का कोई मान्य कारण नहीं है।

ची-स्क्वायर टेस्ट के आवेदन में व्याख्या की कुछ कठिनाइयों। जोसेफ बर्कसन। अमेरिकन स्टैटिस्टिकल एसोसिएशन का जरनल। वॉल्यूम। 33, नंबर 203 (सित।, 1938), पीपी। 526-536


1
बर्कसन उद्धरण / कागज मुझे प्रासंगिक और उचित लगता है। यह लोकप्रिय ज्ञान है कि बड़े पर्याप्त नमूना आकार के साथ किसी भी ग्रहण किए गए वितरण को अस्वीकार कर दिया जाएगा, भले ही माप त्रुटि के कारण ही हो। यदि हम पाते हैं कि डेटा कुछ अनुमानित वितरण के तहत होने की संभावना नहीं है, तो क्या हमें यह पता लगाने की कोशिश नहीं करनी चाहिए कि बेहतर विकल्प क्या होगा? और अगर हम इन अन्य विकल्पों को सही नहीं ठहरा सकते हैं, तो हमें यह मान लेना चाहिए कि यदि आवश्यक हो, तो सबसे सरल वितरण संभव है? क्या कोई समझा सकता है कि इसे क्यों ठुकरा दिया गया?
नाराज
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.