सांख्यिकीय परीक्षणों में p मान और t मान का क्या अर्थ है?


246

एक सांख्यिकी पाठ्यक्रम लेने और फिर साथी छात्रों की मदद करने की कोशिश करने के बाद, मैंने एक विषय पर ध्यान दिया, जो बहुत हेड-डेस्क बैंगिंग को प्रेरित करता है, सांख्यिकीय परिकल्पना परीक्षणों के परिणामों की व्याख्या कर रहा है। ऐसा लगता है कि छात्र आसानी से किसी दिए गए परीक्षण के लिए आवश्यक गणना करना सीख जाते हैं, लेकिन परिणाम की व्याख्या करने पर लटका देते हैं। कई कम्प्यूटरीकृत उपकरण "पी वैल्यू" या "टी वैल्यू" के संदर्भ में परीक्षा परिणाम की रिपोर्ट करते हैं।

आप आंकड़ों में अपना पहला पाठ्यक्रम लेने वाले कॉलेज के छात्रों को निम्नलिखित बिंदु कैसे समझाएंगे:

  • परिकल्पना के परीक्षण के संबंध में "पी-वैल्यू" का क्या अर्थ है? क्या ऐसे मामले हैं जब किसी को उच्च पी-मूल्य या कम पी-मूल्य की तलाश करनी चाहिए?

  • पी-वैल्यू और टी-वैल्यू के बीच क्या संबंध है?


11
इसका एक उचित बिट मूल रूप से p मानों पर विकिपीडिया लेख के पहले वाक्य द्वारा कवर किया गया है , जो एक पी-मूल्य को सही ढंग से परिभाषित करता है। अगर यह समझा जाए तो बहुत कुछ स्पष्ट हो जाता है।
ग्लेन_ब

1
बस पुस्तक प्राप्त करें: आँसू के बिना सांख्यिकी। यह आपकी पवित्रता को बचा सकता है !!

7
@ user48700 क्या आप संक्षेप में बता सकते हैं कि आँसू के बिना सांख्यिकी यह कैसे समझाती है?
मैट क्रूज़

5
किसी को समय के साथ पी-मूल्य से संबंधित प्रश्नों का एक ग्राफ खींचना चाहिए और मुझे यकीन है कि हम कॉलेजों या कौरसा डेटा साइंस कक्षाओं में अकादमिक कैलेंडर के लिए मौसमी और सहसंबंध देखेंगे
अक्सकाल

उत्तर और टिप्पणियों में अन्य अच्छी और प्रासंगिक पुस्तक सिफारिशों के अलावा, मैं एक और पुस्तक का सुझाव देना चाहूंगा, जिसे उचित रूप से "क्या एक पी-मूल्य है?"
अलेक्सांद्र ब्लेक

जवाबों:


150

समझना -valuep

मान लीजिए, आप इस परिकल्पना का परीक्षण करना चाहते हैं कि आपके विश्वविद्यालय में पुरुष छात्रों की औसत ऊंचाई फीट इंच है। आप यादृच्छिक पर चुने गए छात्रों की ऊंचाइयों को इकट्ठा करते हैं और नमूना माध्य की गणना करते हैं (कहते हैं कि यह फीट इंच निकला )। एक उपयुक्त सूत्र / सांख्यिकीय दिनचर्या का उपयोग करके आप अपनी परिकल्पना के लिए -value की गणना करते हैं और कहते हैं कि यह निकला ।5100 5 9 पी 0.06710059p0.06

उचित रूप से व्याख्या करने के लिए , हमें कई बातों को ध्यान में रखना चाहिए:p=0.06

  1. शास्त्रीय परिकल्पना परीक्षण के तहत पहला कदम यह धारणा है कि विचाराधीन परिकल्पना सत्य है। (हमारे संदर्भ में, हम मानते हैं कि सही औसत ऊँचाई फीट इंच है।)757

  2. निम्नलिखित गणना करने की कल्पना करें: इस संभावना की गणना करें कि नमूना माध्य फीट इंच से अधिक है यह मानते हुए कि हमारी परिकल्पना वास्तव में सही है (बिंदु 1 देखें)।59

दूसरे शब्दों में, हम को जानना चाहते हैं

P(Samplemean5ft9inches|Truevalue=5ft7inches).

चरण 2 में गणना कहा जाता है -value। इसलिए, एक की -value मतलब है कि (हम चयन हर बार करता है, तो हम अपने प्रयोग कई दोहराने के लिए, कई बार होने पर होता यादृच्छिक पर छात्रों और गणना नमूना मतलब है) तो से बाहर गुना हम एक नमूना देखने की उम्मीद कर सकते हैं फीट इंच से अधिक या बराबर का मतलब है ।पी 0.06 100 6 100 5 9pp0.06100610059

उपरोक्त समझ को देखते हुए, क्या हमें अभी भी अपनी धारणा को बनाए रखना चाहिए कि हमारी परिकल्पना सच है (चरण 1 देखें)? खैर, एक इंगित करता है कि दो चीजों में से एक हुआ है:p=0.06

  • (ए) या तो हमारी परिकल्पना सही है और एक बेहद अप्रत्याशित घटना घटित हुई है (उदाहरण के लिए, सभी छात्र छात्र एथलीट हैं)100

या

  • (बी) हमारी धारणा गलत है और हमने जो नमूना लिया है वह असामान्य नहीं है।

(ए) और (बी) के बीच चयन करने का पारंपरिक तरीका लिए एक मनमाना कट-ऑफ चुनना है । हम चुनते हैं (ए) अगर और (बी) अगर ।p > 0.05 p < 0.05pp>0.05p<0.05


3
पर्याप्त समय लो! मैं एक या दो सप्ताह के लिए "सर्वश्रेष्ठ उत्तर" का चयन करने के बारे में नहीं सोचूंगा।
शार्प

1
अब जब मुझे वापस आने का मौका मिला है और पूरे उत्तर को पढ़ने का मौका मिला है - छात्र ऊंचाई उदाहरण के लिए एक बड़ा +1। बहुत स्पष्ट और अच्छी तरह से निर्धारित किया गया है।
शार्प जूल

3
अच्छा काम ... लेकिन हमें अपने मॉडल (सूत्र / सांख्यिकीय दिनचर्या में सन्निहित) को जोड़ना होगा (सी)।
एंड्रयू रॉबिन्सन

6
एक टी-मूल्य (या किसी भी अन्य परीक्षण आँकड़ा) ज्यादातर एक मध्यवर्ती कदम है। यह मूल रूप से कुछ सांख्यिकीय है जो कुछ मान्यताओं के तहत, एक प्रसिद्ध वितरण के लिए साबित हुआ था। चूँकि हम अशक्त के तहत परीक्षण सांख्यिकीय के वितरण को जानते हैं, इसलिए हम पी-मान प्राप्त करने के लिए मानक तालिकाओं (आज अधिकतर सॉफ्टवेयर) का उपयोग कर सकते हैं।
गाला

1
क्या चि-वर्ग परीक्षण करने और फिर ची-स्क्वायर तालिका से करने के परिणामस्वरूप पी-मान प्राप्त नहीं हुआ है? सोच रहा था कि कैसे ऊपर आने की संभावना पी-वैल्यू को इंगित करती है?
लंदन का लड़का

123

एक शिक्षक और एक विचारशील छात्र के बीच संवाद

विनम्रतापूर्वक इस विश्वास के साथ प्रस्तुत किया गया कि इस धागे में अब तक पर्याप्त क्रेयॉन का उपयोग नहीं किया गया है। एक संक्षिप्त सचित्र सारांश अंत में दिखाई देता है।


छात्र : पी-वैल्यू का क्या मतलब है? बहुत से लोग इस बात से सहमत हैं कि यह मौका है कि हम " एक आंकड़े को" या उससे अधिक "के बराबर या इसके बराबर का अर्थ देखेंगे" यह इस परिणाम को देखने की संभावना है ... दिए गए शून्य परिकल्पना सच है " या " मेरे नमूने का आँकड़ा कहाँ है ? [एक सिम्युलेटेड] वितरण पर गिर गया और यहां तक ​​कि "परीक्षण परिकल्पना के अवलोकन की संभावना कम से कम उतनी बड़ी है जितना कि एक अनुमान परिकल्पना सच है"

शिक्षक : ठीक से समझा, उन सभी बयानों को कई परिस्थितियों में सही बताया गया है।

छात्र : मैं यह नहीं देखता कि उनमें से अधिकांश कैसे प्रासंगिक हैं। क्या आपने हमें यह नहीं सिखाया कि हमें एक शून्य परिकल्पना और एक वैकल्पिक परिकल्पना ? वे "इनसे अधिक या बराबर" या "कम से कम जितना बड़ा" या बहुत लोकप्रिय "अधिक चरम" के इन विचारों में कैसे शामिल हैं?एच एच H0HA

शिक्षक : क्योंकि यह सामान्य रूप से जटिल लग सकता है, क्या यह हमारे लिए एक ठोस उदाहरण तलाशने में मदद करेगा?

छात्र : ज़रूर। लेकिन अगर आप कर सकते हैं तो कृपया इसे यथार्थवादी लेकिन सरल बनाएं।

शिक्षक : परिकल्पना त्रुटियों का विश्लेषण करने के लिए खगोलविदों की आवश्यकता के साथ ऐतिहासिक रूप से परिकल्पना परीक्षण का यह सिद्धांत शुरू हुआ, इसलिए वहां कैसे शुरू किया जाए। मैं एक दिन कुछ पुराने दस्तावेजों से गुजर रहा था जहां एक वैज्ञानिक ने अपने तंत्र में माप त्रुटि को कम करने के अपने प्रयासों का वर्णन किया। उन्होंने एक ज्ञात स्थिति में एक तारे का बहुत माप लिया था और उस स्थान के आगे या पीछे उनके विस्थापन को रिकॉर्ड किया था। उन विस्थापनों की कल्पना करने के लिए, उन्होंने एक हिस्टोग्राम आकर्षित किया कि - जब थोड़ा चिकना किया जाए - इस तरह से देखा।

चित्र 1: विस्थापन का हिस्टोग्राम

छात्र : मुझे याद है कि हिस्टोग्राम कैसे काम करता है: ऊर्ध्वाधर अक्ष को "घनत्व" के रूप में लेबल किया जाता है ताकि मुझे याद दिलाया जा सके कि माप के सापेक्ष आवृत्तियों को ऊंचाई के बजाय क्षेत्र द्वारा दर्शाया गया है

शिक्षक : यह सही है। एक "असामान्य" या "चरम" मूल्य बहुत छोटे क्षेत्र वाले क्षेत्र में स्थित होगा। यहाँ एक क्रेयॉन है। क्या आपको लगता है कि आप ऐसे क्षेत्र में रंग कर सकते हैं, जिसका क्षेत्रफल कुल मिलाकर दसवां है?

छात्र : ज़रूर; यह आसान है। [आंकड़े में रंग।]

चित्र 2: छात्र का पहला रंग।

टीचर : बहुत अच्छा! यह मेरे लिए लगभग 10% क्षेत्र जैसा दिखता है। हालांकि, याद रखें कि हिस्टोग्राम में एकमात्र क्षेत्र जो कि ऊर्ध्वाधर रेखाओं के बीच का मामला है: वे उस मौके या संभावना का प्रतिनिधित्व करते हैं कि विस्थापन क्षैतिज अक्ष पर उन रेखाओं के बीच स्थित होगा इसका मतलब है कि आपको नीचे से पूरे रास्ते को रंगने की जरूरत है और यह आधे से अधिक क्षेत्र में होगा, है ना?

स्टूडेंट : ओह, मैं देख रहा हूं। मुझे दोबारा प्रयास करने दें। मैं उस रंग में रंगना चाहता हूं, जहां वक्र वास्तव में कम है, मैं नहीं करूंगा? यह दो छोरों पर सबसे कम है। क्या मुझे सिर्फ एक क्षेत्र में रंग देना है या इसे कई हिस्सों में तोड़ना ठीक रहेगा?

शिक्षक : कई भागों का उपयोग करना एक स्मार्ट विचार है। वे कहां होंगे?

छात्र (इशारा करते हुए): यहां और यहां। क्योंकि यह क्रेयॉन बहुत तेज नहीं है, मैंने आपके द्वारा उपयोग की जा रही लाइनों को दिखाने के लिए एक पेन का उपयोग किया।

चित्र 3: छात्र का दूसरा रंग

टीचर : बहुत अच्छा! मैं आपको बाकी की कहानी बताता हूँ। वैज्ञानिक ने अपने डिवाइस में कुछ सुधार किए और फिर उन्होंने अतिरिक्त माप लिया। उन्होंने लिखा है कि पहले एक का विस्थापन केवल था , जो उन्होंने सोचा था कि यह एक अच्छा संकेत है, लेकिन एक सावधान वैज्ञानिक होने के नाते वह चेक के रूप में अधिक माप लेने के लिए आगे बढ़े। दुर्भाग्य से, वे अन्य माप खो गए हैं - इस बिंदु पर पांडुलिपि टूट जाती है - और हमारे पास वह एकल संख्या, ।0.10.10.1

छात्र : यह बहुत बुरा है। लेकिन क्या यह आपके आंकड़े में विस्थापन के व्यापक प्रसार से बेहतर नहीं है?

टीचर : यही वो सवाल है जिसका जवाब मैं तुम्हें देना चाहूंगा। शुरू करने के लिए, हमें रूप में क्या प्रस्तुत करना चाहिए ?H0

छात्र : ठीक है, एक उलझन में आश्चर्य होगा कि क्या डिवाइस में किए गए सुधारों का कोई प्रभाव पड़ा। सबूत का बोझ वैज्ञानिक पर है: वह दिखाना चाहते हैं कि संदेह गलत है। इससे मुझे लगता है कि शून्य परिकल्पना वैज्ञानिक के लिए बुरी तरह से गलत है: यह कहता है कि सभी नए माप - जिनमें के मूल्य के बारे में हम जानते हैं - पहले हिस्टोग्राम द्वारा वर्णित व्यवहार करना चाहिए। या शायद इससे भी बदतर: वे और भी अधिक फैल हो सकते हैं।0.1

टीचर : चलो, तुम अच्छा कर रहे हो।

छात्र : और इसलिए विकल्प यह है कि नए माप कम फैल जाएंगे , है ना?

टीचर : बहुत अच्छा! क्या आप मुझे चित्र दिखा सकते हैं कि कम फैलाव वाला हिस्टोग्राम कैसा दिखेगा? यहाँ पहले हिस्टोग्राम की एक और प्रति है; आप एक संदर्भ के रूप में इसके ऊपर आकर्षित कर सकते हैं।

छात्र (ड्राइंग): मैं नए हिस्टोग्राम को रेखांकित करने के लिए एक कलम का उपयोग कर रहा हूं और इसके नीचे के क्षेत्र में रंग भर रहा हूं। मैंने इसे बनाया है इसलिए अधिकांश वक्र क्षैतिज अक्ष पर शून्य के करीब है और इसलिए इसका अधिकांश क्षेत्र शून्य के (क्षैतिज) मान के पास है: इसका मतलब है कि इसका प्रसार कम या अधिक सटीक होना चाहिए।

चित्र 4: छात्र का नया हिस्टोग्राम

शिक्षक : यह एक अच्छी शुरुआत है। लेकिन याद रखें कि एक हिस्टोग्राम दिखाने की संभावना का कुल क्षेत्रफल होना चाहिए । पहले हिस्टोग्राम का कुल क्षेत्रफल । आपके नए हिस्टोग्राम के अंदर कितना क्षेत्र है?11

छात्र : आधे से भी कम, मुझे लगता है। मुझे लगता है कि यह एक समस्या है, लेकिन मुझे नहीं पता कि इसे कैसे ठीक किया जाए। मुझे क्या करना चाहिए?

शिक्षक : चाल नए हिस्टोग्राम को पुराने की तुलना में ऊंचा बनाने के लिए है ताकि इसका कुल क्षेत्रफल । यहाँ, मैं आपको एक कंप्यूटर-जेनरेट किया गया संस्करण दिखाऊंगा।1

चित्र 5: शिक्षक का नया हिस्टोग्राम

छात्र : मैं देखता हूं: आपने इसे लंबवत रूप से फैलाया है, इसलिए इसका आकार वास्तव में नहीं बदला है, लेकिन अब लाल क्षेत्र और ग्रे क्षेत्र (लाल रंग के नीचे का हिस्सा सहित) समान मात्रा में हैं।

शिक्षक : सही है। आप अशक्त परिकल्पना की एक तस्वीर देख रहे हैं (नीले रंग में, फैला हुआ) और वैकल्पिक परिकल्पना का हिस्सा (लाल रंग में, कम प्रसार के साथ)।

छात्र : विकल्प के "भाग" से आपका क्या तात्पर्य है? यह सिर्फ नहीं है वैकल्पिक परिकल्पना?

शिक्षक : सांख्यिकीविद् और व्याकरण मिश्रण नहीं लगते हैं। :-) गंभीरता से, एक "परिकल्पना" से उनका क्या मतलब है आमतौर पर संभावनाओं का एक बड़ा समूह है। यहाँ, विकल्प (जैसा आपने पहले कहा था) कि माप पहले की तुलना में "कम फैला हुआ" है। लेकिन कितना कम ? बहुत संभावनाएं हैं। यहाँ, मैं तुम्हें दूसरा दिखाऊँ। मैंने इसे पीले डैश के साथ आकर्षित किया। यह पिछले दो के बीच में है।

चित्र 6: विकल्प के दो तत्वों के साथ अशक्त

छात्र : मैं देखता हूं: आपके पास प्रसार की अलग-अलग मात्रा हो सकती है, लेकिन आप पहले से नहीं जानते हैं कि वास्तव में प्रसार कितना होगा। लेकिन आपने इस तस्वीर में मज़ाकिया छायांकन क्यों बनाया?

शिक्षक : मैं इस बात पर प्रकाश डालना चाहता था कि हिस्टोग्राम कहाँ और कैसे भिन्न होते हैं। मैंने उन्हें ग्रे रंग में छायांकित किया जहां वैकल्पिक हिस्टोग्राम शून्य से कम और लाल रंग में हैं जहां विकल्प अधिक हैं

छात्र : वह बात क्यों होगी?

शिक्षक : क्या आपको याद है कि आपने दोनों पूंछों में पहले हिस्टोग्राम को कैसे रंगा था? [कागजात के माध्यम से देख रहे हैं।] आह, यहाँ यह है। इस तस्वीर को उसी तरह से रंग दें।

चित्र 7: अशक्त और वैकल्पिक, रंगीन।

छात्र : मुझे याद है: वे चरम मूल्य हैं। मैंने उन स्थानों को पाया जहां नल का घनत्व यथासंभव छोटा था और वहां के 10% क्षेत्र में रंगीन था।

शिक्षक : मुझे उन चरम क्षेत्रों में विकल्पों के बारे में बताओ।

छात्र : यह देखना मुश्किल है, क्योंकि क्रेयॉन ने इसे कवर किया था, लेकिन ऐसा लग रहा है कि मेरे द्वारा चुने गए क्षेत्रों में होने के लिए किसी भी विकल्प के लिए लगभग कोई मौका नहीं है। उनके हिस्टोग्राम सही मूल्य अक्ष के खिलाफ नीचे हैं और उनके नीचे किसी भी क्षेत्र के लिए कोई जगह नहीं है।

शिक्षक : चलो उस विचार को जारी रखें। अगर मैंने आपको बताया, काल्पनिक रूप से, कि एक माप में विस्थापन था , और आपको यह चुनने के लिए कहा कि इन तीन हिस्टोग्राम में से कौन सा सबसे अधिक संभावना है, जो यह था?2

छात्र : पहला वाला - नीला वाला। यह सबसे अधिक फैला हुआ है और यह एकमात्र ऐसा है जहाँ होने की संभावना है।2

शिक्षक : और पांडुलिपि में के मूल्य के बारे में क्या ?0.1

स्टूडेंट : ह्म्म्म ... यह एक अलग कहानी है। सभी तीन हिस्टोग्राम पर जमीन से काफी ऊपर हैं ।0.1

शिक्षक : ठीक है, बहुत अच्छा। लेकिन मान लीजिए कि मैंने आपको बताया कि मान और बीच कहीं पास था । क्या यह इन ग्राफ़ों से दूर कुछ संभावनाओं को पढ़ने में आपकी मदद करता है?0 0.20.100.2

छात्र : ज़रूर, क्योंकि मैं क्षेत्रों का उपयोग कर सकता हूं। मुझे सिर्फ और बीच प्रत्येक वक्र के नीचे के क्षेत्रों का अनुमान लगाना है । लेकिन यह बहुत मुश्किल लग रहा है।0.200.2

शिक्षक : आपको उस दूर जाने की आवश्यकता नहीं है। क्या आप बता सकते हैं कि कौन सा क्षेत्र सबसे बड़ा है?

छात्र : सबसे लंबा वक्र के नीचे, बिल्कुल। तीनों क्षेत्रों में एक ही आधार होता है, इसलिए वक्र जितना लंबा होता है, उतना ही अधिक क्षेत्र इसके नीचे और आधार होता है। इसका मतलब है कि सबसे लंबा हिस्टोग्राम - जिसे मैंने आकर्षित किया, लाल डैश के साथ - विस्थापन के लिए सबसे अधिक संभावना है । मुझे लगता है कि मैं देख रहा हूँ जहाँ आप इस के साथ जा रहे हैं, लेकिन मैं एक छोटे से चिंतित हूँ: कि मैं को देखने के लिए नहीं सभी के लिए हिस्टोग्राम सभी विकल्प, नहीं सिर्फ एक या दो यहाँ दिखाया गया है? मैं संभवतः ऐसा कैसे कर सकता हूं?0.1

शिक्षक : आप पैटर्न उठाने में अच्छे हैं, इसलिए मुझे बताएं: जैसा कि माप उपकरण को अधिक से अधिक सटीक बनाया जाता है, उसके हिस्टोग्राम का क्या होता है?

स्टूडेंट : यह संकरा हो जाता है - ओह, और इसे भी लंबा होना है, इसलिए इसका कुल क्षेत्रफल समान है। यह हिस्टोग्राम की तुलना में बहुत कठिन बनाता है। विकल्प होते हैं सब पर अशक्त सही की तुलना में अधिक , कि स्पष्ट है। लेकिन अन्य मूल्यों पर कभी-कभी विकल्प अधिक होते हैं और कभी-कभी वे कम होते हैं! उदाहरण के लिए, [ पास एक मूल्य पर इशारा करते हुए ], यहीं मेरा लाल हिस्टोग्राम सबसे कम है, पीला हिस्टोग्राम सबसे अधिक है, और मूल नल हिस्टोग्राम उनके बीच है। लेकिन दाईं ओर का नल सबसे ऊंचा है।3 / 403/4

शिक्षक : सामान्य तौर पर, हिस्टोग्राम की तुलना करना एक जटिल व्यवसाय है। इसे करने में हमारी मदद करने के लिए, मैंने कंप्यूटर को एक और प्लॉट बनाने के लिए कहा है: इसने वैकल्पिक हिस्टोग्राम हाइट्स (या "डेंसिटीज़") में से प्रत्येक को अशक्त हिस्टोग्राम ऊँचाई से विभाजित किया है , जिससे "संभावना अनुपात" के रूप में जाना जाता है। नतीजतन, से अधिक मूल्य का अर्थ है विकल्प अधिक संभावना है, जबकि से कम मूल्य का अर्थ है विकल्प की संभावना कम है। इसने अभी तक एक और विकल्प तैयार किया है: यह अन्य दो की तुलना में अधिक फैला हुआ है, लेकिन मूल उपकरण की तुलना में अभी भी कम फैला हुआ है।11

चित्रा 8: संभावना अनुपात

शिक्षक (जारी): क्या आप मुझे दिखा सकते हैं कि विकल्प शून्य से अधिक होने की संभावना है?

छात्र (रंग): यहाँ बीच में, जाहिर है। और क्योंकि ये अब हिस्टोग्राम नहीं हैं, मुझे लगता है कि हमें क्षेत्रों के बजाय ऊंचाइयों को देखना चाहिए, इसलिए मैं क्षैतिज अक्ष पर मूल्यों की एक श्रृंखला को चिह्नित कर रहा हूं। लेकिन मुझे कैसे पता चलेगा कि रंग में कितना मध्य है? मैं कहां से रंग भरना बंद कर दूं?

चित्र 9: चिह्नित-अप संभावना अनुपात भूखंड

शिक्षक : कोई ठोस नियम नहीं है। यह सब इस बात पर निर्भर करता है कि हम अपने निष्कर्षों का उपयोग करने की योजना कैसे बनाते हैं और संशयवादी कितने भयंकर हैं। लेकिन वापस बैठो और सोचें कि आपने क्या पूरा किया है: अब आप महसूस करते हैं कि बड़ी संभावना अनुपात के साथ परिणाम विकल्प के लिए सबूत हैं और छोटे संभावना अनुपात के साथ परिणाम विकल्प के खिलाफ सबूत हैं । जो मैं आपसे करने के लिए कहूंगा, वह उस क्षेत्र में रंग करना है जो कि, जैसा कि संभव है, नासमझ परिकल्पना के तहत होने का एक छोटा मौका है और विकल्पों के तहत होने की अपेक्षाकृत बड़ी संभावना है। पहले रंगीन चित्र पर वापस जाएं, जिस तरह से हमारी बातचीत की शुरुआत में, आप नल की दो पूंछों में रंगते हैं क्योंकि वे "चरम" थे। क्या वे अब भी अच्छा काम करेंगे?

छात्र : मुझे ऐसा नहीं लगता। हालांकि वे अशक्त परिकल्पना के तहत बहुत चरम और दुर्लभ थे, फिर भी वे किसी भी विकल्प के लिए व्यावहारिक रूप से असंभव हैं। यदि मेरा नया माप , तो मुझे लगता है कि मैं संदेह और इनकार करूंगा कि कोई सुधार हुआ था, भले ही किसी भी मामले में एक असामान्य परिणाम था। मैं उस रंग को बदलना चाहता हूं। यहाँ - मुझे एक और क्रेयॉन है।3.03.03.0

चित्रा 10: बेहतर मार्कअप

शिक्षक : वह क्या दर्शाता है?

छात्र : हमने आपके साथ मूल हिस्टोग्राम के तहत सिर्फ 10% क्षेत्र में ड्रॉ करने के लिए कहा था - जो कि अशक्त वर्णन करता है। इसलिए अब मैंने 10% क्षेत्र में आकर्षित किया, जहां विकल्प होने की अधिक संभावना है। मुझे लगता है कि जब एक नया माप उस क्षेत्र में होता है, तो यह हमें बताता है कि हमें विकल्प पर विश्वास करना चाहिए।

शिक्षक : और उस पर संदेह कैसे करना चाहिए?

स्टूडेंट : एक संशयवादी को कभी नहीं मानना ​​होगा कि वह गलत है, क्या वह? लेकिन मुझे लगता है कि उनका विश्वास थोड़ा हिलना चाहिए। आखिरकार, हमने इसे व्यवस्थित किया, हालांकि एक माप उस क्षेत्र के अंदर हो सकता है जिसे मैंने अभी आकर्षित किया है, यह केवल 10% होने की संभावना है जब अशक्त सही है। और इसका एक बड़ा मौका है जब विकल्प सही हो। मैं आपको यह नहीं बता सकता कि वह मौका कितना बड़ा है, क्योंकि यह इस बात पर निर्भर करेगा कि वैज्ञानिक ने तंत्र में कितना सुधार किया। मुझे पता है कि यह बड़ा है। तो सबूत संदेह के खिलाफ होगा।

शिक्षक : बिलकुल ठीक। क्या आप अपनी समझ को सारांशित करेंगे ताकि हम आपके द्वारा सीखी गई बातों के बारे में पूरी तरह स्पष्ट हो जाएँ।

छात्र : मैंने सीखा है कि वैकल्पिक परिकल्पनाओं को शून्य परिकल्पनाओं की तुलना करने के लिए, हमें उनके हिस्टोग्राम की तुलना करनी चाहिए। हम विकल्प के घनत्व को शून्य के घनत्व से विभाजित करते हैं: जिसे आपने "संभावना अनुपात" कहा है। एक अच्छा परीक्षण करने के लिए, मुझे 10% की तरह एक छोटी संख्या चुननी चाहिए या जो कुछ भी हो सकता है वह एक संदेह को हिला सकता है। फिर मुझे उन मूल्यों का पता लगाना चाहिए जहां संभावना अनुपात उतना ही अधिक है और उन्हें 10% (या जो भी) रंग दिया गया है उसमें रंग दें।

शिक्षक : और तुम उस रंग का उपयोग कैसे करोगे?

छात्र : जैसा कि आपने मुझे पहले याद दिलाया था, रंग ऊर्ध्वाधर लाइनों के बीच होना चाहिए। मान (क्षैतिज अक्ष पर) जो रंग के नीचे स्थित हैं, अशक्त परिकल्पना के विरुद्ध प्रमाण हैं। अन्य मूल्य - ठीक है, यह कहना मुश्किल है कि इसमें शामिल सभी हिस्टोग्राम पर अधिक विस्तृत नज़र डाले बिना उनका क्या मतलब हो सकता है।

शिक्षक : पांडुलिपि में के मूल्य पर वापस जाना, आप क्या निष्कर्ष निकालेंगे?0.1

छात्र : यह उस क्षेत्र के भीतर है जहां मैं आखिरी बार रंगीन था, इसलिए मुझे लगता है कि वैज्ञानिक शायद सही थे और उपकरण में वास्तव में सुधार हुआ था।

टीचर : एक आखिरी बात। आपका निष्कर्ष परीक्षण के मानदंड, या "आकार" के रूप में 10% चुनने पर आधारित था। बहुत से लोग इसके बजाय 5% का उपयोग करना पसंद करते हैं। कुछ 1% पसंद करते हैं। आप उन्हें क्या बता सकते थे?

छात्र : मैं एक बार में उन सभी परीक्षणों को नहीं कर सका! खैर, शायद मैं एक तरह से कर सकता था। मैं देख सकता हूं कि कोई भी आकार परीक्षण नहीं होना चाहिए, मुझे से रंग शुरू करना चाहिए , जो इस अर्थ में "सबसे चरम" मूल्य है, और वहां से दोनों दिशाओं में बाहर की ओर काम करते हैं। यदि मैं पर सही रोकना चाहता था - तो वास्तव में देखा गया मान - मुझे लगता है कि मैं और बीच कहीं के क्षेत्र में रंग गया होगा , कहते हैं । 5% और 1% लोग तुरंत बता सकते हैं कि मैं बहुत अधिक रंगीन हूं: यदि वे सिर्फ 5% या 1% रंग करना चाहते थे, तो वे कर सकते थे, लेकिन वे रूप में बाहर नहीं निकलेंगे।0.1 0.05 0.1 0.08 0.100.10.050.10.080.1। वे उसी निष्कर्ष पर नहीं पहुंचेंगे जो मैंने किया था: वे कहेंगे कि पर्याप्त सबूत नहीं हैं कि वास्तव में परिवर्तन हुआ है।

शिक्षक : आपने अभी मुझे बताया है कि शुरुआत में उन सभी उद्धरणों का वास्तव में क्या मतलब है। इस उदाहरण से यह स्पष्ट होना चाहिए कि वे संभवतः "अधिक चरम" या "अधिक से अधिक या बराबर" या "कम से कम बड़े के रूप में" एक बड़ा मूल्य रखने या यहां तक ​​कि एक मान होने के अर्थ में नहीं कर सकते हैं जहां शून्य घनत्व छोटा है। वे वास्तव में बड़ी संभावना वाले अनुपातों के अर्थ में इन चीजों का मतलब है जो आपने वर्णित किया है। वैसे, आपके द्वारा गणना की गई आसपास की संख्या को "पी-वैल्यू" कहा जाता है। यह केवल आपके द्वारा वर्णित तरीके से ठीक से समझा जा सकता है: सापेक्ष हिस्टोग्राम हाइट्स के विश्लेषण के संबंध में - संभावना अनुपात।0.08

छात्र : धन्यवाद। मुझे विश्वास नहीं है कि मैं इस सब को पूरी तरह से समझ पा रहा हूं, लेकिन आपने मुझे सोचने के लिए बहुत कुछ दिया है।

शिक्षक : यदि आप आगे जाना चाहते हैं, तो नेमन-पियर्सन लेम्मा पर एक नज़र डालें । आप शायद अब इसे समझने के लिए तैयार हैं।


सार

कई परीक्षण जो एकल सांख्यिकीय पर आधारित होते हैं जैसे कि संवाद में इसे " " या " " कहा जाएगा। ये संकेत देने के तरीके हैं कि अशक्त हिस्टोग्राम कैसा दिखता है, लेकिन वे केवल संकेत हैं: हम इस संख्या को क्या नाम देते हैं वास्तव में कोई फर्क नहीं पड़ता। छात्र द्वारा प्रस्तुत निर्माण, जैसा कि यहाँ सचित्र है, दिखाता है कि यह पी-वैल्यू से कैसे संबंधित है। पी-मान सबसे छोटा परीक्षण आकार है जो शून्य परिकल्पना की अस्वीकृति के लिए अवलोकन का कारण होगा ।t t = 0.1ztt=0.1

चित्र 11: एक क्षेत्र के रूप में पी-मान।

इस आंकड़े में, जिसे विस्तार दिखाने के लिए ज़ूम किया गया है, अशक्त परिकल्पना को ठोस नीले रंग में प्लॉट किया गया है और दो विशिष्ट विकल्पों को धराशायी लाइनों के साथ प्लॉट किया गया है। वह क्षेत्र जहाँ विकल्प शून्य से अधिक बड़े होते हैं, में छायांकित होता है। छायांकन वहाँ शुरू होता है जहाँ विकल्पों की सापेक्ष संभावनाएँ सबसे बड़ी होती हैं (को )। अवलोकन पहुंचने पर छायांकन रुक जाता है। पी-मान अशक्त हिस्टोग्राम के तहत छायांकित क्षेत्र का क्षेत्र है: यह मौका है, यह मानते हुए कि अशक्त सत्य है, जिसके परिणाम की संभावना अनुपात के बड़े होने की परवाह किए बिना होता है, जिसमें से कोई भी विकल्प सत्य होता है। विशेष रूप से, यह निर्माण वैकल्पिक रूप से परिकल्पना पर निर्भर करता है। यह संभव विकल्पों को निर्दिष्ट किए बिना नहीं किया जा सकता है।टी = 0.10t=0.1


4
इसने एक अन्य उत्तर पर मेरी टिप्पणी से उत्कृष्ट रूप से निपटा है, कि इस प्रश्न के पूर्व उत्तरों में से किसी ने भी सामान्य रूप से, सामान्य रूप से सुने गए "या अधिक चरम" एक पी -वेल्यू का पहलू नहीं देखा है । (हालांकि "चाय-परीक्षण" उत्तर में एक अच्छा विशिष्ट उदाहरण शामिल था।) मैं विशेष रूप से इस उदाहरण की प्रशंसा करता हूं कि इस उदाहरण को जानबूझकर उजागर किया गया है कि "अधिक चरम" का अर्थ "बड़ा" या "शून्य से आगे" के विपरीत हो सकता है।
सिल्वरफिश

4
काश शिक्षक और पाठ्यपुस्तक "या अधिक चरम" वाक्यांश का उपयोग नहीं करते, वास्तव में। मैंने सुना है कि दो वेरिएंट " प्रति अधिक अनुकूल " या " अधिक प्रेरक " के रूप में । इस उदाहरण में, शून्य के निकट मूल्य वास्तव में अधिक प्रेरक होंगे कि दूरबीन अधिक विश्वसनीय हो गई है, लेकिन उन्हें "अधिक चरम" के रूप में वर्णित करने के लिए कुछ भाषाई कलाबाजी (बहुत तर्क-वितर्क, लेकिन संभवतः भ्रमित) की आवश्यकता है। एच H1H1
सिल्वरफिश

3
हमेशा की तरह अद्वितीय रूप से आनंदमय, उन अविश्वसनीय रूप से उपयोगी उत्तर लिखने के लिए समय निकालने के लिए धन्यवाद। मैं वास्तव में आश्चर्य करता हूं कि पाठ्यपुस्तकों को कभी भी इस तरह से नहीं लिखा जाता है जो स्पष्टता और अंतर्ज्ञान के इन स्तरों के पास कहीं भी प्रदान करता है।
बजे जेरेमी रेडक्लिफ

मुझे लगता है कि संभावना की परिभाषा की एक कड़ी इस उदाहरण से फायदेमंद हो सकती है
baxx

1
यह एक टिप्पणी @baxx में कटाक्ष का उपयोग करने के लिए खतरनाक है, क्योंकि वहाँ पर्याप्त जगह हमें विनम्रता और सुरुचिपूर्ण ढंग से ऐसा करने की अनुमति नहीं है। इसलिए यह आमतौर पर एक अच्छा विचार नहीं है कि एक टिप्पणी को व्यंग्यात्मक किया जा रहा है जब तक कि यह स्पष्ट रूप से आपको ऐसा नहीं कहता है। मान लें कि टिप्पणियाँ आपकी सहायता करने के लिए लक्षित हैं। यदि आप मेरे द्वारा दी गई खोज में बहुत पहले हिट का अनुसरण करेंगे, तो मुझे लगता है कि आपके सवालों का जवाब दिया जाएगा।
whuber

44

इस विषय को छूने से पहले, मैं हमेशा सुनिश्चित करता हूं कि छात्र प्रतिशत, दशमलव, बाधाओं और भिन्नताओं के बीच आगे बढ़ रहे हैं। अगर वे इससे पूरी तरह खुश नहीं हैं तो वे बहुत जल्दी भ्रमित हो सकते हैं।

मैं फिशर के क्लासिक चाय प्रयोग के माध्यम से पहली बार परिकल्पना परीक्षण (और इसलिए पी-मान और परीक्षण आँकड़े) की व्याख्या करना पसंद करता हूं। मेरे पास इसके कई कारण हैं:

(i) मुझे लगता है कि एक प्रयोग के माध्यम से काम करना और शर्तों को परिभाषित करना जैसा कि हम साथ चलते हैं और अधिक समझ में आता है कि बस इन सभी शर्तों को परिभाषित करना शुरू करना है। (ii) आपको परिकल्पना परीक्षण के प्रमुख बिंदुओं पर जाने के लिए संभावना वितरण, वक्र के नीचे के क्षेत्रों आदि पर स्पष्ट रूप से भरोसा करने की आवश्यकता नहीं है। (iii) यह काफी समझदार तरीके से "देखे गए या उससे अधिक चरम" की इस हास्यास्पद धारणा की व्याख्या करता है, मुझे लगता है कि छात्रों को इतिहास, मूल और जो वे पढ़ रहे हैं उसकी पिछली कहानी को समझना पसंद है क्योंकि यह इसे और अधिक वास्तविक बनाता है। कुछ अमूर्त सिद्धांतों की तुलना में। (v) इससे कोई फर्क नहीं पड़ता है कि छात्र किस विषय या विषय से आते हैं, वे चाय के उदाहरण से संबंधित हो सकते हैं (NB कुछ अंतरराष्ट्रीय छात्रों को दूध के साथ चाय के इस अजीबोगरीब ब्रिटिश संस्थान से कठिनाई है।)

[नोट: मुझे मूल रूप से डेनिस लिंडले के अद्भुत लेख "एक्सपेरिमेंट ऑफ एक्सपेरिमेंटल डेटा: द एप्रिसिएशन ऑफ टी एंड वाइन" से यह विचार मिला, जिसमें उन्होंने दर्शाया कि बायेसियन तरीके शास्त्रीय तरीकों से बेहतर क्यों हैं।]

पीछे की कहानी यह है कि म्यूरियल ब्रिस्टल 1920 की एक दोपहर में एक कप चाय के लिए रोथमस्टेड प्रायोगिक स्टेशन पर फिशर से मिलने जाते हैं। जब फिशर ने दूध डाला, तो उसने शिकायत करते हुए कहा कि वह यह भी बता सकती है कि दूध पहले डाला गया था (या आखिरी) और उसने पहले पसंद किया था। इसे परीक्षण में लाने के लिए उन्होंने अपने क्लासिक चाय प्रयोग को तैयार किया, जहां मुरील को चाय के कप की एक जोड़ी के साथ प्रस्तुत किया गया है और उन्हें पहचानना होगा कि कौन सा दूध पहले जोड़ा गया था। यह छह कप चाय के कप के साथ दोहराया जाता है। उसके विकल्प राइट (R) या गलत (W) हैं और उसके परिणाम हैं: RRRRRW।

मान लीजिए कि मुरील वास्तव में सिर्फ अनुमान लगा रहा है और उसके पास कोई भेदभाव करने की क्षमता नहीं है। इसे नल हाइपोथीसिस कहा जाता है । फिशर के अनुसार प्रयोग का उद्देश्य इस अशक्त परिकल्पना को बदनाम करना है। यदि म्यूरियल अनुमान लगा रहा है कि वह प्रत्येक मोड़ पर संभाव्यता 0.5 के साथ चाय के कप की सही पहचान करेगा और जैसा कि वे स्वतंत्र हैं, तो देखा गया परिणाम 0.5 = 0.016 (या 1/64) है। फ़िशर का तर्क है कि या तो:6

(ए) अशक्त परिकल्पना (मुरील अनुमान लगा रहा है) सत्य है और छोटी संभावना की घटना हुई है या,

(b) अशक्त परिकल्पना झूठी है और मुरील में विभेदकारी शक्तियाँ हैं।

पी-मान (या प्रायिकता मान) इस परिणाम (RRRRRW) के अवलोकन की संभावना है, क्योंकि अशक्त परिकल्पना सत्य है - यह ((a), उपरोक्त में उल्लिखित छोटी संभावना है। इस उदाहरण में यह 0.016 है। चूंकि छोटी संभावनाओं वाली घटनाएं केवल शायद ही कभी होती हैं (परिभाषा के अनुसार) स्थिति (बी) स्थिति (ए) की तुलना में क्या हुआ, इसका अधिक बेहतर विवरण हो सकता है। जब हम शून्य परिकल्पना को अस्वीकार करते हैं तो हम वास्तव में विपरीत परिकल्पना को स्वीकार करते हैं जिसे हम वैकल्पिक परिकल्पना कहते हैं। इस उदाहरण में, म्यूरियल के पास विभेदकारी शक्तियाँ वैकल्पिक परिकल्पना है।

एक महत्वपूर्ण विचार यह है कि हम "छोटी" संभावना के रूप में क्या करते हैं? वह कटऑफ बिंदु क्या है जिस पर हम यह कहना चाहते हैं कि घटना की संभावना नहीं है? मानक बेंचमार्क 5% (0.05) है और इसे महत्व स्तर कहा जाता है। जब पी-मूल्य महत्व स्तर से छोटा होता है तो हम अशक्त परिकल्पना को गलत मानते हुए अस्वीकार करते हैं और हमारी वैकल्पिक परिकल्पना को स्वीकार करते हैं। किसी परिणाम का दावा करने के लिए यह सामान्य समानता है कि जब पी-वैल्यू महत्व के स्तर से छोटा हो, यानी जब हमने जो अनुमान लगाया था, वह शून्य परिकल्पना को देखते हुए होने की संभावना हमारे कटऑफ बिंदु से छोटी है। यह स्पष्ट होना महत्वपूर्ण है कि 5% का उपयोग पूरी तरह से व्यक्तिपरक है (जैसा कि 1% और 10% के अन्य सामान्य महत्व के स्तर का उपयोग कर रहा है)।

फिशर ने महसूस किया कि यह काम नहीं करता है; एक गलत जोड़ी के साथ हर संभव परिणाम समान रूप से भेदभावपूर्ण शक्तियों का विचारोत्तेजक था। स्थिति के लिए प्रासंगिक संभावना (ए), ऊपर, इसलिए 6 (0.5) ^ 6 = 0.094 (या 6/64) है जो अब 5% के महत्व के स्तर पर महत्वपूर्ण नहीं है । इस फिशर को दूर करने के लिए तर्क दिया गया कि यदि 6 में 1 त्रुटि को विभेदकारी शक्तियों का प्रमाण माना जाता है, तो ऐसी कोई त्रुटि नहीं है, जिसका परिणाम यह हो कि पी-मूल्य की गणना करते समय जो अवलोकन किए गए हैं, उससे अधिक प्रबल रूप से भेदभाव करने वाली शक्तियां शामिल की जानी चाहिए। इसके परिणामस्वरूप तर्क में निम्नलिखित संशोधन हुए:

(ए) अशक्त परिकल्पना (मुरील अनुमान लगा रहा है) सत्य है और इस तरह की घटनाओं की संभावना कम या ज्यादा है, जो कि देखी गई तुलना में चरम है, या

(b) अशक्त परिकल्पना झूठी है और मुरील में विभेदकारी शक्तियाँ हैं।

हमारे चाय प्रयोग पर वापस जाएं और हम पाते हैं कि इस सेट-अप के तहत पी-मान 7 (0.5) ^ 6 = 0.109 है जो अभी भी 5% सीमा पर महत्वपूर्ण नहीं है।

फिर मुझे कुछ अन्य उदाहरणों के साथ काम करने के लिए छात्रों को मिलता है जैसे कि सिक्का उछालने के लिए कि क्या सिक्का उचित है या नहीं। यह अशक्त / वैकल्पिक परिकल्पना, पी-मूल्यों और महत्व स्तरों की अवधारणाओं को घर करता है। हम तब एक निरंतर चर के मामले में आगे बढ़ते हैं और एक परीक्षण-सांख्यिकीय की धारणा का परिचय देते हैं। जैसा कि हम पहले ही सामान्य वितरण, मानक सामान्य वितरण और गहराई में जेड-परिवर्तन को कवर कर चुके हैं, यह केवल कई अवधारणाओं को एक साथ जोड़ने की बात है।

परीक्षण-आँकड़ों की गणना के साथ-साथ, पी-वैल्यूज़ और एक निर्णय लेने (महत्वपूर्ण / महत्वपूर्ण नहीं) मैं छात्रों को लापता खाली खेल में एक भरने में प्रकाशित पत्रों के माध्यम से काम करने के लिए मिलता है।


2
मुझे पता है कि मैं कुछ हद तक एक पुराने धागे को पुनर्जीवित कर रहा हूं, लेकिन यहां यह हो जाता है ... मैं वास्तव में आपके उत्तर का आनंद ले रहा था, लेकिन मुझे इसमें टी-मान भाग याद आता है :( क्या आप कृपया इसके बारे में बात करने के लिए अपने दिए गए उदाहरणों का उपयोग कर सकते हैं? टी-टेस्ट भाग के बारे में किसी ने भी जवाब नहीं दिया
सोसी डे

@ सोसी यह शायद इसलिए है क्योंकि पी-वैल्यू टी-वैल्यू की तुलना में बहुत अधिक सामान्य हैं। यह कारों के बारे में और फिर फोर्ड फिएस्टा पर ब्रेक के बारे में सवाल पूछने जैसा है।
अनुमान

2
इसका उत्तर बहुत ही रोचक है (+1), लेकिन कुछ चीजें एक साथ अंत में भ्रमित होती हैं। 1. इसका क्या मतलब है एक के लिए -value "5% के स्तर पर महत्वपूर्ण हो"? या तो पॉवेल 5% से नीचे है, या यह नहीं है। मैं इस तरह के अस्पष्ट वाक्य का उपयोग करते हुए बिंदु को नहीं देखता, "महत्व" को अपरिभाषित छोड़ देता है। 2. क्या यह "तय" के लिए मौसम या नहीं एक मतलब है -value महत्वपूर्ण है? यह इस तरह से मिश्रण में निर्णय सिद्धांत में लाने के लिए उचित नहीं लगता है (विशेषकर चूंकि फिशर विज्ञान में नेयमैन-पियर्सन परीक्षण ढांचे के आवेदन के एक मजबूत प्रतिद्वंद्वी थे)। पी पीppp
ओलिवियर

27

मौखिक स्पष्टीकरण या गणना की किसी भी मात्रा ने वास्तव में मुझे एक आंत स्तर पर समझने में मदद नहीं की कि पी-मान क्या थे, लेकिन यह वास्तव में मेरे लिए फ़ोकस में तड़क गया, जब मैंने एक कोर्स लिया जिसमें सिमुलेशन शामिल था। इससे मुझे वास्तव में अशक्त परिकल्पना द्वारा उत्पन्न डेटा को देखने और साधन / आदि को प्लॉट करने की क्षमता मिली। नकली नमूनों का, फिर उस वितरण पर मेरे नमूने का आँकड़ा कहाँ है, इसे देखें।

मुझे लगता है कि इसका मुख्य लाभ यह है कि यह छात्रों को एक मिनट के लिए गणित और परीक्षण सांख्यिकीय वितरण के बारे में भूल जाने देता है और अवधारणाओं को हाथ पर केंद्रित करता है। दी गई, यह आवश्यक है कि मैं सीखूं कि उस सामान का अनुकरण कैसे किया जाए, जिससे छात्रों के लिए पूरी तरह से अलग सेट की समस्या पैदा हो। लेकिन यह मेरे लिए काम करता है, और मैंने बड़ी सफलता के साथ दूसरों को आंकड़े समझाने में मदद करने के लिए अनगिनत बार सिमुलेशन का उपयोग किया है (जैसे, "यह वही डेटा है जो डेटा दिखता है; यह वही है जो एक पॉइसन वितरण ओवरलैड की तरह दिखता है। क्या आप चाहते हैं कि आप सुनिश्चित करें। पोइसन रिग्रेशन करने के लिए? ")।

यह आपके द्वारा लगाए गए प्रश्नों का सटीक उत्तर नहीं देता है, लेकिन मेरे लिए, कम से कम, इसने उन्हें तुच्छ बना दिया।


10
मैं इसे समझाने के लिए अनुकरण के उपयोग के बारे में तहे दिल से सहमत हूँ। लेकिन अंत में उदाहरण पर एक छोटा सा नोट: मुझे लगता है कि लोगों (न सिर्फ छात्रों) को किसी भी विशेष वितरण धारणा के लिए भेद करना मुश्किल लगता है, उदाहरण के लिए, पॉइसन के बीच, मामूली रूप से पॉइसन वितरित होने और सशर्त रूप से पॉसिबल वितरित होने के बीच । प्रतिगमन मॉडल के लिए केवल बाद वाले मामलों के बाद से, निर्भर चर मूल्यों का एक गुच्छा जो कि पॉइसन नहीं हैं, जरूरी नहीं कि चिंता का कारण हो।
कंजुगेटपायर

1
मुझे कबूल करना होगा कि मुझे नहीं पता था। मैंने अपनी सदस्यता के पिछले कुछ दिनों में इस साइट के आसपास आपकी टिप्पणियों की वास्तव में सराहना की है - मुझे आशा है कि आप चारों ओर चिपकेंगे।
मैट पार्कर

@MattParker क्या आप समझ विकसित करने के लिए सिमुलेशन के उपयोग के लिए केंद्रित किसी भी सीखने के संसाधनों के बारे में जानते हैं? या यह सिर्फ कुछ अजगर / आर स्क्रिप्ट को एक साथ रखने और परीक्षणों का एक गुच्छा चलाने का मामला है?
baxx

1
@baxx [डैनियल कुनिन द्वारा थ्योरी वेबसाइट देखना] (students.brown.edu/atra-theory/) में इसके लिए कुछ दिलचस्प उपकरण हैं, लेकिन यह अभी भी निर्माणाधीन है। अन्यथा, हाँ, मैंने बड़े पैमाने पर सिर्फ आर के अंतर्निहित उपकरणों के साथ सिमुलेशन के लिए प्रयोग किया है - उनका उपयोग करके खुद को साबित करने के लिए कि कोई विधि कैसे काम करती है, या यह देखने के लिए कि क्या होगा अगर एक भविष्यवक्ता को यादृच्छिक चर के साथ बदल दिया गया, आदि। क्षमा करें, काश इसके लिए मुझे बेहतर संसाधनों का पता होता!
मैट पार्कर

@MattParker शांत धन्यवाद। हाँ - उस में एक चिकन और अंडे का थोड़ा सा, उन प्रयोगों के निर्माण के लिए जिन्हें आप (मुझे लगता है?) कम से कम उन्हें लिखने के लिए पर्याप्त रूप से प्राप्त करने की आवश्यकता है। हालांकि कोई चिंता नहीं है ..... बस आपने जो साइट लिंक की है, वह अच्छी है, धन्यवाद
baxx

16

पी-वैल्यू की एक अच्छी परिभाषा "कम से कम बड़े परिकल्पना को सच मानने वाले एक गणना के रूप में एक परीक्षण सांख्यिकीय का अवलोकन करने की संभावना है"।

इसके साथ समस्या यह है कि इसके लिए "परीक्षण सांख्यिकीय" और "शून्य परिकल्पना" की समझ की आवश्यकता होती है। लेकिन, यह आसान है। यदि शून्य परिकल्पना सत्य है, तो आमतौर पर "जनसंख्या ए से पैरामीटर बी आबादी के पैरामीटर के बराबर है" जैसा कुछ होता है, और आप उन मापदंडों का अनुमान लगाने के लिए आंकड़ों की गणना करते हैं, एक परीक्षण सांख्यिकीय को देखने की संभावना क्या है जो कहती है, "वे यही हैं विभिन्न"?

उदाहरण के लिए, यदि सिक्का उचित है, तो क्या संभावना है कि मैं 100 में से 60 शीर्ष देखूंगा? यह अशक्त परिकल्पना का परीक्षण कर रहा है, "सिक्का उचित है", या "पी = .5" जहां पी सिर की संभावना है।

उस स्थिति में परीक्षण आँकड़ा प्रमुख होगा।

अब, मैं मानता हूं कि जिसे आप "टी-वैल्यू" कह रहे हैं, वह एक सामान्य "टेस्ट स्टेटिस्टिक" है, न कि "टी डिस्ट्रीब्यूशन" से एक मूल्य। वे एक ही बात नहीं कर रहे हैं, और शब्द "टी-मूल्य" व्यापक रूप से इस्तेमाल नहीं किया जा सकता है और भ्रमित हो सकता है।

जिसे आप "टी-वैल्यू" कह रहे हैं, शायद वही है जिसे मैं "टेस्ट स्टैटिस्टिक" कह रहा हूं। पी-मान की गणना करने के लिए (याद रखें, यह सिर्फ एक संभावना है) आपको एक वितरण की आवश्यकता है, और उस वितरण में प्लग करने के लिए एक मूल्य जो एक संभावना लौटाएगा। एक बार जब आप ऐसा कर लेते हैं, तो आपके द्वारा लौटाई जाने वाली संभावना आपका पी-मान है। आप देख सकते हैं कि वे संबंधित हैं क्योंकि एक ही वितरण के तहत, विभिन्न परीक्षण-आँकड़े अलग-अलग पी-मान लौटाने वाले हैं। अधिक चरम परीक्षण-आँकड़े निम्न पी-मान लौटाएंगे जो अधिक संकेत देते हैं कि अशक्त परिकल्पना झूठी है।

मैंने यहां एक तरफा और दो तरफा पी-मूल्यों के मुद्दे को नजरअंदाज कर दिया है।


11

कल्पना कीजिए कि आपके पास एक बैग है जिसमें 900 काले पत्थर और 100 सफेद हैं, यानी 10% पत्थर सफेद हैं। अब कल्पना करें कि आप 1 संगमरमर को बाहर निकालते हैं, इसे देखें और इसका रंग रिकॉर्ड करें, दूसरे को बाहर निकालें, इसका रंग आदि रिकॉर्ड करें और ऐसा 100 बार करें। इस प्रक्रिया के अंत में आपके पास सफ़ेद मार्बल्स के लिए एक संख्या होगी, जो कि आदर्श रूप से, हम 10 के 10 अर्थात 10% होने की उम्मीद करेंगे, लेकिन वास्तविक तथ्य में 8 या 13 या जो भी हो, यादृच्छिकता के कारण हो सकता है। यदि आप इस 100 संगमरमर निकासी प्रयोग को कई बार दोहराते हैं, और फिर प्रति प्रयोग किए गए सफेद पत्थर की संख्या का एक हिस्टोग्राम लगाते हैं, तो आप पाएंगे कि आपके पास एक बेल कर्व होगा जो लगभग 10 होगा।

यह आपकी १०% परिकल्पना का प्रतिनिधित्व करता है: १००० मार्बल्स वाले किसी भी बैग के साथ, जिसमें १०% सफ़ेद होते हैं, यदि आप बेतरतीब ढंग से १०० मार्बल्स निकालते हैं, तो आपको चयन में १० सफ़ेद मार्बल्स मिलेंगे, दे या ४ ले जाएँ। पी-वैल्यू इस बारे में "4 या तो दें या लें।" मान लीजिए कि पहले बनाए गए बेल कर्व का जिक्र करके आप यह निर्धारित कर सकते हैं कि 5% से कम समय आपको 5 या उससे कम सफेद मार्बलों का मिलेगा और दूसरा <5% समय 15 या अधिक व्हाइट मार्बल्स के खाते का है अर्थात> 90% आपके 100 संगमरमर चयन में 6 से 14 सफेद पत्थर शामिल होंगे।

अब यह मानकर कि किसी ने 1000 मार्बल्स के एक बैग को अज्ञात संख्या में सफेद पत्थरों से दबा दिया है, हमारे पास इन सवालों के जवाब देने के लिए उपकरण हैं

i) क्या 100 से कम सफेद पत्थर हैं?

ii) क्या 100 से अधिक सफेद पत्थर हैं?

iii) क्या बैग में 100 सफेद पत्थर होते हैं?

बस बैग से 100 मार्बल्स निकालें और गिनें कि इस नमूने में से कितने सफेद हैं।

a) यदि नमूने में 6 से 14 गोरे हैं तो आप इस परिकल्पना को अस्वीकार नहीं कर सकते हैं कि बैग में 100 सफेद पत्थर हैं और 14 के माध्यम से 6 के लिए संबंधित पी-मान> 0.05 होगा।

बी) यदि नमूने में 5 या उससे कम गोरे हैं तो आप इस परिकल्पना को अस्वीकार कर सकते हैं कि बैग में 100 सफेद पत्थर हैं और 5 या उससे कम के संबंधित पी-मान <0.05 होंगे। आपको उम्मीद होगी कि बैग में <10% सफेद पत्थर होंगे।

ग) यदि नमूने में 15 या अधिक गोरे हैं तो आप इस परिकल्पना को अस्वीकार कर सकते हैं कि बैग में 100 सफेद पत्थर हैं और 15 या उससे अधिक के लिए संबंधित पी-मान <0.05 होंगे। आपको उम्मीद होगी कि बैग में> 10% सफेद पत्थर होंगे।

बाल्टीमार्क की टिप्पणी के जवाब में

ऊपर दिए गए उदाहरण को देखते हुए, लगभग एक है: -

4.8% 5 सफेद गेंद या कम पाने का मौका

4 या उससे कम का 1.85% मौका

3 या उससे कम का 0.55% मौका

2 या उससे कम का 0.1% मौका

15 या अधिक का 6.25% मौका

3.25% 16 या अधिक का मौका

17 या अधिक का 1.5% मौका

18 या अधिक का 0.65% मौका

19 या अधिक का 0.25% मौका

20 या अधिक का 0.1% मौका

21 या अधिक का 0.05% मौका

इन संख्याओं का अनुमान एक अनुभवजन्य वितरण से था जो कि आर में संचालित एक साधारण मोंटे कार्लो दिनचर्या और नमूना वितरण के परिणामी मात्राओं द्वारा बनाया गया था।

मूल प्रश्न का उत्तर देने के प्रयोजनों के लिए, मान लीजिए कि आप 5 सफेद गेंदों को आकर्षित करते हैं, केवल एक अनुमानित 4.8% संभावना है कि यदि 1000 संगमरमर के बैग में वास्तव में 10% सफेद गेंद होती है, तो आप 100 के नमूने में केवल 5 गोरे को बाहर निकाल देंगे। यह एपी मान <0.05 के बराबर है। अब आपको बीच में से चुनना है

i) बैग में वास्तव में 10% सफेद गेंदें हैं और मैं बहुत कम आकर्षित करने के लिए "बदकिस्मत" हूं

या

ii) मैंने इतनी कम सफेद गेंदें खींची हैं कि वास्तव में 10% सफेद गेंदें नहीं हो सकती हैं (10% सफेद गेंदों की परिकल्पना को अस्वीकार करें)


सबसे पहले, यह सिर्फ एक बड़ा उदाहरण है और वास्तव में पी-मूल्य और परीक्षण-सांख्यिकीय की अवधारणा को स्पष्ट नहीं करता है। दूसरा, आप केवल यह दावा कर रहे हैं कि यदि आपको 5 या 15 से कम सफेद पत्थर मिलते हैं, तो आप अशक्त परिकल्पना को अस्वीकार करते हैं। आपका वितरण क्या है जिससे आप उन संभावनाओं की गणना कर रहे हैं? यह एक सामान्य डिस्टर्ब के साथ लगाया जा सकता है। 10 पर केंद्रित, एक मानक विचलन के साथ 3. आपका अस्वीकृति मानदंड लगभग पर्याप्त सख्त नहीं है।
बाल्टीमार्क

मैं मानूंगा कि यह सिर्फ एक उदाहरण है, और यह सच है कि मैंने सिर्फ 5 और 15 नंबर को हवा में से निकाला है। जब मेरे पास समय होगा तो मैं एक दूसरा उत्तर दूंगा, जो मुझे आशा है कि अधिक पूर्ण होगा।
babelproofreader

10

पी-मान क्या नहीं बताता है कि यह कैसे संभव है कि अशक्त परिकल्पना सच है। पारंपरिक (फिशर) महत्व परीक्षण ढांचे के तहत हम पहले अनुमान लगाते हैं कि यह अनुमान लगाने की संभावना है कि शून्य परिकल्पना सच है, यह पी-मूल्य है। यह सहज रूप से उचित लगता है तो यह मानना ​​है कि अशक्त परिकल्पना शायद झूठी है यदि डेटा पर्याप्त रूप से अशक्त परिकल्पना के तहत देखे जाने की संभावना नहीं है। यह पूरी तरह से उचित है। सांख्यिकीविद त्रैमासिक रूप से एक दहलीज का उपयोग करते हैं और "95% महत्व स्तर पर अशक्त परिकल्पना को अस्वीकार करते हैं" अगर (1 - पी)> 0.95; हालाँकि, यह सिर्फ एक सम्मेलन है जो व्यवहार में उचित साबित हुआ है - इसका मतलब यह नहीं है कि 5% से कम संभावना है कि शून्य परिकल्पना झूठी है (और इसलिए 95% संभावना है कि वैकल्पिक परिकल्पना सच है)।

एक फ़ंक्शन f () का उपयोग करना, जो उस संभावना पर पी-मान को मैप करता है जो वैकल्पिक परिकल्पना सच है। यह कहना उचित होगा कि यह फ़ंक्शन सख्ती से कम हो रहा है (जैसे कि अधिक संभावना है कि अशक्त परिकल्पना के तहत टिप्पणियों की संभावना कम है, वैकल्पिक परिकल्पना सच है), और यह 0 और 1 के बीच मान देता है (जैसा कि यह एक अनुमान देता है। संभाव्यता)। हालाँकि, यह वह सब है जिसे हम f () के बारे में जानते हैं, इसलिए जबकि p और संभाव्यता के बीच एक संबंध है कि वैकल्पिक परिकल्पना सत्य है, यह अलिखित है। इसका मतलब है कि हम nulll और अल्टरनेटिव हाइपोथीसिस की मात्रात्मकता के बारे में मात्रात्मक विवरण बनाने के लिए पी-मान का उपयोग नहीं कर सकते हैं।

कैविट लेक्टर: यह वास्तव में प्रायिकता ढांचे के भीतर नहीं है कि प्रायिकता की बात करें कि एक परिकल्पना सच है, क्योंकि यह एक यादृच्छिक चर नहीं है - यह या तो सच है या यह नहीं है। इसलिए जहां मैंने एक परिकल्पना के सत्य की संभावना की बात की है, जो कि मुझे संक्षेप में बायेसियन व्याख्या में ले गई है। बेयसियन और अक्सरवादी को मिलाना गलत है, हालांकि हमेशा ऐसा करने का प्रलोभन होता है जैसा कि हम वास्तव में चाहते हैं कि परिकल्पना की सापेक्ष बहुलता / संभावना का एक मात्रात्मक संकेत है। लेकिन यह वह नहीं है जो पी-मूल्य प्रदान करता है।


7

आंकड़ों में आप कभी नहीं कह सकते हैं कि कुछ निश्चित है, इसलिए सांख्यिकीविद् यह अनुमान लगाने के लिए एक अन्य दृष्टिकोण का उपयोग करते हैं कि क्या एक परिकल्पना सच है या नहीं। वे अन्य सभी परिकल्पनाओं को अस्वीकार करने का प्रयास करते हैं जो डेटा द्वारा समर्थित नहीं हैं।

ऐसा करने के लिए, सांख्यिकीय परीक्षणों में एक शून्य परिकल्पना और एक वैकल्पिक परिकल्पना है। एक सांख्यिकीय परीक्षण से रिपोर्ट किया गया पी-वैल्यू परिणाम की संभावना है जो यह बताया गया है कि अशक्त परिकल्पना सही थी। इसलिए हम छोटे पी-वैल्यू चाहते हैं। वे जितने छोटे होते हैं, उतने ही कम परिणाम मिलते हैं यदि अशक्त परिकल्पना सही होती। यदि पी-मान काफी छोटा है (यानी, परिणाम की संभावना बहुत कम है अगर अशक्त परिकल्पना सही थी), तो अशक्त परिकल्पना को खारिज कर दिया जाता है।

इस फैशन में, अशक्त परिकल्पनाएं बनाई जा सकती हैं और बाद में खारिज कर दी जाती हैं। यदि अशक्त परिकल्पना को अस्वीकार कर दिया जाता है, तो आप वैकल्पिक परिकल्पना को सर्वश्रेष्ठ व्याख्या के रूप में स्वीकार करते हैं। हालांकि याद रखें कि वैकल्पिक परिकल्पना कभी निश्चित नहीं होती है, क्योंकि शून्य परिकल्पना संयोग से, परिणाम उत्पन्न कर सकती है।


एक पी-मूल्य दिए गए परिणाम की तुलना में अधिक या "चरम" परिणाम की संभावना है, वास्तविक परिणाम की नहीं। p-value न कि (T परीक्षण आँकड़ा है, और t इसका मनाया मान है)। पी आर ( टी = टी | एच 0 )Pr(Tt|H0)Pr(T=t|H0)
प्रोबेबिलिसलॉजिक

5

मैं पुराने विषय को पुनर्जीवित करने के लिए थोड़ा अलग हूं, लेकिन मैं यहां से कूद गया , इसलिए मैं इसे लिंक में सवाल के जवाब के रूप में पोस्ट करता हूं।

पी-मूल्य एक ठोस शब्द है, गलतफहमी के लिए कोई जगह नहीं होनी चाहिए। लेकिन, यह किसी भी तरह से रहस्यमय है कि पी-मूल्य की परिभाषा के बोलचाल के अनुवाद कई अलग-अलग गलत व्याख्याओं की ओर ले जाते हैं। मुझे लगता है कि समस्या की जड़ "कम से कम अशक्त परिकल्पना के विपरीत" या "कम से कम आपके नमूना डेटा में से एक के रूप में चरम" जैसे वाक्यांशों के उपयोग में है।

उदाहरण के लिए, विकिपीडिया कहता है

... पी-मान मनाया नमूना परिणाम (या अधिक चरम परिणाम) प्राप्त करने की संभावना है जब शून्य परिकल्पना वास्तव में सच है।

का अर्थ -value धुंधली होती है, जब लोग पहले "(या एक अधिक चरम परिणाम)" पर आते हैं और सोचना शुरू " अधिक extreeeme ?"।p

मुझे लगता है कि अप्रत्यक्ष भाषण अधिनियम की तरह "अधिक चरम परिणाम" को छोड़ना बेहतर है । तो, मेरा लेना है

पी-वैल्यू यह देखने की संभावना है कि आप एक "काल्पनिक दुनिया" में क्या देखते हैं, जहां शून्य परिकल्पना सच है।

विचार को ठोस बनाने के लिए, मान लें कि आपके पास x10 अवलोकनों से युक्त नमूना है और आप अनुमान लगाते हैं कि जनसंख्या का मतलब । तो, आपकी परिकल्पित दुनिया में, जनसंख्या वितरण ।N ( 20 , 1 )μ0=20N(20,1)

x
#[1] 20.82600 19.30229 18.74753 18.99071 20.14312 16.76647
#[7] 18.94962 17.99331 19.22598 18.68633

आप t गणना , और यह पता हैंt0=nX¯μ0s

sqrt(10) * (mean(x) - 20) / sd(x)  
#-2.974405

तो, देखने की संभावना क्या हैकाल्पनिक दुनिया में 2.97 जितना बड़ा ("अधिक चरम" यहां आता है)? काल्पनिक दुनिया में , इस प्रकार, p- मान होना चाहिए |t0|t0t(9)

pvalue=Pr(|t0|2.97)=0.01559054
2*(1 - pt(2.974405, 9))
#[1] 0.01559054

चूंकि पी-मूल्य छोटा है, इसलिए यह बहुत कम संभावना है कि नमूना xपरिकल्पित दुनिया में खींचा गया होगा। इसलिए, हम निष्कर्ष निकालते हैं कि यह बहुत कम संभावना है कि परिकल्पित दुनिया वास्तव में वास्तविक दुनिया थी।


2
+1, लेकिन जब आप "जो आप देखते हैं उसे देखने की संभावना" लिखते हैं और "अधिक चरम" भाग को छोड़ देते हैं, तो यह वाक्य सख्ती से गलत बोल रहा है (और संभवतः भ्रामक, भले ही कम भ्रमित हो)। यह देखने की संभावना नहीं है कि आप क्या देखते हैं (यह आमतौर पर शून्य है)। यह देखने की संभावना है कि आप क्या देखते हैं "या अधिक चरम"। भले ही यह कई लोगों के लिए एक भ्रमित सा हो सकता है, लेकिन यह अभी भी महत्वपूर्ण है (और व्यक्ति इस "अधिक चरम" शब्दों के पीछे छिपने वाले विषय की डिग्री के बारे में अंतहीन बहस कर सकता है)।
अमीबा

@amoeba मैंने सोचा, जब पर्याप्त उदाहरण की आपूर्ति की जाती है, तो यह "देखे गए नमूना परिणाम (या अधिक चरम परिणाम)" प्राप्त करने के लिए एक प्रॉक्सी के रूप में काम कर सकता है। हो सकता है, बेहतर शब्दों की जरूरत हो।
खाशा

1
मैं @ @ के रूप में एक ही अवलोकन करने जा रहा था; "या अधिक चरम" भाग को छात्र ऊंचाइयों और चाय पार्टी के जवाबों में उदाहरण के द्वारा अच्छी तरह से संभाला जाता है, लेकिन मुझे नहीं लगता कि इस धागे में कोई भी उत्तर इसकी स्पष्ट सामान्य व्याख्या पर हिट हुआ है , विशेष रूप से एक जो विभिन्न वैकल्पिक परिकल्पनाओं को कवर करता है। मैं इस उत्तर से सहमत हूं कि यह सुझाव है कि "या अधिक चरम" भाग कई छात्रों के लिए एक वैचारिक चिपके बिंदु है।
सिल्वरफिश

@Silverfish: और केवल छात्र ही नहीं। कितने बायेसियन-बनाम-फ्रीक्वेंट रैंट्स मैंने पढ़ा है कि इस "अधिक चरम" बिट की विषयगतता / निष्पक्षता मुद्दे पर चर्चा करें!
अमीबा

1
@Silver मैं आपकी आलोचना से सहमत हूं और इसका जवाब देने का प्रयास कर रहा हूं। "या अधिक चरम" इस मामले का बहुत ही क्रूर है।
whuber

4

मुझे उस क्रम का अनुसरण करना मददगार लगता है जिसमें आप निम्नलिखित क्रम में अवधारणाओं की व्याख्या करते हैं: (1) z स्कोर और ऊपर और नीचे के अनुपात में z स्कोर एक सामान्य वक्र मानते हैं। (2) एक नमूना वितरण की धारणा, और दिए गए नमूने के लिए z स्कोर का मतलब है जब जनसंख्या मानक विचलन जाना जाता है (और एक नमूना z परीक्षण का पता लगाएं) (3) एक नमूना टी-परीक्षण और एक की संभावना नमूना का मतलब है, जब जनसंख्या मानक विचलन अज्ञात है (कुछ औद्योगिक सांख्यिकीविदों की गुप्त पहचान और क्यों गिनीज सांख्यिकी के लिए अच्छा है) के बारे में कहानियों से परिपूर्ण है। (4) दो-नमूना टी-परीक्षण और माध्य अंतर का नमूना वितरण। जिस सहजता के साथ परिचयात्मक छात्रों ने टी-टेस्ट को समझा, उसका इस विषय की तैयारी में निर्धारित आधार के साथ बहुत कुछ है।

/ * भयभीत छात्रों के प्रशिक्षक बंद * /


4

मैंने शिक्षण में एक उपयोगी होने के लिए सिमुलेशन भी पाया है।

nN(μ,1)σ2=1H0:μ=μ0

ttstat:=n(X¯μ0)N(0,1)H0pΦ(tstat)pnorm(tstat)

सिमुलेशन में, यह समय का वह अंश है जो तहत उत्पन्न डेटा (यहां, ) पैदावार का नमूना है जिसका अर्थ है कि इसमें संग्रहीत कम (यानी, `` अधिक चरम '' हैं) बाएं तरफा परीक्षण) देखे गए डेटा से गणना की गई।N(μ0,1)μ0=2nullMeans

# p value
set.seed(1)
reps <- 1000
n <- 100      
mu <- 1.85 # true value
mu_0 <- 2 # null value
xaxis <- seq(-3, 3, length = 100)

X <- rnorm(n,mu)

nullMeans <- counter <- rep(NA,reps)

yvals <- jitter(rep(0,reps),2)

for (i in 1:reps)
{  
  tstat <- sqrt(n)*(mean(X)-mu_0) # test statistic, N(0,1) under the given assumptions

  par(mfrow=c(1,3))
  plot(xaxis,dnorm(xaxis),ylab="null distribution",xlab="possible test statistics",type="l")
  points(tstat,0,cex=2,col="salmon",pch=21,bg="salmon")

  X_null <- rnorm(n,mu_0) # generate data under H_0
  nullMeans[i] <- mean(X_null)

  plot(nullMeans[1:i],yvals[1:i],col="blue",pch=21,xlab="actual means and those generated under the null",ylab="", yaxt='n',ylim=c(-1,1),xlim=c(1.5,2.5))
  abline(v=mu_0,lty=2)
  points(mean(X),0,cex=4,col="salmon",pch=21,bg="salmon")

  # counts 1 if sample generated under H_0 is more extreme:
  counter[i] <- (nullMeans[i] < mean(X)) # i.e. we test against H_1: mu < mu_0
  barplot(table(counter[1:i])/i,col=c("green","red"),xlab="more extreme mean under the null than the mean actually observed")

  if(i<10) locator(1)
}
mean(counter)
pnorm(tstat)

0

परिकल्पना के परीक्षण के संबंध में "पी-वैल्यू" का क्या अर्थ है?

एक ontological अर्थ में (सत्य क्या है?), इसका मतलब कुछ भी नहीं है । किसी भी परिकल्पना का परीक्षण अप्रमाणित मान्यताओं पर आधारित है । यह सामान्य रूप से स्वयं परीक्षण का हिस्सा है, लेकिन आप जो भी मॉडल का उपयोग कर रहे हैं उसका भी हिस्सा हैं (उदाहरण के लिए प्रतिगमन मॉडल)। चूँकि हम केवल ये मान रहे हैं, हम नहीं जान सकते कि क्या कारण है कि पी-वैल्यू हमारी सीमा से कम है क्योंकि अशक्त है। बिना शर्त कटौती करने के लिए यह एक गैर अनुक्रमिक है कि कम पी-मूल्य के कारण हमें शून्य को अस्वीकार करना चाहिए। उदाहरण के लिए, मॉडल में कुछ गलत हो सकता है।

एक महामारी विज्ञान के अर्थ में (हम क्या सीख सकते हैं?), इसका मतलब कुछ है । आप अशिक्षित परिसर के सत्य होने पर ज्ञान की स्थिति प्राप्त करते हैं । चूंकि (कम से कम अब तक) हम वास्तविकता के प्रत्येक संस्करण को साबित नहीं कर सकते हैं, हमारे सभी ज्ञान जरूरी सशर्त होंगे। हम "सत्य" से कभी नहीं जुड़ेंगे।


-1

मुझे लगता है कि गणित का अभ्यास करने के लिए पत्थर या सिक्के या ऊंचाई मापने वाले उदाहरण ठीक हो सकते हैं, लेकिन वे अंतर्ज्ञान के निर्माण के लिए अच्छे नहीं हैं। कॉलेज के छात्र समाज से सवाल करना पसंद करते हैं, है ना? राजनीतिक उदाहरण का उपयोग कैसे करें?

कहते हैं कि एक राजनीतिक उम्मीदवार ने एक अभियान चलाया, जिसमें कहा गया था कि कुछ नीति अर्थव्यवस्था में मदद करेगी। उसे चुना गया, उसने नीति बनाई और 2 साल बाद, अर्थव्यवस्था फलफूल रही है। वह फिर से चुनाव के लिए तैयार है, और दावा करती है कि उसकी नीति सभी की समृद्धि का कारण है। क्या आपको उसका फिर से चुनाव करना चाहिए?

विचारशील नागरिक को यह कहना चाहिए कि "अच्छी तरह से, यह सच है कि अर्थव्यवस्था अच्छा कर रही है, लेकिन क्या हम वास्तव में आपकी नीति का श्रेय दे सकते हैं?" इसका सही उत्तर देने के लिए, हमें इस प्रश्न पर विचार करना चाहिए "क्या अर्थव्यवस्था ने पिछले 2 वर्षों में इसके बिना अच्छा किया होगा?" यदि उत्तर हां है (जैसे कुछ नए असंबंधित तकनीकी विकास के कारण अर्थव्यवस्था फलफूल रही है) तो हम आंकड़ों के राजनेता के स्पष्टीकरण को अस्वीकार करते हैं।

यही है, एक परिकल्पना (अर्थव्यवस्था में मदद की नीति) की जांच करने के लिए, हमें दुनिया का एक मॉडल बनाना चाहिए जहां वह परिकल्पना शून्य है (नीति कभी लागू नहीं हुई थी)। हम फिर उस मॉडल के तहत एक भविष्यवाणी करते हैं । हम उस डेटा को उस वैकल्पिक दुनिया के पी-मान में देखने की संभावना कहते हैं । यदि पी-मूल्य बहुत अधिक है, तो हम परिकल्पना से आश्वस्त नहीं हैं - नीति से कोई फर्क नहीं पड़ा। यदि पी-मूल्य कम है, तो हम परिकल्पना पर भरोसा करते हैं - नीति आवश्यक थी।


1
मैं पी के रूप में परिभाषित होने से असहमत हूं "हम इस डेटा को उस वैकल्पिक दुनिया के पी-मूल्य में देखने की संभावना कहते हैं" और निष्कर्ष की ताकत भी खींची जा रही है (विशेषकर शून्य को अस्वीकार करने में विफलता)।
सिल्वरफिश

@Silverfish क्या आप विस्तृत कर सकते हैं? संभवतः पी-वैल्यू को उस अवलोकन या अधिक चरम अवलोकन बनाने की संभावना को कॉल करना अधिक सही होगा। लेकिन ऐसा लगता है कि आपकी गहरी आलोचना है।
cgreen

1
चूंकि मूल प्रश्न पूछ रहा है कि पी-मान क्या है, मैंने सोचा कि स्पष्ट रूप से उस परिभाषा को प्राप्त करना महत्वपूर्ण था। बस "अधिक चरम" यह कहे बिना अपने आप में बहुत उपयोगी नहीं है कि "अधिक चरम" का मतलब क्या हो सकता है - यह इस थ्रेड में अधिकांश उत्तरों की कमजोरी है। केवल व्हिबर के उत्तर और "चाय परीक्षण" से लगता है कि वास्तव में यह समझा जाता है कि "अधिक चरम" क्यों मायने रखता है।
सिल्वरफिश

मैंने यह भी महसूस किया कि आपके निष्कर्ष बहुत दृढ़ता से व्यक्त किए गए हैं। यदि हम अशक्तता को अस्वीकार करते हैं, तो हमारे पास इसके खिलाफ महत्वपूर्ण सबूत हैं, लेकिन यह नहीं जानते कि यह गलत है। जब हम अशक्त को अस्वीकार करने में विफल होते हैं, तो निश्चित रूप से इसका मतलब यह नहीं है कि अशक्त सही है (हालांकि यह अच्छी तरह से हो सकता है)। अधिक सामान्य टिप्पणी के रूप में मुझे लग रहा है कि आप जिस परीक्षा का वर्णन कर रहे हैं, काफी सार शब्दों में, एक शिक्षार्थी के लिए स्पष्ट होने की संभावना नहीं है जो सिर्फ एक परीक्षा करना सीख रहा है। एक स्पष्ट रूप से परिभाषित परीक्षण आंकड़ा की कमी मूल सवाल यह है कि व्याख्या करने के लिए पूछ के साथ अच्छी तरह से नहीं बैठता टी भी -statistic।
सिल्वर फिश

इस उत्तर की एक विशेषता मुझे बहुत पसंद है, यह स्पष्ट व्याख्या है कि पी-मानों की गणना एक अशक्त मॉडल का उपयोग करके की जाती है, भले ही हम (विषयगत रूप से) यह विश्वास नहीं करते कि अशक्त मॉडल वास्तव में सच है। मुझे लगता है कि मॉडल के तहत तथ्य परीक्षण के आँकड़ों की गणना एक महत्वपूर्ण बिंदु है जिसके साथ कई छात्र संघर्ष करते हैं।
सिल्वर फिश

-1

p

pX

0c1,FX|H0(inf{x:FX|H0(x)c})=c
FX|H0XH0

विशेष रूप से, यदि का निरंतर वितरण है और आप सन्निकटन का उपयोग नहीं कर रहे हैं, तोX

  1. हर -value पर एक समान वितरण के साथ एक आंकड़ा है , औरp[0,1]
  2. पर एक समान वितरण के साथ हर आंकड़ा एक है -value।[0,1]p

आप इस का एक सामान्यीकृत विवरण पर विचार कर सकते -values।p


यह परिभाषा केवल असतत वितरण के लिए समझ में आता है (और फिर सही नहीं है), क्योंकि " " की दूसरी उपस्थिति यह स्पष्ट करती है कि यह संभावनाओं को संदर्भित करता है , संभावना घनत्व को नहीं। इसके अलावा, बहुत कम वितरण हैं (यदि कोई हो) जो कि बताई गई संपत्ति है, तो यह सुझाव देता है कि बयान में टाइपोग्राफिक त्रुटियां होनी चाहिए। जहाँ तक आपके बाद के दावे चलते हैं, (1) आदर्श रूप से सही है लेकिन (2) नहीं है, जब तक कि आप अशक्त परिकल्पना को सांख्यिकीय पर निर्भर नहीं होने देते हैं! P
whuber

@whuber इनपुट के लिए धन्यवाद मैंने परिभाषा को संपादित किया है, और इसे अभी और अधिक अर्थ देना चाहिए!
नलजोक

1
यह समझ में आता है, धन्यवाद: अगर मैं इसे सही ढंग से पढ़ रहा हूं, तो यह दावा करता है कि का शून्य वितरण समान हैहालाँकि, यह केवल p- मानों के गुणों का हिस्सा है; यह पी-वैल्यू को चिह्नित नहीं करता है; और यह इस बारे में कुछ नहीं कहता कि उनका क्या मतलब है या उनकी व्याख्या कैसे की जाए। क्या गायब है के बारे में जानकारी के लिए इस थ्रेड में कुछ अन्य उत्तरों का अध्ययन करने पर विचार करें। X[0,1].
whuber

यहाँ एक उदाहरण है जो आपको दिलचस्प लग सकता है। वितरण परिवार यूनिफ़ॉर्म , जो कि लिए शून्य परिकल्पना और विकल्प इसका पूरक है। यादृच्छिक नमूनाआँकड़ाजाहिर है कि यह तहत पर एक समान वितरण है, लेकिन यह किस अर्थ में एक पी-मूल्य है? इसी परिकल्पना परीक्षण क्या है? मान लीजिए कि हम आकार का एक नमूना लेते हैं और मूल्य का निरीक्षण करते हैं क्या आप दावा कर रहे हैं कि पी-मान ?? θ आर , θ = 0 , एक्स = ( एक्स 1 , ... , एक्स एन ) एक्स ( एक्स ) = एक्स 1[ , ] एच : एन = एक्स = - : - (θ,θ+1)θR,θ=0,X=(X1,,Xn).X(X)=X1.[0,1]H0:n=1X1=2:2
whuber

-4

पी-मान के रूप में रहस्यमय नहीं है क्योंकि अधिकांश विश्लेषकों ने इसे बाहर कर दिया है। यह एक टी-टेस्ट के लिए आत्मविश्वास अंतराल की गणना न करने का एक तरीका है, लेकिन बस आत्मविश्वास के स्तर को निर्धारित करना है जिसके साथ अशक्त परिकल्पना को खारिज किया जा सकता है।

चित्रण। आप एक परीक्षण चलाते हैं। पी-मान क्यू-चर के लिए 0.1866, आर-चर के लिए 0.0023 के रूप में आता है। (ये% में व्यक्त किए गए हैं)।

यदि आप नल हाइपो को अस्वीकार करने के लिए 95% आत्मविश्वास के स्तर पर परीक्षण कर रहे हैं;

क्यू के लिए: 100-18.66 = 81.34%

आर के लिए: 100-0.23 = 99.77%।

95% आत्मविश्वास के स्तर पर, Q 81.34% आत्मविश्वास को अस्वीकार कर देता है। यह 95% से नीचे आता है और अस्वीकार्य है। ACCEPT NULL।

आर नल को अस्वीकार करने के लिए 99.77% विश्वास देता है। स्पष्ट रूप से वांछित 95% से ऊपर। हम इस प्रकार अशक्तता को अस्वीकार करते हैं।

मैंने पी-वैल्यू को केवल 'उल्टे तरीके' के माध्यम से उस आत्मविश्वास स्तर तक मापने के उदाहरण को पढ़ा, जिस पर हम अशक्त हाइपो को अस्वीकार करते हैं।


6
साइट पर आपका स्वागत है। आप से क्या मतलब है -variable और -variable? कृपया स्पष्ट करें। इसके अलावा, "स्वीकार अशक्त" वाक्यांश का उपयोग आमतौर पर काफी अवांछनीय माना जाता है, यहां तक ​​कि भ्रामक भी। आरQR
कार्डिनल

@ कार्डिनल एक महत्वपूर्ण बिंदु बताते हैं। आप अशक्त को स्वीकार नहीं करेंगे।
पैट्रिक कूलोमबे

-8

परिकल्पना के परीक्षण में ****** p मान परीक्षण की संवेदनशीलता को मापता है। p मान जितना कम होता है संवेदनशीलता उतनी अधिक होती है। यदि महत्व स्तर ०.०५ पर सेट किया गया है तो ०.०००१ का पी मान ६.०१ परीक्षा परिणाम के सही होने की उच्च संभावना दर्शाता है।


6
-1 यह स्पष्ट रूप से गलत है। आप पहले उच्च मतदान जवाब पढ़ना चाहते हैं।
मोमो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.