दो-पूंछ वाले परीक्षणों की व्याख्या करना


16

मैं अपने छात्रों को समझाने के विभिन्न तरीकों की तलाश कर रहा हूं (प्राथमिक सांख्यिकी पाठ्यक्रम में) दो पूंछ वाला परीक्षण क्या है, और इसके पी मान की गणना कैसे की जाती है।

आप अपने छात्रों को दो-बनाम एक-पूंछ परीक्षा के बारे में कैसे समझाते हैं?

जवाबों:


17

यह एक महान प्रश्न है और मैं पी-मूल्य और दो-पूंछ बनाम एक-पूंछ वाले परीक्षण को समझाने के हर संस्करण का इंतजार कर रहा हूं। मैं साथी ऑर्थोपेडिक सर्जन आँकड़े पढ़ा रहा हूं और इसलिए मैंने इसे यथासंभव मूल रखने की कोशिश की क्योंकि उनमें से अधिकांश ने 10-30 वर्षों तक कोई उन्नत गणित नहीं किया है।

पी-मानों और पूंछों की गणना करने का मेरा तरीका

मैं एक व्याख्या के साथ शुरू करता हूं कि अगर हम मानते हैं कि हमारे पास एक उचित सिक्का है, तो हमें पता है कि इसे औसतन 50% फ़्लिप होना चाहिए ( )। अब अगर आप सोचते हैं कि इस उचित सिक्के के साथ 10 फ़्लिप में से केवल 2 पूंछ प्राप्त करने की संभावना क्या है तो आप उस संभावना की गणना कर सकते हैं जैसा कि मैंने बार ग्राफ में किया है। ग्राफ से आप देख सकते हैं कि 10 में से 8 प्राप्त होने की संभाव्यता एक निष्पक्ष सिक्का साथ flips के बारे में के बारे में है 4.4 %=H04.4%

चूंकि हम सिक्के की निष्पक्षता पर सवाल उठाएंगे अगर हमें 9 या 10 पूंछ मिलीं तो हमें इन संभावनाओं को शामिल करना होगा, परीक्षण की पूंछ। मूल्यों को जोड़ कर हम चाहते हैं कि संभावना अब से कुछ अधिक है मिल 5.5% 2 पूंछ या उससे कम होने का।

अब अगर हमें केवल 2 सिर, यानी 8 सिर (दूसरी पूंछ) मिलेंगे, तो हम संभवतः सिक्के की निष्पक्षता पर सवाल उठाने के लिए तैयार होंगे। इसका मतलब है कि आप की एक संभावना के साथ खत्म एक के लिए दो-पुच्छीय परीक्षण5.4...%+5.4...%10.9%

चूंकि हम चिकित्सा में आमतौर पर विफलताओं का अध्ययन करने में रुचि रखते हैं, इसलिए हमें संभावना के विपरीत पक्ष को शामिल करने की आवश्यकता है, भले ही हमारा इरादा अच्छा करने और एक लाभदायक उपचार शुरू करने का हो।

मेरे फ्लिपिंग सिक्के का ग्राफ

विषय से थोड़ा हटकर विचार

यह सरल उदाहरण यह भी दर्शाता है कि पी-मूल्य की गणना करने के लिए हम अशक्त परिकल्पना पर कितने निर्भर हैं। मुझे द्विपद वक्र और घंटी वक्र के बीच समानता को इंगित करना भी पसंद है। 200 फ़्लिप में बदलते समय आपको यह समझाने का एक स्वाभाविक तरीका मिलता है कि 100 फ़्लिप होने की संभावना में प्रासंगिकता की कमी क्यों होने लगती है। ब्याज के परिभाषित अंतराल संभावना घनत्व / बड़े पैमाने पर कार्य और उनके संचयी समकक्षों के लिए एक प्राकृतिक संक्रमण है।

अपनी कक्षा में मैं उन्हें खान अकादमी सांख्यिकी वीडियो की सलाह देता हूं और मैं कुछ अवधारणाओं के लिए उनके स्पष्टीकरण का उपयोग भी करता हूं। वे फ्लिप सिक्कों को भी प्राप्त करते हैं जहां हम फ्लिपिंग के सिक्के की यादृच्छिकता को देखते हैं - जिस चीज को मैं दिखाने की कोशिश करता हूं वह यह है कि यादृच्छिकता इस रेडिओलैब एपिसोड से प्रेरित आमतौर पर जो हम मानते हैं उससे अधिक यादृच्छिक है ।

कोड

मेरे पास आमतौर पर एक ग्राफ / स्लाइड होता है, आर-कोड जिसका उपयोग मैंने ग्राफ बनाने के लिए किया है:

library(graphics)

binom_plot_function <- function(x_max, my_title = FALSE, my_prob = .5, edges = 0, 
                                col=c("green", "gold", "red")){
  barplot(
    dbinom(0:x_max, x_max, my_prob)*100, 
    col=c(rep(col[1], edges), rep(col[2], x_max-2*edges+1), rep(col[3], edges)),
    #names=0:x_max,
    ylab="Probability %",
    xlab="Number of tails", names.arg=0:x_max)
  if (my_title != FALSE ){
    title(main=my_title)
  }
}

binom_plot_function(10, paste("Flipping coins", 10, "times"), edges=0, col=c("#449944", "gold", "#994444"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", "gold"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", rgb(200/255, 100/255, 100/255)))

शानदार जवाब मैक्स - और मेरे सवाल की गैर-तुच्छता को पहचानने के लिए धन्यवाद :)
ताल गैली

+1 अच्छा जवाब, बहुत गहन। मुझे माफ कर दो, लेकिन मैं दो चीजों पर नाइटपिक करने जा रहा हूं। 1) पी-मान को डेटा की संभावना के रूप में समझा जाता है कि अशक्त के रूप में आपका चरम या अधिक चरम है, इस प्रकार आपका उत्तर सही है। हालांकि, जब आपके सिक्के की तरह असतत डेटा का उपयोग किया जाता है, तो यह अनुचित रूप से रूढ़िवादी है। इसका उपयोग करना सबसे अच्छा है जिसे "मिड पी-वैल्यू" कहा जाता है, अर्थात 1/2 डेटा की संभावना जितनी आपकी है + डेटा की संभावना अधिक चरम है। इन मुद्दों की एक आसान चर्चा Agesti (2007) 2.6.3 में पाई जा सकती है। (शेष भाग।)
गुंग - को पुनः स्थापित मोनिका

2) आप कहते हैं कि जितना हम मानते हैं, उससे कहीं अधिक यादृच्छिकता है। मैं अनुमान लगा सकता हूं कि आपके द्वारा इसका क्या मतलब हो सकता है (मुझे आपके द्वारा लिंक किए गए रेडिओलैब एपिसोड को सुनने का मौका नहीं मिला है, लेकिन मैं करूंगा)। उत्सुकता से पर्याप्त, मैंने हमेशा छात्रों से कहा है कि यादृच्छिकता कम यादृच्छिक है जितना आप मानते हैं। मैं यहाँ धारियों (जैसे जुए में) की धारणा की बात कर रहा हूँ। लोगों का मानना ​​है कि यादृच्छिक घटनाओं को वास्तव में होने वाली यादृच्छिक घटनाओं की तुलना में अधिक वैकल्पिक होना चाहिए, और परिणामस्वरूप विश्वास है कि वे लकीरें देखते हैं। फाल्क (1997) देखें रैंडमनेस का एहसास मानसिक रेव 104,2। फिर, आप गलत नहीं हैं - सिर्फ विचार के लिए भोजन।
गूँग - मोनिका

आपके इनपुट के लिए धन्यवाद @gung। मैंने वास्तव में मध्य-अंतराल के बारे में नहीं सुना है - हालांकि यह समझ में आता है। मुझे यकीन नहीं है कि अगर यह कुछ है तो मैं बुनियादी आंकड़ों को पढ़ाने का उल्लेख करूंगा क्योंकि यह हाथों को खोने का एहसास दे सकता है जो मुझे देने की कोशिश करता है। यादृच्छिकता के संबंध में हमारा मतलब बिल्कुल वही है - जब वास्तव में यादृच्छिक संख्या देखकर हमें लगता है कि यह एक पैटर्न है। मुझे लगता है कि मैंने भविष्यवाणी की फ्रेडोनोमिक्स पॉडकास्ट फ़ॉली पर सुना है ...
मैक्स गॉर्डन

... मानव मन ने पिछले कुछ वर्षों में सीखा है कि एक शिकारी का पता लगाने में विफल होना यह सोचने से महंगा है कि यह शायद कुछ भी नहीं है। मुझे वह सादृश्य पसंद है और मैं अपने सहयोगियों को यह बताने की कोशिश करता हूं कि आँकड़ों का उपयोग करने के प्राथमिक कारणों में से एक इस दोष के साथ हमारी मदद करना है कि हम सभी के साथ पैदा हुए हैं।
मैक्स गॉर्डन

9

मान लीजिए कि आप इस परिकल्पना का परीक्षण करना चाहते हैं कि पुरुषों की औसत ऊंचाई "5 फीट 7 इंच" है। आप पुरुषों का एक यादृच्छिक नमूना चुनते हैं, उनकी ऊंचाइयों को मापते हैं और नमूना माध्य की गणना करते हैं। आपकी परिकल्पना तब है:

H0:μ=5 ft 7 inches

HA:μ5 ft 7 inches

उपरोक्त स्थिति में आप दो-पूंछ वाले परीक्षण करते हैं क्योंकि आप अपने नल को अस्वीकार कर देंगे यदि नमूना औसत या तो बहुत कम है या बहुत अधिक है।

इस मामले में, पी-मूल्य एक नमूना साकार करने की संभावना का प्रतिनिधित्व करता है जो कम से कम चरम पर है जैसा कि हमने वास्तव में यह मानकर प्राप्त किया है कि नल वास्तव में सच है। इस प्रकार, यदि नमूना "5 फीट 8 इंच" होने का मतलब है, तो पी-मूल्य इस संभावना का प्रतिनिधित्व करेगा कि हम "5 फीट 8 इंच" से अधिक ऊंचाइयों का निरीक्षण करेंगे या "5 फीट 6 इंच" से कम ऊंचाई प्रदान करेंगे सच हैं।

यदि दूसरी तरफ आपके विकल्प को ऐसा बनाया गया था:

HA:μ>5 ft 7 inches

उपरोक्त स्थिति में आप दाईं ओर एक-पूंछ वाला परीक्षण करेंगे। कारण यह है कि आप वैकल्पिक के पक्ष में नल को अस्वीकार करना पसंद करेंगे, यदि नमूना माध्य अत्यंत अधिक हो।

पी-वैल्यू की व्याख्या मामूली बारीकियों के साथ ही रहती है जो अब हम एक नमूना साकार करने की संभावना के बारे में बात कर रहे हैं जो वास्तव में हमें प्राप्त होने वाले से अधिक है। इस प्रकार, यदि नमूना "5 फीट 8 इंच" होने का मतलब है, तो पी-मूल्य इस संभावना का प्रतिनिधित्व करेगा कि हम "5 फीट 8 इंच" से अधिक ऊंचाइयों का निरीक्षण करेंगे, बशर्ते नल सही है।


2
HAH0:μ5 ft 7 inchesएच0:μ=5 फुट 7 इंच । इस प्रश्न पर @ व्हिबर की टिप्पणियों में से एक को देखें, क्या शून्य और वैकल्पिक परिकल्पनाएं संपूर्ण हैं या नहीं?
CHL

2
@chl मैं सहमत हूँ। हालांकि, एक व्यक्ति के लिए जो सिर्फ सांख्यिकीय विचारों से परिचित कराया जा रहा है, एक-पूंछ वाले परीक्षण के लिए नल को फिर से लिखना एक ध्यान भंग हो सकता है जब ध्यान पी-मूल्य की व्याख्या के संबंध में कैसे और क्यों चीजों पर बदलता है।
व्रती

1
काफी उचित। हालांकि, शिक्षण उद्देश्य के लिए भी यह ध्यान देने योग्य है।
chl
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.