यदि पी-वैल्यू ठीक 1 (1.0000000) है, तो शून्य परिकल्पना के सही होने के लिए विश्वास अंतराल सीमाएं क्या होनी चाहिए? [बन्द है]


12

यह विशुद्ध रूप से एक काल्पनिक सवाल है। एक बहुत ही सामान्य कथन है कि कभी भी सत्य नहीं है, यह केवल नमूने के आकार की बात है।H0

मान लें कि असली के लिए सामान्य रूप से वितरित जनसंख्या (दोनों और अनुमानित ) से खींचे गए दो साधनों ( ) के बीच कोई औसत दर्जे का अंतर नहीं है । हम प्रति समूह मान लेते हैं और हम -est का उपयोग करते हैं । इसका मतलब यह होगा कि -value है का संकेत बिल्कुल से कोई विरोध नहीं होता है कि वहाँ । यह इंगित करेगा कि परीक्षण आँकड़ा । समूहों के बीच का अंतर होगा । इस मामले में औसत अंतर के लिए विश्वास अंतराल की सीमा क्या होगी ? क्या वे होंगे?μ1=μ2μ=0σ=1N=16tp1.00000H00095%[0.0,0.0] ?

मेरे प्रश्न में मुख्य बिंदु यह था कि हम वास्तव में यह कब कह सकते हैं कि सत्य है, अर्थात इस मामले में ? या जब लगातार ढांचे में हम दो साधनों की तुलना करते हैं, तो हम वास्तव में "कोई अंतर नहीं" कह सकते हैं?H0μ1=μ2


1
मैं कहूंगा कि यह पहले से ही यहां दिए गए आँकड़े में वर्णित है ।stackexchange.com / questions / 275677 / , लेकिन मैं इस पर जोर नहीं दे रहा हूं।
टिम

1
मुझे सकारात्मक जनसंख्या भिन्नताओं के साथ प्राप्त करने के तरीके के साथ आने में परेशानी हो रही है । p=1
डेव


3
"हम प्रति समूह N = 16 मानते हैं और हम टी-टेस्ट का उपयोग करते हैं। इसका मतलब यह होगा कि पी-मान 1.00000 है जो दर्शाता है कि H0 से बिल्कुल कोई विसंगति नहीं है।" आप यह क्यों तर्क देते हैं कि कुछ (जो 'यह' संदर्भित करता है?) का अर्थ है कि पी-मान 1 है। सबसे आम तौर पर पी-मान एक समान वितरित किया जाता है जब H_0 सत्य है, और p = 1 लगभग कभी नहीं होता है।
सेक्टस एम्पिरिकस

2
@MartijnWeterings बिल्कुल सही है - सिर्फ इसलिए कि आप दो वितरणों का नमूना ले रहे हैं जो वास्तव में समान हैं, इसका मतलब यह नहीं है कि उनकी तुलना करते समय आपको 1 का पी-मान मिलेगा। परिभाषा के अनुसार, समय का 5% आपको 0.05 से नीचे पी-मूल्य मिलेगा।
न्यूक्लियर वैंग

जवाबों:


17

टी-टेस्ट के लिए एक आत्मविश्वास अंतराल फॉर्म , जहां और नमूना साधन हैं, दिए गए पर महत्वपूर्ण मान है , और में अंतर की मानक त्रुटि है। यदि , तो । तो सूत्र बस , और सीमाएं केवल { ,x¯1x¯2±tcrit,αsx¯1x¯2x¯1x¯2tcrit,αtαsx¯1x¯2p=1.0x¯1x¯2=0±tcrit,αsx¯1x¯2tcrit,αsx¯1x¯2tcrit,αsx¯1x¯2 }।

मुझे यकीन नहीं है कि आपको क्यों लगता है कि सीमाएं होंगीमहत्वपूर्ण मान शून्य नहीं है और औसत अंतर की मानक त्रुटि शून्य नहीं है।{0,0}.t


10

सुपर-आलसी होने के नाते, हाथ से गणना करने के बजाय संख्यात्मक रूप से समस्या को हल करने के लिए R का उपयोग करें:

एक फ़ंक्शन को परिभाषित करें जो सामान्य अर्थ के साथ वितरित मूल्यों को देगा (लगभग!) बिल्कुल शून्य और बिल्कुल 1 का एक एसडी।

rn2 <- function(n) {r <- rnorm(n); c(scale(r)) }

टी-टेस्ट चलाएं:

t.test(rn2(16),rn2(16))

    Welch Two Sample t-test

data:  rn2(16) and rn2(16)
t = 1.7173e-17, df = 30, p-value = 1
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.7220524  0.7220524
sample estimates:
   mean of x    mean of y 
6.938894e-18 8.673617e-19 

फ्लोटिंग-पॉइंट इंप्रेशन के कारण साधन बिल्कुल शून्य नहीं हैं।

अधिक सीधे, सीआई ± sqrt(1/8)*qt(0.975,df=30) ; प्रत्येक माध्य का विचरण १/१६ है, अतः तालबद्ध विचरण १/ mean है।


8

CI की कोई सीमा हो सकती है, लेकिन यह बिल्कुल शून्य के आसपास केंद्रित है

दो-नमूना टी-परीक्षण (दो आबादी के साधनों में अंतर के लिए परीक्षण) के लिए, वास्तव में एक का मान उस मामले से मेल खाता है जहां मनाया नमूना साधन बिल्कुल समान हैं। (नमूना प्रसरण किसी भी मूल्यों पर ले जा सकते हैं।) इस देखने के लिए, कृपया ध्यान दें कि परीक्षण के लिए पी-मूल्य समारोह है:

pp(x,y)=P(|X¯Y¯SY/nY+SY/nY||x¯y¯sY/nY+sY/nY|).

इस प्रकार, पैदावार:x¯=y¯

p(x,y)=P(|X¯Y¯SY/nY+SY/nY|0)=1.

अब, मान लीजिए कि आप वेल्च-सटरवाइट सन्निकटन का उपयोग करके मानक (अनुमानित) विश्वास अंतराल बनाते हैं। इस स्थिति में, यह मानकर कि (किसी का सटीक p- मान देने के लिए) विश्वास अंतराल देता है:x¯=y¯

CI(1α)=[0±sXnX+tDF,α/2sYnY],

जहां डिग्री-ऑफ-फ्रीडम को वेल्च-सटरवाइट सन्निकटन द्वारा निर्धारित किया जाता है। समस्या में देखे गए नमूना प्रकारों के आधार पर, विश्वास अंतराल शून्य के आसपास केंद्रित किसी भी परिमित अंतराल हो सकता है। यही है, आत्मविश्वास अंतराल की कोई सीमा हो सकती है, इसलिए जब तक यह शून्य के आसपास केंद्रित नहीं होता है।DF


बेशक, यदि अंतर्निहित डेटा वास्तव में एक निरंतर वितरण से आता है, तो यह घटना संभावना शून्य के साथ होती है, लेकिन मान लें कि ऐसा होता है।


प्रश्न कहता है "σ अनुमानित = 1"।
Acccumulation

उस शर्त को एक का मान प्राप्त करने के लिए आवश्यक नहीं है, इसलिए मैंने इसे गिरा दिया है।
बेन -

3

जिन चीजों की 0 संभावना होने की संभावना है, उनके बारे में एक अस्पष्ट दार्शनिक चर्चा करना मुश्किल है। इसलिए मैं आपको कुछ उदाहरण दिखाऊंगा जो आपके प्रश्न से संबंधित हैं।

यदि आपके पास समान वितरण से दो विशाल स्वतंत्र नमूने हैं, तो दोनों नमूनों में अभी भी कुछ परिवर्तनशीलता होगी, पूल किए गए 2-नमूना टी स्टेटिस्टिक पास होंगे, लेकिन बिल्कुल 0 नहीं , पी-मान को रूप में वितरित किया जाएगा और 95% विश्वास अंतराल बहुत ही कम और पास केंद्रित होगाUnif(0,1),0.

इस तरह के डेटासेट और टी टेस्ट का एक उदाहरण:

set.seed(902)
x1 = rnorm(10^5, 100, 15)  
x2 = rnorm(10^5, 100, 15)
t.test(x1, x2, var.eq=T)

        Two Sample t-test

data:  x1 and x2
t = -0.41372, df = 2e+05, p-value = 0.6791
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.1591659  0.1036827
sample estimates:
mean of x mean of y 
 99.96403  99.99177 

यहाँ 10,000 ऐसी स्थितियों से संक्षेप में परिणाम दिए गए हैं। सबसे पहले, पी-मूल्यों का वितरण।

set.seed(2019)
pv = replicate(10^4, 
   t.test(rnorm(10^5,100,15),rnorm(10^5,100,15),var.eq=T)$p.val)
mean(pv)
[1] 0.5007066   # aprx 1/2
hist(pv, prob=T, col="skyblue2", main="Simulated P-values")
 curve(dunif(x), add=T, col="red", lwd=2, n=10001)

यहाँ छवि विवरण दर्ज करें

अगला परीक्षण आँकड़ा:

set.seed(2019)  # same seed as above, so same 10^4 datasets
st = replicate(10^4, 
       t.test(rnorm(10^5,100,15),rnorm(10^5,100,15),var.eq=T)$stat)
mean(st)
[1] 0.002810332  # aprx 0
hist(st, prob=T, col="skyblue2", main="Simulated P-values")
 curve(dt(x, df=2e+05), add=T, col="red", lwd=2, n=10001)

यहाँ छवि विवरण दर्ज करें

और इसलिए सीआई की चौड़ाई के लिए।

set.seed(2019)
w.ci = replicate(10^4, 
        diff(t.test(rnorm(10^5,100,15),
         rnorm(10^5,100,15),var.eq=T)$conf.int)) 
mean(w.ci)
[1] 0.2629603

निरंतर डेटा के साथ एक सटीक परीक्षण करने वाली एकता का पी-मूल्य प्राप्त करना लगभग असंभव है, जहां धारणाएं पूरी होती हैं। इतना तो है, कि एक बुद्धिमान सांख्यिकीविद् विचार करेगा कि 1 के पी-मूल्य को देखकर क्या गलत हुआ है।

उदाहरण के लिए, आप सॉफ़्टवेयर को दो समान बड़े नमूने दे सकते हैं। प्रोग्रामिंग इस तरह से होगी जैसे कि ये दो स्वतंत्र नमूने हैं, और अजीब परिणाम देते हैं। लेकिन तब भी CI 0 चौड़ाई का नहीं होगा।

set.seed(902)
x1 = rnorm(10^5, 100, 15)  
x2 = x1
t.test(x1, x2, var.eq=T)

        Two Sample t-test

data:  x1 and x2
t = 0, df = 2e+05, p-value = 1
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval: 
 -0.1316593  0.1316593
sample estimates:
mean of x mean of y 
 99.96403  99.96403 

हालांकि, यह सब काफी उचित है, क्योंकि सामान्य वितरण निरंतर है, किसी भी विशिष्ट उदाहरण के लिए संभावना शून्य है, इससे कोई फर्क नहीं पड़ता कि क्या u1 = u2 या u1-u2 = -0.977 या जो भी हो। मुझे "यह कभी नहीं होगा" की तर्ज पर टिप्पणी करने के लिए लुभाया गया था और उस मामले में कुछ गलत हो सकता है ", लेकिन फिर मैंने सोचा, नहीं, यह कहने का कोई मतलब है, यह मान लिया है कि यह स्वीकार कर लिया है किसी भी विशिष्ट उदाहरण के रूप में संभावना शून्य ।
लेविन

1
यह गलत प्रश्न का सही उत्तर है
डेविड

1
@ डेविड। संभवतः ऐसा है। यदि आप यह बता सकते हैं कि आप किस चीज़ को सही प्रश्न मानते हैं और उत्तर देना चाहते हैं, तो यह चारों ओर से सहायक हो सकता है। मैंने केवल कुछ को संबोधित करने का प्रयास किया जो मैंने सोचा था कि कई गलत धारणाएं थीं।
ब्रूसेट

ओपी ने कहा "एक बहुत ही सामान्य कथन है कि H0 कभी सच नहीं होता है।" @ ब्रूसेट का जवाब यह दर्शाता है कि क्यों H0 को कभी स्वीकार नहीं किया जा सकता। करीब H0 सच किया जा रहा करने के लिए आता है, और अधिक समान रूप से यादृच्छिक पी हो जाता है, कि साधन के बीच (0.98,0.99) एक पी के बीच (0.1, 0.2) जब H0 एक पी के रूप में बस के रूप में होने की संभावना है है सच।
रॉन जेन्सेन - हम सभी मोनिका

1

सीधा उत्तर (+1 से नूह) समझाएगा कि अंतर अंतर के लिए आत्मविश्वास अंतराल अभी भी नॉनजरो लंबाई का हो सकता है क्योंकि यह नमूने में पी-मूल्य की तुलना में एक अलग तरीके से मनाया भिन्नता पर निर्भर करता है।

हालाँकि आपको अभी भी आश्चर्य हो सकता है कि ऐसा क्यों है। चूंकि यह कल्पना करना अजीब नहीं है कि उच्च पी-मूल्य का मतलब एक छोटे आत्मविश्वास का अंतराल भी है। आखिरकार, वे दोनों एक ऐसी चीज से मेल खाते हैं जो अशक्त परिकल्पना की पुष्टि के करीब है। तो यह विचार सही क्यों नहीं है?

एक उच्च पी-मूल्य एक छोटे आत्मविश्वास अंतराल के समान नहीं है।

  • पी-वैल्यू इस बात का सूचक है कि किसी विशेष विचलन (चरम दी गई कुछ परिकल्पना) को व्यक्त करने से यह पता चलता है कि किसी विचलन का अवलोकन करना कितना संभावित है। यह प्रयोग की सटीकता के संबंध में मनाया प्रभाव आकार की एक अभिव्यक्ति है (एक बड़े मनाया प्रभाव आकार बहुत मतलब नहीं हो सकता है जब प्रयोग इस तरह के 'गलत' है कि ये अवलोकन एक सांख्यिकीय / संभाव्य बिंदु से चरम नहीं हैं )। आप तो 1 के एक पी-मूल्य का निरीक्षण जब यह (केवल) का मतलब है कि आप मनाया शून्य प्रभाव क्योंकि संभावना इस तरह के शून्य परिणाम निरीक्षण करने के लिए या बड़ा 1 के बराबर है (लेकिन यह एक ही रूप में है कि वहाँ नहीं है है शून्य प्रभाव)।

    सिडेनोट: पी-वैल्यू क्यों? पी-मूल्य अपेक्षित प्रभाव आकारों (संभावनाओं) के संबंध में वास्तविक अवलोकन प्रभाव आकार को व्यक्त करता है। यह प्रासंगिक है क्योंकि प्रयोग, डेटा के आधार पर सामान्य उतार-चढ़ाव के कारण शुद्ध संभावना द्वारा कुछ प्रासंगिक प्रभाव आकार के अवलोकन उत्पन्न कर सकते हैं। आवश्यकता है कि अवलोकन / प्रयोग का कम पी-मूल्य है, जिसका अर्थ है कि प्रयोग में एक उच्च परिशुद्धता है - अर्थात: मनाया प्रभाव का आकार अक्सर कम होता है / संभावना के कारण संभावना / उतार-चढ़ाव (और यह एक सच्चे प्रभाव के कारण होने की संभावना हो सकती है) ।

    सिडेनोट: निरंतर चर के लिए 1 के बराबर यह p- मान लगभग कभी नहीं होता है क्योंकि यह एक घटना है जिसमें शून्य माप होता है (जैसे एक सामान्य वितरित चर आपके पास )। लेकिन असतत चर या विच्छिन्न निरंतर चर के लिए यह मामला हो सकता है (कम से कम संभावना गैर-शून्य है)।XN(0,1)P(X=0)=0

  • αα

    आप ध्यान देना चाहिए कि एक उच्च पी-मूल्य है नहीं (जरूरी) एक सबूत / support / शून्य परिकल्पना के लिए जो कुछ भी। उच्च पी-मूल्य का अर्थ केवल यह है कि किसी दिए गए शून्य परिकल्पना के लिए अवलोकन उल्लेखनीय / चरम नहीं है, लेकिन यह केवल वैकल्पिक परिकल्पना के लिए मामला हो सकता है (यानी परिणाम दोनों परिकल्पना हां / नहीं प्रभाव के अनुसार है)। यह आमतौर पर तब होता है जब डेटा बहुत अधिक जानकारी (जैसे उच्च शोर या छोटा नमूना) नहीं ले जाता है।

p0.5pU(0,1)


1

H0μ1=μ2

नहीं, क्योंकि "सबूतों का अभाव अनुपस्थिति का सबूत नहीं है।" जोड़ा अनिश्चितताओं के साथ, तर्क के विस्तार के रूप में संभावना को सोचा जा सकता है, इसलिए एक पल के लिए कल्पना करें कि इकाई अंतराल पर वास्तविक संख्याओं के बजाय, परिकल्पना परीक्षण केवल द्विआधारी मान लौटाएगा: 0 (गलत) या 1 (सत्य)। ऐसे मामले में, तर्क के बुनियादी नियम निम्न उदाहरण में लागू होते हैं :

  • अगर बाहर बारिश हुई, तो मैदान गीला होने की संभावना है।
  • जमीन गीली है।
  • इसलिए, बाहर बारिश हुई।

मैदान बहुत अच्छी तरह से गीला हो सकता था क्योंकि बारिश हुई थी। या यह एक स्प्रिंकलर के कारण हो सकता है, कोई अपने गटर की सफाई करता है, एक पानी मुख्य टूट जाता है, आदि अधिक चरम उदाहरण ऊपर दिए गए लिंक में पाए जा सकते हैं।

μ1μ20

p=1±0H0


0

आत्मविश्वास अंतराल की गणना के लिए आपको मानक टी- या गॉस-फ़ार्मुलों का उपयोग करने से कुछ भी नहीं रोकता है - आपके प्रश्न में दिए गए सभी आवश्यक सुझाव दिए गए हैं। p = 1 का मतलब यह नहीं है कि इसमें कुछ भी गलत है। ध्यान दें कि p = 1 का मतलब यह नहीं है कि आप विशेष रूप से सुनिश्चित कर सकते हैं कि H0 सच है। यादृच्छिक भिन्नता अभी भी मौजूद है और यदि u0 = u1 H0 के अंतर्गत हो सकता है, तो यह भी हो सकता है यदि u0 का वास्तविक मान, वास्तविक u1 से थोड़ा भिन्न हो, तो विश्वास समानता में केवल समानता से अधिक होगा।


मैंने कुछ संपादन किया, मुझे उम्मीद है कि अब यह अधिक परिभाषित है।
अर्कियामु

ठीक है, मैंने उन संदर्भों को हटा दिया जो पहले के संस्करण में बीमार थे। इस बीच सवाल का जवाब दूसरों द्वारा ठीक से दिया गया है।
लेविन

कृपया मैथजैक्स नोटेशन का उपयोग करें
डेविड

0

एक बहुत ही सामान्य कथन है कि H0 कभी भी सत्य नहीं है, यह सिर्फ नमूने के आकार की बात है।

उन लोगों में नहीं, जो जानते हैं कि वे किस बारे में बात कर रहे हैं, और ठीक-ठीक बोल रहे हैं। पारंपरिक परिकल्पना परीक्षण कभी नहीं समाप्त होती है कि रिक्त सही है, लेकिन है कि क्या अशक्त सच है या नहीं से अशक्त है कि क्या अलग है निष्कर्ष निकाला है सच।

इसका मतलब यह होगा कि पी-वैल्यू 1.00000 है

दो-पूंछ वाले परीक्षण के लिए, हाँ।

यह दर्शाता है कि H0 से कोई विसंगति नहीं है।

H0H00H0H0 भविष्यवाणी, कि बहुत अधिक वैध रूप से एक "विसंगति" कहा जाएगा की तुलना में केवल एक ही नमूना है जिसका मतलब मोड से मेल नहीं खाता है।

इस मामले में औसत अंतर के लिए 95% विश्वास अंतराल की सीमा क्या होगी?

f(ϵ)ϵlimϵ0f(ϵ)

मेरे प्रश्न में मुख्य बिंदु यह था कि हम वास्तव में यह कैसे कह सकते हैं कि H0 सच है, अर्थात इस मामले में μ1 = μ2?

हम जो चाहें कह सकते हैं। हालांकि, यह कहना कि एक परीक्षण से पता चलता है कि यह सच है कि पारंपरिक परिकल्पना परीक्षण के अनुरूप नहीं है, परिणाम की परवाह किए बिना। और ऐसा करना एक स्पष्ट दृष्टिकोण से अच्छी तरह से स्थापित नहीं है। वैकल्पिक परिकल्पना, कि साधन समान नहीं हैं, साधनों में सभी संभावित अंतर शामिल हैं। वैकल्पिक परिकल्पना है "साधनों में अंतर , या , या , या , या123.5.1, ... "हम साधनों में एक मनमाने ढंग से छोटे अंतर को प्रस्तुत कर सकते हैं, और यह वैकल्पिक परिकल्पना के अनुरूप होगा। और एक मनमाने ढंग से छोटे अंतर के साथ, संभावना दी जाती है कि इसका अर्थ मनमाने ढंग से अशक्तता के करीब दिया गया है। इसके अलावा। वैकल्पिक परिकल्पना में केवल संभावना ही शामिल नहीं है कि वितरण के पैरामीटर, जैसे कि माध्य, अलग हैं, लेकिन यह एक पूरी तरह से अलग वितरण है। उदाहरण के लिए, वैकल्पिक परिकल्पना में शामिल है "दो नमूनों में हमेशा अंतर होता है कि यह या तो ठीक 1 या बिल्कुल 0 है, प्रायिकता के साथ। प्रत्येक के लिए .5। परिणाम इसके साथ अधिक सुसंगत हैं फिर वे शून्य के साथ हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.