क्या कई पी-वैल्यू का एक समान वितरण सांख्यिकीय प्रमाण देता है कि H0 सच है?


28

एक एकल सांख्यिकीय परीक्षण इस बात का प्रमाण दे सकता है कि अशक्त परिकल्पना (H0) झूठी है और इसलिए वैकल्पिक परिकल्पना (H1) सत्य है। लेकिन यह दिखाने के लिए इस्तेमाल नहीं किया जा सकता है कि H0 सच है क्योंकि H0 को अस्वीकार करने का मतलब यह नहीं है कि H0 सच है।

लेकिन मान लें कि आपके पास कई बार सांख्यिकीय परीक्षण करने की संभावना है क्योंकि आपके पास कई डेटासेट हैं, जो एक दूसरे से स्वतंत्र हैं। सभी डेटासेट एक ही प्रक्रिया के परिणाम हैं और आप इस प्रक्रिया पर कुछ कथन (H0 / H1) बनाना चाहते हैं और प्रत्येक एकल परीक्षा के परिणामों में रुचि नहीं रखते हैं। आप तब सभी परिणामी पी-मान एकत्र करते हैं और हिस्टोग्राम प्लॉट के माध्यम से देखते हैं कि पी-मान स्पष्ट रूप से समान रूप से वितरित किए गए हैं।

मेरा तर्क अब यह है कि यह केवल तभी हो सकता है जब H0 सच है - अन्यथा पी-मान अलग-अलग वितरित किए जाएंगे। क्या इसलिए यह निष्कर्ष निकालना पर्याप्त है कि H0 सच है? या क्या मैं यहाँ कुछ आवश्यक याद कर रहा हूँ, क्योंकि मुझे "He is true" लिखने के लिए बहुत सारी इच्छाशक्ति का सहारा लिया गया था, जो कि मेरे सिर में बहुत ही भयानक लगता है।


1
आप एक अलग प्रश्न के प्रति मेरे जवाब में रुचि रख सकते हैं। आँकड़े। Netexchange.com/questions/171742/… जो यहाँ परिकल्पना के बारे में कुछ टिप्पणी है।
mdewey

H0 अपनी परिभाषा से गलत है।
जोशुआ

1
एक साइड नोट पर, कारण है कि मेरे पास इतने सारे परीक्षण हैं (और सिर्फ एक ही बार में सभी डेटा को संयुक्त नहीं किया गया है) यह है कि मेरे डेटा को दुनिया भर में स्थानिक रूप से वितरित किया गया है और मैं देखना चाहता हूं कि क्या स्थानिक पैटर्न हैं पी-मान (वहाँ नहीं हैं, लेकिन अगर वहाँ थे तो इसका मतलब होगा कि या तो स्वतंत्रता का उल्लंघन किया गया है या कि H0 / H1 दुनिया के विभिन्न हिस्सों में सच है)। मैंने इसे प्रश्न पाठ में शामिल नहीं किया है क्योंकि मैं इसे सामान्य रखना चाहता था।
लिएंडर मॉसिंजर

जवाबों:


22

मुझे आपका सवाल पसंद है, लेकिन दुर्भाग्य से मेरा जवाब नहीं है, यह H0 साबित नहीं होता है । कारण बहुत सरल है। आपको कैसे पता चलेगा कि पी-वैल्यू का वितरण एक समान है? आपको शायद एकरूपता के लिए एक परीक्षण चलाना होगा जो आपको अपना स्वयं का पी-मूल्य लौटाएगा, और आप एक ही तरह के अनुमान प्रश्न के साथ समाप्त हो जाएंगे जिससे आप बचने की कोशिश कर रहे थे, केवल एक कदम आगे। मूल की पी-मूल्य को देख के बजाय H0 , अब आप एक और की एक पी-मूल्य को देखने के H0 मूल पी मानों का वितरण की एकरूपता के बारे में।

अद्यतन करें

यहाँ प्रदर्शन है। मैं गौसियन और पॉइसन वितरण से 100 टिप्पणियों के 100 नमूने उत्पन्न करता हूं, फिर प्रत्येक नमूने के सामान्यता परीक्षण के लिए 100 पी-मान प्राप्त करता हूं। इसलिए, प्रश्न का आधार यह है कि यदि पी-मान एक समान वितरण से हैं, तो यह साबित होता है कि अशक्त परिकल्पना सही है, जो सांख्यिकीय अनुमान में "अस्वीकार करने में विफल" सामान्य से अधिक मजबूत कथन है। मुसीबत यह है कि "पी-मान एक समान हैं" एक परिकल्पना है, जिसे आपको किसी तरह परीक्षण करना है।

नीचे दी गई तस्वीर (पहली पंक्ति) में मैं गासियन और पॉइसन नमूने के लिए एक सामान्यता परीक्षण से पी-मूल्यों के हिस्टोग्राम दिखा रहा हूं, और आप देख सकते हैं कि यह कहना मुश्किल है कि क्या एक दूसरे की तुलना में अधिक समान है। वह मेरा मुख्य बिंदु था।

दूसरी पंक्ति प्रत्येक वितरण से एक नमूने को दिखाती है। नमूने अपेक्षाकृत छोटे हैं, इसलिए आपके पास वास्तव में बहुत अधिक डिब्बे नहीं हो सकते हैं। दरअसल, यह विशेष रूप से गाऊसी नमूना हिस्टोग्राम पर इतना गाऊसी बिल्कुल नहीं दिखता है।

तीसरी पंक्ति में, मैं हिस्टोग्राम पर प्रत्येक वितरण के लिए 10,000 टिप्पणियों के संयुक्त नमूने दिखा रहा हूं। यहां, आपके पास अधिक डिब्बे हो सकते हैं, और आकार अधिक स्पष्ट हैं।

अंत में, मैं एक ही सामान्यता परीक्षण चलाता हूं और संयुक्त नमूनों के लिए पी-वैल्यू प्राप्त करता हूं और यह पॉसन के लिए सामान्यता को खारिज कर देता है, जबकि गौसियन के लिए अस्वीकार करने में विफल रहता है। पी-वैल्यू हैं: [0.45348631] [0.]

यहाँ छवि विवरण दर्ज करें

यह एक प्रमाण नहीं है, निश्चित रूप से, लेकिन इस विचार का प्रदर्शन कि आप संयुक्त नमूने पर एक ही परीक्षण चलाते हैं, इसके बजाय उप-योगों से पी-मूल्यों के वितरण का विश्लेषण करने की कोशिश कर रहे हैं।

यहाँ पायथन कोड है:

import numpy as np
from scipy import stats
from matplotlib import pyplot as plt

def pvs(x):
    pn = x.shape[1]
    pvals = np.zeros(pn)
    for i in range(pn):
        pvals[i] = stats.jarque_bera(x[:,i])[1]
    return pvals

n = 100
pn = 100
mu, sigma = 1, 2
np.random.seed(0)
x = np.random.normal(mu, sigma, size=(n,pn))
x2 = np.random.poisson(15, size=(n,pn))
print(x[1,1])

pvals = pvs(x)
pvals2 = pvs(x2)

x_f = x.reshape((n*pn,1))
pvals_f = pvs(x_f)

x2_f = x2.reshape((n*pn,1))
pvals2_f = pvs(x2_f)
print(pvals_f,pvals2_f)

print(x_f.shape,x_f[:,0])


#print(pvals)
plt.figure(figsize=(9,9))
plt.subplot(3,2,1)
plt.hist(pvals)
plt.gca().set_title('True Normal')
plt.gca().set_ylabel('p-value')

plt.subplot(3,2,2)
plt.hist(pvals2)
plt.gca().set_title('Poisson')
plt.gca().set_ylabel('p-value')

plt.subplot(3,2,3)
plt.hist(x[:,0])
plt.gca().set_title('a small sample')
plt.gca().set_ylabel('x')

plt.subplot(3,2,4)
plt.hist(x2[:,0])
plt.gca().set_title('a small Sample')
plt.gca().set_ylabel('x')

plt.subplot(3,2,5)
plt.hist(x_f[:,0],100)
plt.gca().set_title('Full Sample')
plt.gca().set_ylabel('x')

plt.subplot(3,2,6)
plt.hist(x2_f[:,0],100)
plt.gca().set_title('Full Sample')
plt.gca().set_ylabel('x')

plt.show()

2
@LeanderMoesinger आप अपने सभी परीक्षणों को एक में एकत्रित करके एक मजबूत बिंदु बनाने जा रहे हैं। मान लीजिए, आपके पास 100 टिप्पणियों के साथ एक नमूना है, और पी-मूल्य प्राप्त करें; फिर 99 अतिरिक्त नमूने प्राप्त करें और 100 पी-मानों के साथ समाप्त करें। इसके बजाय, आप सिर्फ 10,000 टिप्पणियों का नमूना चला सकते हैं और पी-मूल्य प्राप्त कर सकते हैं, लेकिन यह अधिक ठोस होगा।
अक्कल

1
@LeanderMoesinger, यह संभावना छोटा नहीं होना करने के लिए है
Aksakal

1
आपका उत्तर प्रश्न को हल नहीं करता है, वह सबूत के बारे में है, लेकिन के बारे में नहीं पूछा सबूत
कार्लोस सिनेली

3
@CarlosCinelli, उनके पास पी-मानों का एक समूह होगा, जो वह दावा करेंगे कि वे समान हैं। यह एक प्रमाण कैसे है जब तक कि वह साबित नहीं करता है कि मूल्य वर्दी से हैं? यह है जिसके बारे में मैं बात कर रहा हूँ।
अक्कल

2
@ अक्षल यह गणित के बारे में है, एक मनाया हुआ घटना (जैसे पी-वैल्यू के एक क्रम) में कुछ का प्रमाण नहीं हो सकता है, लेकिन इसका कारण तार्किक रूप से आपके तर्क से नहीं है।
कार्लोस सिनेली

21

n

एच0एच0

डेविड ह्यूम और प्रेरण की समस्या

एच0एच0

[बी]

  • सदियों से, यूरोपीय लोगों द्वारा मनाया गया हर हंस सफेद था। तब यूरोपीय लोगों ने ऑस्ट्रेलिया की खोज की और काले हंसों को देखा।

  • सदियों से, न्यूटन के गुरुत्वाकर्षण का नियम अवलोकन से सहमत था और इसे सही माना गया था। हालांकि आइंस्टीन के सामान्य सापेक्षता के सिद्धांत द्वारा इसे पलट दिया गया था।

एच0

आगे के तरीकों की एक (अपूर्ण) सूची:

कार्ल पॉपर और मिथ्याकरण

में कार्ल पॉपर के देखने के लिए, कोई वैज्ञानिक कानून कभी सच साबित होता है। हमारे पास केवल वैज्ञानिक कानून हैं जो अभी तक झूठे साबित नहीं हुए हैं।

पॉपर ने तर्क दिया कि विज्ञान परिकल्पनाओं का अनुमान लगाकर और उन्हें कठोर जांच के द्वारा आगे बढ़ाता है। यह कटौती के माध्यम से आगे बढ़ता है (अवलोकन सिद्धांतों को गलत साबित करता है), न कि प्रेरण (दोहराए गए सिद्धांत सही सिद्ध करते हुए)। अक्सर दर्शनशास्त्रियों ने इस दर्शन के अनुरूप निर्माण किया था।

पॉपर का दृष्टिकोण बेहद प्रभावशाली रहा है, लेकिन जैसा कि कुह्न और अन्य ने तर्क दिया है, यह सफल विज्ञान के अनुभवजन्य अभ्यास के अनुरूप नहीं है।

बायेसियन, व्यक्तिपरक संभावना

θ

θθθपी(θ)पी(θ|एक्स)θएक्स। आप विभिन्न स्थितियों में कैसे व्यवहार करते हैं, इन व्यक्तिपरक संभावनाओं के लिए कुछ पत्राचार है।

यह आपके स्वयं के व्यक्तिपरक विश्वासों को मॉडल करने का एक तार्किक तरीका है, लेकिन यह उन संभावनाओं को उत्पन्न करने का एक जादुई तरीका नहीं है जो वास्तविकता से पत्राचार के संदर्भ में सत्य हैं। किसी भी Bayesian व्याख्या के लिए एक मुश्किल सवाल यह है कि पादरी कहाँ से आते हैं? इसके अलावा, क्या होगा अगर मॉडल गलत है?

जॉर्ज पी। बॉक्स

जॉर्ज ईपी बॉक्स का एक प्रसिद्ध सूत्र यह है कि "सभी मॉडल झूठे हैं, लेकिन कुछ उपयोगी हैं।"

न्यूटन का नियम सही नहीं हो सकता है, लेकिन यह अभी भी कई समस्याओं के लिए उपयोगी है। आधुनिक बड़े डेटा संदर्भ में बॉक्स का दृष्टिकोण काफी महत्वपूर्ण है जहां अध्ययन इतने अधिक प्रबल हैं कि आप मूल रूप से किसी भी सार्थक प्रस्ताव को अस्वीकार कर सकते हैं। कड़ाई से सच बनाम गलत एक बुरा सवाल है: क्या मायने रखता है कि क्या एक मॉडल आपको डेटा को समझने में मदद करता है।

अतिरिक्त टिप्पणियां

θ0 एक बड़े मानक त्रुटि के साथ बनाम एक छोटे से मानक त्रुटि के साथ! यह सोचकर दूर न चलें कि क्योंकि प्रमाणित करना असंभव है, कठोर परीक्षा पास करना अप्रासंगिक है।

शायद ब्याज की भी, सांख्यिकीय रूप से कई अध्ययनों के परिणामों का विश्लेषण करने को मेटा-विश्लेषण कहा जाता है

आप संकीर्ण सांख्यिकीय व्याख्याओं से कितनी दूर जा सकते हैं यह एक कठिन सवाल है।


यह एक दिलचस्प पढ़ा गया है और कुछ अच्छी चीजों के बारे में सोचने के लिए दिया है! काश मैं कई उत्तर स्वीकार कर सकता।
लिएंडर मॉसिंजर

काफी स्पष्टीकरण। मेरे प्रोफेसर ने एक बार पॉपर की भावना में कुहन को संक्षेप में
लिखा था

कुहन आदि ने अपनी टिप्पणियों का दावा करते हुए कहा कि विज्ञान कैसे किया जाता है, इसका दावा करने के लिए प्रसिद्ध पॉपर की गलत व्याख्या करते हैं। इसे देशी मिथ्याकरण के रूप में जाना जाता है, और यह वह नहीं है जिसे पॉपर (बाद में) ने आगे रखा। यह एक पुआल आदमी है।
कोनराड रुडोल्फ

2
यह इस तरह का जवाब है जैसे मैं StackExchange साइटों पर जाता रहता हूं।
16

5

एक अर्थ में आप सही हैं (पी-वक्र देखें)

  1. पीααएच0
  2. एच0एच0

यथार्थवादी अनुप्रयोगों के साथ, आप अतिरिक्त मुद्दों को प्राप्त करते हैं। ये ज्यादातर उत्पन्न होते हैं, क्योंकि कोई भी व्यक्ति / प्रयोगशाला / अध्ययन समूह आमतौर पर सभी आवश्यक अध्ययन नहीं कर सकता है। परिणामस्वरूप, कई समूहों के अध्ययनों को देखने के लिए जाता है, जिस बिंदु पर आपने चिंताओं को बढ़ा दिया है (यानी यदि आपने सभी प्रासंगिक प्रयोग स्वयं किए हैं, तो कम से कम आप जानते होंगे) महत्वपूर्ण, आश्चर्यजनक / आश्चर्यजनक निष्कर्षों की चयनात्मक रिपोर्टिंग; पी-हैकिंग, कई परीक्षण / कई परीक्षण सुधार और इतने पर।


1
(+1) पावर प्वाइंट बेहद महत्वपूर्ण है! अलग-अलग सिद्धांत अवलोकन के समकक्ष डेटा का उत्पादन कर सकते हैं, और प्रयोग डिजाइन का एक महत्वपूर्ण हिस्सा डेटा का उत्पादन और / या एकत्र करना है जो आपको अंतर करने की अनुमति देगा।
मैथ्यू गन

-2

अशक्त परिकल्पना (H0): गुरुत्वाकर्षण ब्रह्मांड में सब कुछ पृथ्वी की सतह की ओर गिरने का कारण बनता है।

वैकल्पिक परिकल्पना (H1): कुछ भी कभी नहीं गिरता है।

पी<0.01


2
क्या आपको लगता है कि गैलीलियो ने एक लाख परीक्षण किए थे? भौतिक विज्ञान में यह सामान आवश्यक नहीं है। वैज्ञानिक विधि को लागू करके प्रकृति के नियमों को स्थापित करना सांख्यिकीय अनुमान में कम नहीं होता है।
अक्कल

1
-1 यह वैज्ञानिक, सांख्यिकीय और ऐतिहासिक रूप से गलत है। यूनानियों ने एक बार माना था कि यह आत्मीयता थी जो पृथ्वी पर वस्तुओं को आकर्षित करती थी। बुरा नहीं है, लेकिन 3+ शरीर प्रणाली की समस्याओं को अच्छी तरह से नहीं समझाता है। परिकल्पनाओं को पूरक होना चाहिए। अंतिम रूप से संभवतः ज्ञात बायस को H_0 बताते हुए और प्रयोगों को दिखाते हुए उसी गलत निष्कर्ष तक ले जाते हैं जो निष्कर्ष को सही नहीं बनाता है। जैसे महिलाएं पुरुषों से कम कमाती हैं b / c वे कम चालित हैं, सभी महिलाओं के वेतन का नमूना, H_0 सच है!
21

@ अदमो कि बिल्कुल मेरी बात।
यूएस

@ अदमो, पश्चिमी देशों में महिलाएँ कम कमाती हैं जब वे अपनी पसंद सहित कई कारणों से कम काम करती हैं, कुछ जगहों पर सभी प्रकार के शत्रुतापूर्ण और शत्रुतापूर्ण कार्य वातावरण। जब वे समान काम करते हैं, तो वे उसी के बारे में कमाते हैं, उदाहरण के लिए चिकित्सा नर्स वेतन देखें जहां महिलाएं महान बहुमत हैं: medscape.com/slideshow/… । प्रति घंटे काम करने पर वे सभी $ 37 कमाते हैं। पूरी तरह से ऑफ-टॉपिक, बिल्कुल।
Aksakal

2
यदि आपकी अशक्त परिकल्पना Gravity causes everything in the universe to fall toward Earth's surfaceवैकल्पिक परिकल्पना नहीं हैThere is at least one thing in the universe that does not fall toward the Earth's surface नहीं और नहीं Nothing ever falls?
उड़ानों
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.