मेरे पास तीन सहायक लिंक / तर्क हैं जो दिनांक ~ 1600-1650 को औपचारिक रूप से विकसित आँकड़ों के लिए और बहुत पहले संभावनाओं के उपयोग के लिए समर्थन करते हैं ।
यदि आप परिकल्पना परीक्षण को आधार मानते हैं , तो संभाव्यता की भविष्यवाणी करते हुए, तब ऑनलाइन व्युत्पत्ति शब्दकोश यह प्रदान करता है:
" परिकल्पना (n।)
1590, "एक विशेष कथन;" 1650 के दशक में, "एक प्रस्ताव, मान लिया गया और लिया गया, जिसका उपयोग एक आधार के रूप में किया गया," मध्य फ्रांसीसी परिकल्पना से और सीधे लेट लैटिन परिकल्पना से, ग्रीक परिकल्पना से "आधार, ग्राउंडवर्क, फाउंडेशन," इसलिए एक तर्क के आधार पर विस्तारित उपयोग के आधार पर। दमन, "वस्तुतः" एक के तहत ", हाइपो-" के तहत "(हाइपो- देखें) + थीसिस" एक रखने, प्रस्ताव "(पीआईई रूट के reduplicated रूप से * dhe-" सेट करने के लिए, डाल ")। तर्क में एक शब्द; संकरा वैज्ञानिक अर्थ 1640 से है। "
विक्षनरी प्रस्ताव:
"1596 के बाद से रिकॉर्ड किया गया, मध्य फ्रांसीसी परिकल्पना से, लेट लैटिन परिकल्पना से, प्राचीन ग्रीक óιó (hupóthesis," आधार, एक तर्क, दमन का आधार "से), का शाब्दिक अर्थ है" एक के तहत ", खुद ὑποτίθημι (hupotíthēmi) से," मैंने निर्धारित किया " पहले, सुझाव "), ὑπό (hupó," नीचे ") से + (μι (títhēmi," मैं डाल, जगह ")।
संज्ञा परिकल्पना (बहुवचन परिकल्पना)
(विज्ञान) शिथिल रूप से प्रयुक्त, एक अवलोकन, घटना या वैज्ञानिक समस्या की व्याख्या करने वाला एक अस्थायी अनुमान जिसे आगे अवलोकन, जांच और / या प्रयोग द्वारा परीक्षण किया जा सकता है। कला के एक वैज्ञानिक शब्द के रूप में, संलग्न उद्धरण देखें। सिद्धांत की तुलना करें, और वहां दिए गए उद्धरण। उद्धरण ▲
2005, रोनाल्ड एच। पाइन, http://www.csicop.org/specialarticles/show/intelligent_design_or_no_model_creationism , 15 अक्टूबर 2005:
हममें से बहुत से लोगों को स्कूल में पढ़ाया जाता है कि एक वैज्ञानिक, कुछ जानने की कोशिश में, सबसे पहले एक "परिकल्पना" (एक अनुमान या अचूकता - जरूरी नहीं कि एक "शिक्षित" अनुमान) के साथ आएगा। ... [लेकिन टी] वह शब्द "परिकल्पना" का उपयोग विज्ञान में, विशेष रूप से एक तर्कपूर्ण, समझदार, ज्ञानवर्धक स्पष्टीकरण के लिए करना चाहिए कि कुछ घटना क्यों होती है या होती है। एक परिकल्पना अभी तक अप्रमाणित हो सकती है; पहले से ही परीक्षण किया जा सकता है; हो सकता है कि मिथ्या हो गया हो; अभी तक गलत नहीं हुआ है, हालांकि परीक्षण किया जा सकता है; या मिथ्या तरीके से अनगिनत बार बिना सोचे-समझे परीक्षण किया जा सकता है; और यह वैज्ञानिक समुदाय द्वारा सार्वभौमिक रूप से स्वीकार किया जा सकता है। शब्द "परिकल्पना" की समझ, जैसा कि विज्ञान में प्रयोग किया जाता है, के लिए आवश्यक है कि सिद्धांतों के एक सिद्धांत की आवश्यकता हो। ' रेजर और कार्ल पॉपर ने "मिथ्या-व्यवहार" के संबंध में सोचा - इस धारणा सहित कि किसी भी सम्मानजनक वैज्ञानिक परिकल्पना को सिद्धांत रूप में, "गलत" साबित होने में सक्षम होना चाहिए (यदि ऐसा होना चाहिए, तो वास्तव में गलत होना चाहिए)। कोई भी कभी भी सच साबित नहीं हो सकता है। शब्द "परिकल्पना" की एक उचित समझ का एक पहलू, जैसा कि विज्ञान में उपयोग किया जाता है, यह है कि केवल लुप्तप्राय छोटे प्रतिशत की परिकल्पना कभी भी एक सिद्धांत बन सकती है। ""
पर संभाव्यता और आँकड़ों विकिपीडिया प्रदान करता है:
" डेटा संग्रह
सैम्पलिंग
जब पूर्ण जनगणना डेटा एकत्र नहीं किया जा सकता है, तो सांख्यिकीविद् विशिष्ट प्रयोग डिजाइन और सर्वेक्षण नमूने विकसित करके नमूना डेटा एकत्र करते हैं। सांख्यिकी स्वयं भी सांख्यिकीय मॉडल के माध्यम से भविष्यवाणी और पूर्वानुमान के लिए उपकरण प्रदान करती है। सैंपल के आधार पर इनफॉरमेशन बनाने का विचार लगभग १६०० के मध्य में आबादी के आकलन और जीवन बीमा के अग्रदूतों के विकास के संबंध में शुरू हुआ। । (संदर्भ: वोल्फ्राम, स्टीफन (2002)। ए न्यू काइंड ऑफ साइंस। वोल्फ्राम मीडिया, इंक। पी। 1082। आईएसबीएन 1-57955-008-8)।
एक नमूना का उपयोग पूरी आबादी के लिए एक गाइड के रूप में करने के लिए, यह महत्वपूर्ण है कि यह वास्तव में समग्र आबादी का प्रतिनिधित्व करता है। प्रतिनिधि का नमूना इस बात का आश्वासन देता है कि नमूने और निष्कर्ष सुरक्षित रूप से समग्र से आबादी तक बढ़ सकते हैं। एक बड़ी समस्या यह निर्धारित करने में निहित है कि चुना गया नमूना वास्तव में किस हद तक प्रतिनिधि है। सांख्यिकी नमूना और डेटा संग्रह प्रक्रियाओं के भीतर किसी भी पूर्वाग्रह के लिए अनुमान लगाने और सही करने के तरीके प्रदान करती है। प्रयोगों के लिए प्रायोगिक डिजाइन के तरीके भी हैं जो एक अध्ययन की शुरुआत में इन मुद्दों को कम कर सकते हैं, आबादी के बारे में सत्य को समझने की इसकी क्षमता को मजबूत करते हैं।
नमूनाकरण सिद्धांत संभाव्यता सिद्धांत के गणितीय अनुशासन का हिस्सा है। संभावना का उपयोग गणितीय आँकड़ों में नमूना आँकड़ों के नमूना वितरण के अध्ययन के लिए किया जाता है और, अधिक सामान्यतः, सांख्यिकीय प्रक्रियाओं के गुण। किसी भी सांख्यिकीय पद्धति का उपयोग तब मान्य होता है जब प्रणाली या जनसंख्या विचाराधीन हो, विधि की मान्यताओं को संतुष्ट करती है। क्लासिक प्रायिकता सिद्धांत और नमूना सिद्धांत के बीच के दृष्टिकोण में अंतर, मोटे तौर पर, वह संभावना सिद्धांत है, जो नमूनों से संबंधित संभावनाओं को घटाने के लिए कुल आबादी के दिए गए मापदंडों से शुरू होता है। सांख्यिकीय अनुमान, हालांकि, विपरीत दिशा में आगे बढ़ता है - नमूनों से बड़े या कुल आबादी के मापदंडों के लिए आनुपातिक रूप से संदर्भित ।
"वुल्फराम, स्टीफन (2002)। ए न्यू काइंड ऑफ साइंस। वोल्फ्राम मीडिया, इंक। पी। 1082।":
" सांख्यिकीय विश्लेषण
• इतिहास। मौका के खेल के लिए बाधाओं की कुछ गणना पहले से ही पुरातनता में बनाई गई थी। 1200 के आसपास शुरुआत तेजी से विस्तृत संभावनाओं के आधार पर संयोजन के आधार पर होती है दहनशील रहस्यवादियों द्वारा प्राप्त की गई थी व्यवस्थित रूप से सही तरीके से 1600 के दशक के मध्य में विकसित किए गए थे और 1700 के दशक की शुरुआत में। 1600 के दशक के मध्य में आबादी का अनुमान लगाने और जीवन बीमा के अग्रदूतों के विकास के संबंध में सैंपल किए गए डेटा से निष्कर्ष निकालने का विचार उत्पन्न हुआ। अवलोकन के यादृच्छिक त्रुटियों के लिए सही मानने के लिए औसत की विधि का उपयोग किया जाना शुरू हुआ, मुख्य रूप से खगोल विज्ञान में, 1700 के दशक के मध्य में, जबकि कम से कम वर्ग फिटिंग और संभावना वितरण की धारणा 1800 के आसपास स्थापित हुई। प्रोबाइस्टिक मॉडल आधारित 1800 के दशक के मध्य में जीव विज्ञान में व्यक्तियों के बीच यादृच्छिक बदलावों का इस्तेमाल किया जाने लगा, और सांख्यिकीय विश्लेषण के लिए अब इस्तेमाल किए जाने वाले कई शास्त्रीय तरीकों को 1800 के दशक के अंत और 1900 की शुरुआत में कृषि अनुसंधान के संदर्भ में विकसित किया गया था। भौतिकी में मौलिक रूप से संभाव्य मॉडल 1800 के दशक के उत्तरार्ध में सांख्यिकीय यांत्रिकी और 1900 की शुरुआत में क्वांटम यांत्रिकी की शुरुआत के लिए केंद्रीय थे।
अन्य स्रोत:
"यह रिपोर्ट, मुख्य रूप से गैर-गणितीय शब्दों में, पी मान को परिभाषित करती है, परिकल्पना परीक्षण के लिए पी मूल्य दृष्टिकोण के ऐतिहासिक मूल को संक्षेप में प्रस्तुत करता है, नैदानिक अनुसंधान के संदर्भ में p≤0.05 के विभिन्न अनुप्रयोगों का वर्णन करता है, और p≤ के उद्भव पर चर्चा करता है। 5 × 10 gen8 और जीनोमिक सांख्यिकीय विश्लेषण के लिए थ्रेसहोल्ड के रूप में अन्य मूल्य। "
खंड "ऐतिहासिक मूल" कहता है:
"एक वैज्ञानिक परिकल्पना के लिए डेटा की तुलना करने के लिए प्रायिकता की अवधारणाओं के उपयोग पर प्रकाशित काम सदियों के लिए वापस खोजा जा सकता है। 1700 के दशक की शुरुआत में, चिकित्सक जॉन अर्बुथनॉट ने 1629-1717 के वर्षों के दौरान लंदन में क्रिस्टन पर डेटा का विश्लेषण किया और देखा कि। जितने भी अध्ययन हुए, उनमें से प्रत्येक में नर जन्मों की संख्या महिला जन्मों से अधिक थी[ १ ] अगर कोई नर और मादा के जन्म का एक मौका मानता है, तो लगातार 82 वर्षों में पुरुषों की अधिकता देखने की संभावना 0.582 = 2 × 10−25 है, या एक सेप्टिलियन में एक से कम (यानी, एक) ट्रिलियन-ट्रिलियन में) मौका।
[1]। Arbuthnott J. दैवीय प्रोविडेंस के लिए एक तर्क, दोनों लिंगों के जन्म में निरंतर नियमितता पालन से लिया गया है। फिल ट्रांस 1710; 27: 186–90। doi: 10.1098 / rstl.1710.0011 1 जनवरी 1710 को प्रकाशित
"P-values have long linked medicine and statistics. John Arbuthnot and Daniel Bernoulli were both physicians, in addition to being mathematicians, and their analyses of sex ratios at birth (Arbuthnot) and inclination of the planets’ orbits (Bernoulli) provide the two most famous early examples of significance tests 1–4. If their ubiquity in medical journals is the standard by which they are judged, P-values are also extremely popular with the medical profession. On the other hand, they are subject to regular criticism from statisticians 5–7 and only reluctantly defended 8. For example, a dozen years ago, the prominent biostatisticians, the late Martin Gardner and Doug Altman 9, together with other colleagues, mounted a successful campaign to persuade the British Medical Journal to place less emphasis on P-values and more on confidence intervals. The journal Epidemiology has banned them altogether. Recently, attacks have even appeared in the popular press 10,11. P-values thus seem to be an appropriate subject for the Journal of Epidemiology and Biostatistics. This essay represents a personal view of what, if anything, may be said to defend them.
I shall offer a limited defence of P-values only. ...".
References
1 Hald A. A history of probability and statistics and their appli- cations before 1750. New York: Wiley, 1990.
2 Shoesmith E, Arbuthnot, J. In: Johnson, NL, Kotz, S, editors. Leading personalities in statistical sciences. New York: Wiley, 1997:7–10.
3 Bernoulli, D. Sur le probleme propose pour la seconde fois par l’Acadamie Royale des Sciences de Paris. In: Speiser D,
editor. Die Werke von Daniel Bernoulli, Band 3, Basle:
Birkhauser Verlag, 1987:303–26.
4 Arbuthnot J. An argument for divine providence taken from
the constant regularity observ’d in the births of both sexes. Phil Trans R Soc 1710;27:186–90.
5 Freeman P. The role of P-values in analysing trial results. Statist Med 1993;12:1443 –52.
6 Anscombe FJ. The summarizing of clinical experiments by
significance levels. Statist Med 1990;9:703 –8.
7 Royall R. The effect of sample size on the meaning of signifi- cance tests. Am Stat 1986;40:313 –5.
8 Senn SJ. Discussion of Freeman’s paper. Statist Med
1993;12:1453 –8.
9 Gardner M, Altman D. Statistics with confidence. Br Med J
1989.
10 Matthews R. The great health hoax. Sunday Telegraph 13
September, 1998.
11 Matthews R. Flukes and flaws. Prospect 20–24, November 1998.
@Martijn Weterings: "Was Pearson in 1900 the revival or did this (frequentist) concept appear earlier? How did Jacob Bernoulli think about his 'golden theorem' in a frequentist sense or in a Bayesian sense (what does the Ars Conjectandi tell and are there more sources)?
The American Statistical Association has a webpage on the History of Statistics which, along with this information, has a poster (reproduced in part below) titled "Timeline of statistics".
AD 2: Evidence of a census completed during the Han Dynasty survives.
1500s: Girolamo Cardano calculates probabilities of different dice rolls.
1600s: Edmund Halley relates death rate to age and develops mortality tables.
1700s: Thomas Jefferson directs the first U.S. Census.
1839: अमेरिकन स्टैटिस्टिकल एसोसिएशन का गठन हुआ।
1894: शब्द "मानक विचलन" कार्ल पियर्सन द्वारा पेश किया गया।
1935: आरए फिशर ने डिजाइन ऑफ एक्सपेरिमेंट्स प्रकाशित किए।
विकिपीडिया के वेबपेज " बड़ी संख्याओं के कानून " के "इतिहास" खंड में यह बताया गया है:
"इतालवी गणितज्ञ गेरोलो कार्डानो गेरोलो (1501-1576)सबूत के बिना कहा गया है कि अनुभवजन्य आंकड़ों की सटीकता ट्रायल की संख्या के साथ सुधार करती है। तब इसे बड़ी संख्या के कानून के रूप में औपचारिक रूप दिया गया था। LLN का एक विशेष रूप (एक द्विआधारी यादृच्छिक चर के लिए) पहली बार याकूब बर्नौली द्वारा सिद्ध किया गया था। एक पर्याप्त रूप से कठोर गणितीय प्रमाण विकसित करने में उन्हें 20 साल से अधिक का समय लगा, जो 1713 में उनके एर्स कॉन्जेक्टिंडी (द आर्ट ऑफ कॉन्ज्यूरिंग) में प्रकाशित हुआ था। उन्होंने इसे "गोल्डन थ्योरम" का नाम दिया, लेकिन इसे आम तौर पर "बर्नौली के प्रमेय" के रूप में जाना जाता है। यह बर्नौली के सिद्धांत से भ्रमित नहीं होना चाहिए, जिसका नाम जैकब बर्नौली के भतीजे डैनियल बर्नौली के नाम पर रखा गया है। 1837 में, एसडी पॉइसन ने इसे "ला लोइ डेस ग्रॉन्ड नॉमर्ब्स" ("बड़ी संख्या का कानून") नाम के तहत वर्णित किया। इसके बाद, यह दोनों नामों के तहत जाना जाता था, लेकिन "
बर्नौली और पॉइसन ने अपने प्रयासों को प्रकाशित करने के बाद, अन्य गणितज्ञों ने भी कानून को परिष्कृत करने में योगदान दिया, जिसमें चेबीशेव, मार्कोव, बोरेल, केंटेली और कोलमोगोरोव और खिनचिन शामिल थे। "
प्रश्न: "पी-मूल्यों की कल्पना करने वाला पीयरसन पहला व्यक्ति था?"
नहीं, शायद नहीं।
Wasserstein और Lazar द्वारा " पी-वैल्यूज़: कॉन्सेप्ट, प्रोसेस, एंड पर्पस " (09 जून 2016) पर " एएसए का बयान " में: 10.1080 / 00031305.2016.1154108 पी-वैल्यू की परिभाषा पर एक आधिकारिक बयान है (जो नहीं है संदेह जो सभी विषयों का उपयोग, या अस्वीकार करने, पी-मूल्यों) पर सहमत नहीं है जो पढ़ता है:
" पी-वैल्यू क्या है?
अनौपचारिक रूप से, एक पी-मूल्य एक निर्दिष्ट सांख्यिकीय मॉडल के तहत संभावना है कि डेटा का एक सांख्यिकीय सारांश (उदाहरण के लिए, दो तुलना किए गए समूहों के बीच नमूना मतलब अंतर) इसके मनाया मूल्य से अधिक या अधिक चरम के बराबर होगा।
3. सिद्धांत
...
6. अपने आप से, एक पी-मूल्य एक मॉडल या परिकल्पना के बारे में सबूत का एक अच्छा उपाय प्रदान नहीं करता है।
शोधकर्ताओं को यह पहचानना चाहिए कि संदर्भ या अन्य सबूत के बिना एक पी-मूल्य सीमित जानकारी प्रदान करता है। उदाहरण के लिए, अपने द्वारा लिया गया 0.05 के पास एक पी-वैल्यू, नल की परिकल्पना के खिलाफ केवल कमजोर साक्ष्य प्रस्तुत करता है। इसी तरह, एक अपेक्षाकृत बड़े पी-मूल्य शून्य परिकल्पना के पक्ष में सबूत नहीं देते हैं; कई अन्य परिकल्पना देखी गई डेटा के साथ समान या अधिक सुसंगत हो सकती हैं। इन कारणों से, डेटा विश्लेषण एक पी-मूल्य की गणना के साथ समाप्त नहीं होना चाहिए जब अन्य दृष्टिकोण उपयुक्त और संभव हो। "।
नल की परिकल्पना की अस्वीकृति की संभावना पियर्सन से बहुत पहले हुई थी।
नल परिकल्पना परीक्षण राज्यों के शुरुआती उदाहरणों पर विकिपीडिया का पृष्ठ :
अशक्त परिकल्पना के प्रारंभिक विकल्प
पॉल मेहल ने तर्क दिया है कि अशक्त परिकल्पना की पसंद का महामारी विज्ञान महत्व काफी हद तक अनजाने में चला गया है। जब सिद्धांत द्वारा अशक्त परिकल्पना की भविष्यवाणी की जाती है, तो एक अधिक सटीक प्रयोग अंतर्निहित सिद्धांत का अधिक गंभीर परीक्षण होगा। जब शून्य परिकल्पना "कोई अंतर नहीं" या "कोई प्रभाव नहीं" के लिए चूक जाती है, तो एक अधिक सटीक प्रयोग सिद्धांत का एक कम गंभीर परीक्षण है जिसने प्रयोग करने के लिए प्रेरित किया। इसलिए बाद के अभ्यास की उत्पत्ति की एक परीक्षा उपयोगी हो सकती है:
1778: पियरे लाप्लास ने कई यूरोपीय शहरों में लड़कों और लड़कियों के जन्मों की तुलना की। वह कहता है: "यह निष्कर्ष निकालना स्वाभाविक है कि ये संभावनाएं लगभग उसी अनुपात में हैं"। इस प्रकार लाप्लास की अशक्त परिकल्पना है कि लड़कों और लड़कियों के जन्म को समान रूप से "पारंपरिक ज्ञान" दिया जाना चाहिए।
1900: कार्ल पियर्सन ने यह निर्धारित करने के लिए ची स्क्वार्ड परीक्षण विकसित किया कि "क्या आवृत्ति वक्र का दिया गया रूप प्रभावी रूप से किसी दिए गए जनसंख्या से लिए गए नमूनों का वर्णन करेगा।" इस प्रकार अशक्त परिकल्पना यह है कि जनसंख्या का वर्णन सिद्धांत द्वारा अनुमानित कुछ वितरण द्वारा किया जाता है। वह उदाहरण के रूप में वेल्डन पासा फेंक डेटा में पांच और छक्के की संख्या का उपयोग करता है।
1904: कार्ल पियर्सन ने "आकस्मिकता" की अवधारणा विकसित की ताकि यह निर्धारित किया जा सके कि परिणाम किसी दिए गए श्रेणीबद्ध कारक से स्वतंत्र हैं या नहीं। यहाँ अशक्त परिकल्पना डिफ़ॉल्ट रूप से है कि दो चीजें असंबंधित हैं (जैसे निशान बनना और चेचक से मृत्यु दर)। इस मामले में अशक्त परिकल्पना को अब सिद्धांत या पारंपरिक ज्ञान द्वारा भविष्यवाणी नहीं की गई है, बल्कि इसके बजाय उदासीनता का सिद्धांत है जो फिशर और अन्य को "उलटा संभावनाओं" के उपयोग को खारिज करने का नेतृत्व करता है।
Despite any one person being credited for rejecting a null hypothesis I don't think it's reasonable to label them the "discover of skepticism based on weak mathematical standing".