जैसा कि @amoeba ने देखा, हमारे पास प्रायिकता और लगातार आंकड़ों की परिभाषा है । अब तक मैंने जो भी स्रोत देखे हैं, वे कहते हैं कि प्रायिकता का अनुमान प्रायिकता की निरंतरता की परिभाषा पर आधारित है, अर्थात इसे दिए गए अनुपात में सीमा के रूप में समझा जाता है, जो अनन्त संख्या यादृच्छिक ड्रॉ है (जैसा कि @fcop और @Aksakal ने Kolmogorov के उद्धरण से पहले ही देखा था )
P(A)=limn→∞nAn
तो मूल रूप से, कुछ लोगों की धारणा है कि हम बार-बार नमूना ले सकते हैं। एक ही विचार का उपयोग अक्सर अलगाववाद में किया जाता है। मैं कुछ क्लासिक पत्रों के माध्यम से गया था, उदाहरण के लिए, जैरज़ी नेमैन द्वारा , लगातार आंकड़ों की सैद्धांतिक नींव को ट्रैक करने के लिए। 1937 में नेमन ने लिखा
( ia ) सांख्यिकीविद् का संबंध एक जनसंख्या, , जो किसी कारण या अन्य के लिए पूरी तरह से अध्ययन नहीं किया जा सकता है। केवल इस जनसंख्या से एक नमूना निकालना संभव है, जिसका विस्तार से अध्ययन किया जा सकता है और इसका उपयोग जनसंख्या के के गुणों का वर्णन करने वाले कुछ स्थिरांक के मूल्यों के रूप में एक राय बनाने के लिए किया जाता है । उदाहरण के लिए, जनसंख्या , आदि बनाने वाले व्यक्तियों के पास एक निश्चित चरित्र के लगभग माध्य की गणना करना वांछित हो सकता है
( ib)π π ππππ
) वैकल्पिक रूप से, सांख्यिकीविद कुछ प्रयोगों से चिंतित हो सकते हैं, जो यदि स्पष्ट रूप से समान परिस्थितियों में दोहराए जाते हैं, तो परिणाम भिन्न होते हैं। ऐसे प्रयोगों को यादृच्छिक प्रयोग कहा जाता है [...]
वर्णित दोनों मामलों में, जिस समस्या का सांख्यिकीविद् सामना कर रहे हैं वह अनुमान की समस्या है। यह समस्या यह निर्धारित करने में शामिल है कि परिणाम प्राप्त करने के लिए अवलोकन डेटा पर क्या अंकगणितीय संचालन किए जाने चाहिए, जिन्हें एक अनुमान कहा जाता है, जो संभवतः संख्यात्मक चरित्र के सही मूल्य से बहुत अलग नहीं है, या तो जनसंख्या का
, ( ia ), या यादृच्छिक प्रयोगों के रूप में, ( ib ) के रूप में । [...]
में ( iaπ
) हम एक सांख्यिकीविद् की बात करते हैं जो अध्ययन किए गए जनसंख्या से एक नमूना तैयार करते हैं।
एक अन्य पत्र (नेमन, 1977) में, उन्होंने नोटिस किया कि डेटा में प्रदान किए गए सबूतों को अध्ययन किए गए घटना की दोहराया प्रकृति को देखकर सत्यापित करने की आवश्यकता है:
आमतौर पर, एक अनुमानित मॉडल के 'सत्यापन', या 'सत्यापन' में इसके कुछ क्रमिक परिणामों को पहले से अनुभवजन्य रूप से अध्ययन नहीं किए जाने और फिर उनके परिणाम भविष्यवाणियों के अनुरूप हैं या नहीं, यह देखने के लिए उपयुक्त प्रयोग करने में शामिल हैं। आमतौर पर, सत्यापन में पहला प्रयास नकारात्मक होता है: प्रयोग के विभिन्न परिणामों की देखी गई आवृत्तियों मॉडल से असहमत हैं। हालांकि, कुछ भाग्यशाली अवसरों पर एक उचित समझौता होता है और कोई व्यक्ति घटना को 'समझ' लेने की संतुष्टि महसूस करता है, कम से कम कुछ सामान्य तरीके से। बाद में, हमेशा, नए अनुभवजन्य निष्कर्ष दिखाई देते हैं, जो मूल मॉडल की अपर्याप्तता को दर्शाता है और इसके परित्याग या संशोधन की मांग करता है। और यह विज्ञान का इतिहास है!
और फिर भी एक अन्य पेपर नेमन और पियर्सन (1933) ने निश्चित जनसंख्या से तैयार किए गए यादृच्छिक नमूनों के बारे में लिखा
सामान्य सांख्यिकीय अभ्यास में, जब देखे गए तथ्यों को "नमूने" के रूप में वर्णित किया जाता है, और परिकल्पना "आबादी" की चिंता करती है, जिसके लिए नमूने खींचे गए हैं, नमूनों के चरित्र, या जैसा कि हम उन्हें मानदंड समाप्त करेंगे, जो कि किया गया है परिकल्पनाओं के परीक्षण के लिए उपयोग किया जाता है, अक्सर खुश अंतर्ज्ञान द्वारा तय किया जाता है।
इस संदर्भ में बारंबारतापूर्ण आंकड़े वैज्ञानिक तर्क को औपचारिक रूप देते हैं जहां साक्ष्य एकत्र किए जाते हैं, फिर प्रारंभिक निष्कर्षों को सत्यापित करने के लिए नए नमूने तैयार किए जाते हैं और जैसा कि हम और अधिक सबूत जमा करते हैं हमारे ज्ञान की स्थिति क्रिस्टलीकृत होती है। फिर से, जैसा कि नेमन (1977) द्वारा वर्णित है, प्रक्रिया निम्नलिखित कदम उठाती है
( i ) घटनाओं के स्पष्ट रूप से स्थिर लंबे समय तक चलने वाले सापेक्ष आवृत्तियों (या 'कम के लिए' आवृत्तियों ') के अनुभवजन्य स्थापना, दिलचस्प रूप से न्याय किया, क्योंकि वे प्रकृति में विकसित होते हैं।
( ii ) 'मौका तंत्र' का अनुमान लगाना और फिर उसका सत्यापन करना, जिसका दोहराया गया संचालन मनाया आवृत्तियों का उत्पादन करता है। यह problem लगातार होने वाले प्रायिकता सिद्धांत ’की समस्या है। कभी-कभी, इस चरण को 'मॉडल बिल्डिंग' लेबल किया जाता है। स्वाभाविक रूप से, अनुमानित मौका तंत्र काल्पनिक है।
( iii ) हमारे कार्यों (या 'निर्णयों') के समायोजन के नियमों का अवलोकन करने के लिए अध्ययन की गई घटना के काल्पनिक मौका तंत्र का उपयोग करना ताकि 'सफलता' के उच्चतम 'माप' को सुनिश्चित किया जा सके। [... 'हमारे कार्यों को समायोजित करने के नियम' गणित की समस्या है, विशेष रूप से गणितीय आँकड़ों की।
फ़्रीक्वेंसर्स डेटा की यादृच्छिक प्रकृति और निश्चित आबादी से बार-बार आकर्षित होने के विचार को ध्यान में रखते हुए अपने शोध की योजना बनाते हैं , वे इसके आधार पर अपने तरीकों को डिज़ाइन करते हैं , और इसका उपयोग अपने परिणामों (नेयमैन और पियर्सन, 1933) को सत्यापित करने के लिए करते हैं,
यह जानने की उम्मीद किए बिना कि क्या प्रत्येक अलग परिकल्पना सही है या गलत है, हम अपने व्यवहार को उनके साथ नियंत्रित करने के लिए नियमों की खोज कर सकते हैं, जिसके बाद हम यह सुनिश्चित करते हैं कि, लंबे समय के अनुभव में, हम अक्सर गलत नहीं होंगे।
यह दोहराया नमूना सिद्धांत (कॉक्स और हिंकले, 1974) से जुड़ा है:
(ii) मजबूत दोहराए गए नमूनाकरण सिद्धांत मजबूत दोहराए गए नमूनाकरण सिद्धांत के
अनुसार, सांख्यिकीय प्रक्रियाओं को समान स्थितियों के तहत काल्पनिक दोहराव में उनके व्यवहार द्वारा मूल्यांकन किया जाना है। इसके दो पहलू हैं। अनिश्चितता के उपायों को लंबे समय तक दोहराव में काल्पनिक आवृत्तियों के रूप में व्याख्या की जानी है; काल्पनिक दोहराव में संवेदनशील व्यवहार के संदर्भ में इष्टतमता के मानदंड तैयार किए जाने हैं।
इसके लिए तर्क यह है कि यह उन मात्राओं के लिए एक भौतिक अर्थ सुनिश्चित करता है जिन्हें हम गणना करते हैं और यह हमारे द्वारा किए गए विश्लेषण और अंतर्निहित मॉडल के बीच एक करीबी संबंध सुनिश्चित करता है जिसे मामलों की "सही" स्थिति का प्रतिनिधित्व करने के रूप में माना जाता है।
(iii) दोहराए गए नमूनाकरण सिद्धांत को दोहराए गए नमूनाकरण सिद्धांत
के कमजोर संस्करण के लिए आवश्यक है कि हम उन प्रक्रियाओं का पालन न करें, जो कुछ संभावित पैरामीटर मानों के लिए, काल्पनिक दोहराव में, अधिकतर समय भ्रामक निष्कर्ष देते हैं।
इसके विपरीत, जब अधिकतम संभावना का उपयोग करते हुए हम उस नमूने से चिंतित होते हैं जो हमारे पास होता है , और बेयसियन मामले में हम नमूने और हमारे पुजारियों के आधार पर अनुमान लगाते हैं और नए डेटा के रूप में प्रकट होता है कि हम बेसेसियन अपडेट कर सकते हैं। दोनों मामलों में बार-बार नमूना लेने का विचार महत्वपूर्ण नहीं है। फ़्रीक्वोलॉजर्स केवल उन आंकड़ों पर भरोसा करते हैं जो उनके पास हैं (जैसा कि @WBT द्वारा देखा गया है ), लेकिन यह ध्यान में रखते हुए कि यह कुछ यादृच्छिक है और इसे आबादी से दोहराया नमूनाकरण की प्रक्रिया के एक भाग के रूप में सोचा जाना चाहिए (उदाहरण के लिए, उदाहरण के लिए, आत्मविश्वास अंतराल को परिभाषित किया गया है)।
लगातार मामले में दोहराया नमूना का विचार हमें अनिश्चितता (आंकड़ों में) की मात्रा निर्धारित करने में सक्षम बनाता है और हमें संभाव्यता के संदर्भ में वास्तविक जीवन की घटनाओं की व्याख्या करने में सक्षम बनाता है ।
एक साइड नोट के रूप में, ध्यान दें कि न तो नेमन (लेहमैन, 1988), न ही पियर्सन (मेयो, 1992) उतने ही शुद्ध आव्रजक थे जितना हम कल्पना कर सकते थे कि वे थे। उदाहरण के लिए, नेमन (1977) ने पॉइंट अनुमान के लिए एम्पिरिकल बेसेसियन और अधिकतम संभावना का उपयोग करने का प्रस्ताव रखा। दूसरी ओर (मेयो, 1992),
पियर्सन (1955) में फिशर (और अपने काम में कहीं और) की प्रतिक्रिया यह है कि वैज्ञानिक संदर्भों के लिए पियर्सन ने कम लंबे समय तक चलने वाली त्रुटि संभावना तर्क दोनों को खारिज कर दिया [...]
इसलिए ऐसा लगता है कि संस्थापक पिताओं के बीच भी शुद्ध आवृत्तियों का पता लगाना कठिन है ।
नेमन, जे, और पियर्सन, ईएस (1933)। सांख्यिकीय परिकल्पना के सबसे कुशल परीक्षणों की समस्या पर। रॉयल सोसाइटी A: गणितीय, शारीरिक और इंजीनियरिंग विज्ञान के दार्शनिक लेनदेन। 231 (694–706): 289-337।
नेमन, जे। (1937)। संभाव्यता के शास्त्रीय सिद्धांत के आधार पर सांख्यिकीय अनुमान के एक सिद्धांत की रूपरेखा। फिल। ट्रांस। आर। Lond। A. 236: 333–380।
नेमन, जे (1977)। बार-बार होने वाली संभावना और लगातार आंकड़े। सिंथेस, 36 (1), 97-131।
मेयो, डीजी (1992)। क्या पियर्सन ने नेमन-पियर्सन के आँकड़ों के दर्शन को खारिज कर दिया? सिंथेस, 90 (2), 233-262।
कॉक्स, डीआर और हिंकले, डीवी (1974)। सैद्धांतिक सांख्यिकी। चैपमैन और हॉल।
लेहमैन, ई। (1988)। जेरज़ी नेमन, 1894 - 1981. तकनीकी रिपोर्ट संख्या 155. सांख्यिकी विभाग, कैलिफ़ोर्निया विश्वविद्यालय।