जवाबों:
पर्सि डियाकोनिस से मैंने जो संक्षिप्त उत्तर सुना है वह निम्नलिखित है: संभाव्यता और आँकड़ों द्वारा मानी जाने वाली समस्याएं एक-दूसरे के विपरीत हैं। संभाव्यता सिद्धांत में हम कुछ अंतर्निहित प्रक्रिया पर विचार करते हैं, जिसमें कुछ यादृच्छिकता या अनिश्चितता यादृच्छिक चर द्वारा मॉडलिंग की जाती है, और हम यह पता लगाते हैं कि क्या होता है। आंकड़ों में हम ऐसा कुछ देखते हैं जो हुआ है, और यह पता लगाने की कोशिश करें कि अंतर्निहित प्रक्रिया उन टिप्पणियों को क्या समझाएगी।
मुझे लाल और हरी जेली बीन्स के जार का उदाहरण पसंद है।
एक संभावनावादी प्रत्येक के अनुपात को जानने के बाद शुरू होता है और एक लाल जेली बीन ड्राइंग की संभावना पूछता है। एक सांख्यिकीविद जार से नमूना लेकर लाल जेली बीन्स के अनुपात को संक्रमित करता है।
यह केवल यह कहना भ्रामक है कि आँकड़े केवल संभाव्यता का विलोम हैं। हां, सांख्यिकीय प्रश्न उलटे संभावना के प्रश्न हैं , लेकिन वे उल्टे-सीधे उल्टे समस्याएँ हैं , और यह इस बात से बड़ा फर्क पड़ता है कि उन्हें कैसे संबोधित किया जाता है।
प्रायिकता शुद्ध गणित की एक शाखा है - संभावना प्रश्नों को एक्सिओमेटिक रीजनिंग का उपयोग करके हल किया जा सकता है और इसलिए किसी भी प्रायिकता प्रश्न का एक सही उत्तर है।
सांख्यिकीय प्रश्नों को प्रायिकता मॉडल के उपयोग द्वारा प्रायिकता प्रश्नों में बदला जा सकता है । एक बार जब हम डेटा बनाने वाले तंत्र के बारे में कुछ धारणा बनाते हैं, तो हम संभाव्यता सिद्धांत का उपयोग करके सांख्यिकीय प्रश्नों का उत्तर दे सकते हैं। फिर भी, इन मॉडलों का उपयोग कर समस्या के बाद के विश्लेषण की तुलना में इन प्रायिकता मॉडल का उचित निर्माण और जाँच महत्वपूर्ण या अधिक महत्वपूर्ण है।
एक कह सकता है कि आँकड़े दो भागों के होते हैं। पहला भाग समस्या के लिए संभाव्य मॉडल तैयार करने और मूल्यांकन करने का प्रश्न है; यह प्रयास "विज्ञान के दर्शन" के क्षेत्र में निहित है। दूसरा भाग एक निश्चित मॉडल के बाद उत्तर प्राप्त करने का प्रश्न है। आँकड़ों का यह हिस्सा वास्तव में लागू संभावना सिद्धांत का मामला है, और व्यवहार में, संख्यात्मक विश्लेषण के साथ-साथ काफी हद तक शामिल है।
मुझे स्टीव स्कोएना के परिकलित दांव से यह पसंद है (पूरी चर्चा के लिए लिंक देखें):
सारांश में, प्रायिकता सिद्धांत हमें किसी दिए गए आदर्श दुनिया के परिणामों को खोजने में सक्षम बनाता है, जबकि सांख्यिकीय सिद्धांत हमें यह मापने में सक्षम करता है कि हमारी दुनिया किस हद तक आदर्श है।
संभाव्यता एक शुद्ध विज्ञान (गणित) है, आंकड़े आंकड़ों के बारे में हैं। चूंकि वे आँकड़ों के लिए किसी तरह की मौलिकता प्रदान करते हैं, इसलिए बुनियादी विचार प्रदान करते हुए वे जुड़े हुए हैं।
Intuitive Biostatistics की तालिका 3.1 नीचे दिखाए गए आरेख के साथ इस प्रश्न का उत्तर देती है। ध्यान दें कि सभी तीर संभावना के दाईं ओर इंगित करते हैं, और आंकड़ों के लिए बाईं ओर इंगित करते हैं।
संभावना
सामान्य ---> विशिष्ट
जनसंख्या ---> नमूना
मॉडल ---> डेटा
सांख्यिकी
सामान्य <--- विशिष्ट
जनसंख्या <--- नमूना
मॉडल <--- डेटा
किस बारे में संभावना सवालों के जवाब होगा हो, सांख्यिकी के बारे में सवालों के जवाब था होता है।
संभावना अनिश्चितता की मात्रा निर्धारित करने के बारे में है, जबकि आंकड़े ब्याज के कुछ माप में भिन्नता बता रहे हैं (जैसे, आय का स्तर अलग-अलग क्यों है?) जो हम वास्तविक दुनिया में देखते हैं।
हम कुछ अवलोकनीय कारकों (जैसे, लिंग, शिक्षा स्तर, आय उदाहरण के लिए आयु आदि) का उपयोग करके भिन्नता की व्याख्या करते हैं। हालाँकि, चूंकि हम संभवतः सभी संभावित कारकों को ध्यान में नहीं रख सकते हैं जो आय को प्रभावित करते हैं, हम यादृच्छिक त्रुटियों के लिए किसी भी अस्पष्टीकृत भिन्नता को छोड़ देते हैं (जो कि अनिश्चितता को बढ़ाता है)।
चूंकि, हम "भिन्नता = प्रेक्षण योग्य कारकों का प्रभाव + रैंडम त्रुटियों का प्रभाव" को दर्शाते हैं, इसलिए हमें उन भिन्नताओं पर यादृच्छिक त्रुटियों के प्रभाव को ध्यान में रखते हुए उपलब्ध कराए जाने वाले औजारों की आवश्यकता होती है।
कुछ उदाहरण निम्नलिखित हैं:
अनिश्चितता का परिमाण
उदाहरण 1: आप 6-पक्षीय मर जाते हैं। 1 प्राप्त करने की संभावना क्या है?
उदाहरण 2: क्या संभावना है कि संयुक्त राज्य अमेरिका से यादृच्छिक पर चयनित एक वयस्क व्यक्ति की वार्षिक आय $ 40,000 से कम है?
विभिन्नता की व्याख्या करना
उदाहरण 1: हम मानते हैं कि किसी व्यक्ति की वार्षिक आय बदलती रहती है। किसी व्यक्ति की आय में भिन्नता को कौन से कारक स्पष्ट करते हैं?
स्पष्ट रूप से, हम सभी कारकों का हिसाब नहीं दे सकते। इस प्रकार, हम कुछ अवलोकनीय कारकों (जैसे, शिक्षा स्तर, लिंग, आयु आदि) के लिए एक व्यक्ति की आय को विशेषता देते हैं और अनिश्चितता (या आंकड़ों की भाषा में: यादृच्छिक त्रुटियों) के लिए किसी भी शेष भिन्नता को छोड़ देते हैं।
उदाहरण 2: हम देखते हैं कि कुछ उपभोक्ता एक डिटर्जेंट खरीदने के लिए ज्यादातर समय टाइड चुनते हैं जबकि कुछ अन्य उपभोक्ता डिटर्जेंट ब्रांड xzz चुनते हैं। पसंद में भिन्नता क्या बताती है? हम कुछ अवलोकन योग्य कारकों जैसे कि मूल्य, ब्रांड नाम आदि के विकल्पों में भिन्नता को दर्शाते हैं और यादृच्छिक त्रुटियों (या अनिश्चितता) के लिए किसी भी अस्पष्टीकृत भिन्नता को छोड़ देते हैं।
किसी घटना की संभावना इसकी दीर्घकालिक सापेक्ष आवृत्ति है। इसलिए, यह मूल रूप से आपको मौका दे रहा है, उदाहरण के लिए, एक सिक्के के अगले फ्लिप पर 'सिर' प्राप्त करना, या एक मरने के अगले रोल पर '3' प्राप्त करना।
एक आँकड़ा जनसंख्या के नमूने से गणना की गई कोई संख्यात्मक माप है। उदाहरण के लिए, नमूना मतलब है। हम इसका उपयोग एक आंकड़े के रूप में करते हैं जो आबादी के मतलब का अनुमान लगाता है, जो एक पैरामीटर है। तो मूल रूप से यह आपको किसी नमूने का सारांश दे रहा है ।
संभाव्यता अध्ययन, अच्छी तरह से, कैसे संभावित घटनाएँ हैं। आप सहजता से जानते हैं कि संभावना क्या है।
सांख्यिकी डेटा का अध्ययन है: इसे दिखाना (चार्ट जैसे उपकरण का उपयोग करके), इसे संक्षेप में प्रस्तुत करना (साधन और मानक विचलन आदि का उपयोग करना), उस दुनिया के बारे में निष्कर्ष तक पहुंचना जहां से डेटा खींचा गया था (डेटा के लिए फिटिंग लाइनें), और - यह महत्वपूर्ण है - हम अपने निष्कर्ष के बारे में कितना सुनिश्चित हो सकते हैं।
यह सुनिश्चित करने के लिए कि हम अपने निष्कर्ष के बारे में सुनिश्चित हो सकते हैं कि हमें संभाव्यता का उपयोग करने की आवश्यकता है। मान लीजिए कि आपके पास पिछले वर्ष के आंकड़ों के बारे में है कि आप किस क्षेत्र में रहते हैं और मैं कहां रहता हूं। पिछले साल इसने प्रति सप्ताह औसतन 1/4 इंच बारिश की जहाँ आप रहते हैं, और 3/8 इंच जहाँ मैं रहता हूँ। तो हम कह सकते हैं कि मेरे क्षेत्र में वर्षा औसतन 50% अधिक है जहाँ आप रहते हैं, ठीक है? इतनी जल्दी नहीं, स्पार्की। यह एक संयोग हो सकता है: शायद यह पिछले साल बहुत बारिश करने के लिए हुआ था जहां मैं रहता हूं। हम यह अनुमान लगाने के लिए प्रायिकता का उपयोग कर सकते हैं कि हम अपने निष्कर्ष में कितने आश्वस्त हो सकते हैं कि मेरा घर आपके मुकाबले 50% soggier है।
तो मूल रूप से आप कह सकते हैं कि संभाव्यता सांख्यिकी के सिद्धांत का गणितीय आधार है।
प्रायिकता सिद्धांत में, हमें यादृच्छिक चर X1, X2, ... किसी तरह से दिए जाते हैं, और फिर हम उनके गुणों का अध्ययन करते हैं, अर्थात B1 में प्रायिकता P {X1 \ "की गणना करते हैं, X1, X2, ... आदि के अभिसरण का अध्ययन करते हैं। ।
गणितीय आंकड़ों में, हमें कुछ यादृच्छिक चर एक्स के एन अहसास दिए गए हैं, और वितरण डी का सेट; समस्या डी वन से वितरण के बीच की खोज करना है जो हमारे द्वारा देखे गए डेटा को उत्पन्न करने की सबसे अधिक संभावना है।
संभाव्यता में, वितरण पहले से ज्ञात और ज्ञात है - आप एक ज्ञात संभाव्यता वितरण फ़ंक्शन (या इसी तरह) से शुरू करते हैं, और इससे नमूना लेते हैं।
आंकड़ों में, वितरण अग्रिम में अज्ञात है। यह अनजाना भी हो सकता है। अवलोकन डेटा के पीछे संभाव्यता वितरण के बारे में अनुमान लगाया जाता है, ताकि उस डेटा के बारे में संभावना सिद्धांत को लागू करने में सक्षम हो सके ताकि यह पता चल सके कि उस डेटा के बारे में एक अशक्त परिकल्पना खारिज की जा सकती है या नहीं।
इस बारे में एक दार्शनिक चर्चा है कि क्या वास्तविक दुनिया में संभाव्यता जैसी कोई चीज है, या क्या यह हमारी गणितीय कल्पनाओं का एक आदर्श अनुमान है, और हमारी सभी टिप्पणियां केवल सांख्यिकीय हो सकती हैं।
अनिश्चितता का सामना करने में सांख्यिकी सत्य की खोज है। संभाव्यता वह उपकरण है जो हमें अनिश्चितता की मात्रा निर्धारित करने की अनुमति देता है।
(मैंने एक और, लंबे समय तक जवाब दिया है, यह मानकर कि जो कुछ पूछा जा रहा था वह "अपनी दादी को कैसे समझाएगा?" की तर्ज पर कुछ था।
उत्तर # 1: सांख्यिकी पैराट्राइज्ड प्रायिकता है। उपाय-सिद्धांत संबंधी संभाव्यता पर कोई भी पुस्तक आपको प्रायिकता के बारे में बताएगी: । लेकिन अगर आप आंकड़े कर रहे हैं, तो आप जोड़ने के लिए : ऊपर के लिए , यानी के लिए के विभिन्न मान , आप विभिन्न संभावना उपायों (विभिन्न वितरण) मिलता है।θ ( Ω , एफ , पी θ ) θ
उत्तर # 2: संभावना आगे बढ़ने के बारे में है; आंकड़े पिछड़ जाने वाले हैं। प्रायिकता डेटा (जनरेटिंग) की प्रक्रिया के बारे में है जो कि मान को देता है । सांख्यिकी डेटा लेने के बारे में निष्कर्ष निकालना की प्रक्रिया के बारे में है ।θ
अस्वीकरण: उपरोक्त गणितीय उत्तर हैं। वास्तव में, बहुत सारे आंकड़े उपयुक्त मॉडल की डिजाइनिंग / खोज करने, मौजूदा मॉडल पर सवाल उठाने, प्रयोगों को डिजाइन करने, अपूर्ण डेटा से निपटने आदि के बारे में भी हैं, "सभी मॉडल गलत हैं।"
प्रायिकता : ज्ञात मापदंडों को देखते हुए, डेटा के एक विशेष सेट के अवलोकन की संभावना खोजें।
सांख्यिकी : देखे गए डेटा के एक विशेष सेट को देखते हुए, पैरामीटर क्या हो सकते हैं, इस बारे में अनुमान लगाएं।
सांख्यिकी "अधिक व्यक्तिपरक" और "विज्ञान से अधिक कला" (संभावना के सापेक्ष) है।
हमारे पास एक सिक्का है जिसे फ़्लिप किया जा सकता है। चलिए सिक्के-फ़्लिप का अनुपात है जो सिर हैं।
संभाव्यता : मान लीजिए । फिर (एक पंक्ति में तीन सिर) प्राप्त करने की संभावना क्या है ? एचएचएच
अधिकांश संभावनावादी एक ही, सरल उत्तर देंगे: "संभाव्यता ।"
आँकड़े : मान लीजिए कि हमें मिलता है । फिर क्या है ?पी
अलग-अलग सांख्यिकीविद् अलग-अलग, अक्सर लंबे-लंबे उत्तर देंगे।
संभावनाओं और आंकड़ों के बीच अंतर यह है कि संभावनाओं में कोई गलती नहीं है। हम संभावना के लिए सुनिश्चित हैं क्योंकि हम जानते हैं कि वास्तव में कितने पक्षों में एक सिक्का है, या कितने नीले कारमेल फूलदान में हैं। लेकिन आंकड़ों में हम जो भी जांच करते हैं, उसकी आबादी का एक टुकड़ा जांचते हैं, और इसमें से हम सच्चाई को देखने की कोशिश करते हैं, लेकिन हमेशा एक गलत निष्कर्ष का% होता है। आंकड़ों में केवल यही सच है, क्या यह एक% गलती है, कि वास्तव में एक संभावना है।
सैवेज के टेक्स्ट फ़ाउंडेशन ऑफ़ स्टैटिस्टिक्स को Google विद्वान पर 12000 से अधिक बार उद्धृत किया गया है। [३] यह निम्नलिखित बताता है।
यह सर्वसम्मति से सहमत है कि सांख्यिकी संभावना पर किसी न किसी तरह निर्भर करती है। लेकिन, जैसा कि संभाव्यता क्या है और यह कैसे आँकड़ों से जुड़ा है, बाबुल के टॉवर के बाद से शायद ही कभी इस तरह की पूर्ण असहमति और संचार का टूटना हुआ हो। निस्संदेह, ज्यादातर असहमति केवल शब्दावली है और पर्याप्त रूप से तेज विश्लेषण के तहत गायब हो जाएगी।
https://en.wikipedia.org/wiki/Foundations_of_statistics
तो यह है कि प्रोबेबिलिटी थ्योरी फाउंडेशन ऑफ़ स्टैटिस्टिक्स शायद ही विवादित है। बाकी सब निष्पक्ष खेल है।
लेकिन एक उत्तर के साथ अधिक उपयोगी, व्यावहारिक होने की कोशिश में ...
हालाँकि, प्रायिकता सिद्धांत में बहुत कुछ है जो ज्यादातर गणितीय रुचि है और आंकड़ों के लिए सीधे प्रासंगिक नहीं है। इसके अलावा, सांख्यिकी में कई विषय प्रायिकता सिद्धांत से स्वतंत्र हैं
https://en.wikipedia.org/wiki/Probability_and_statistics
उपरोक्त किसी भी तरह से संपूर्ण या आधिकारिक नहीं है, लेकिन मेरा मानना है कि यह उपयोगी है।
आमतौर पर इसने मुझे इस तरह की चीजें देखने में मदद की है ...
Descrete गणित >> संभाव्यता सिद्धांत >> सांख्यिकी
प्रत्येक का भारी उपयोग होने के साथ, औसतन, अगले की नींव में। यह है कि हम अगले नींवों का अध्ययन कैसे करते हैं, इसमें बड़े चौराहे हैं।
पुनश्च। इसमें इंडक्टिव और डिडक्टिव स्टेटिस्टिक्स होते हैं, इसलिए यह अंतर नहीं होता है।
कई लोग और गणितज्ञ कहते हैं कि 'सांख्यिकी प्रोबबिलिटी का विलोम है', लेकिन यह विशेष रूप से सही नहीं है। इन 2 को हल करने का तरीका या तरीका पूरी तरह से अलग है लेकिन वे इंटरकनेक्टेड हैं ।
मैं अपने दोस्त जॉन डी कुक का उल्लेख करना चाहूंगा ....।
“मुझे लाल और हरी जेली बीन्स के जार का उदाहरण पसंद है।
एक संभावनावादी प्रत्येक के अनुपात को जानने से शुरू होता है और कहता है कि लाल जेली की फलियों को खींचने की संभावना है। एक सांख्यिकीविद जार से नमूना लेकर लाल जेली बीन्स के अनुपात को संक्रमित करता है। ”
अब जार से नमूने द्वारा लाल जेली बीन के अनुपात को प्रोबबिलिस्ट द्वारा जार से लाल बीन खींचने की संभावना का पता लगाने के लिए उपयोग किया जाता है।
इस उदाहरण पर विचार करें ---- >>>
एक परीक्षा में 30% छात्र फिजिक्स में, 25% मैथ्स में फेल हुए, 12% फिजिक्स और मैथ्स दोनों में फेल हुए। एक छात्र का चयन यादृच्छिक रूप से किया जाता है, संभावना यह है कि छात्र भौतिकी में असफल हो गया है, यदि यह ज्ञात है कि वह गणित में असफल रहा है।
उपरोक्त योग संभावना की समस्या है, लेकिन अगर हम ध्यान से देखें तो हम पाएंगे कि यह राशि कुछ सांख्यिकीय आंकड़ों के साथ प्रदान की गई है
30% छात्र फिजिक्स में फेल हो गए, 25% "" "मैथ्स '' 'ये मूल रूप से आवृत्तियों हैं यदि प्रतिशत की गणना की जाती है। इस प्रकार हमें एक सांख्यिकीय डेटा प्रदान किया जाता है जो बदले में हमें संभावना खोजने में मदद करता है।
एसओ प्रोबिलीबिलिटी और स्टेटिस्टिक्स बहुत ज्यादा इंटरकनेक्टेड हैं या रिटरहार्ट हैं जो हम प्रोबिलीबिलिटी को बता सकते हैं कि स्टेटिस्टिक्स पर बहुत कुछ है
"सांख्यिकी" शब्द को जेसी मैक्सवेल ने लेख अणु ( प्रकृति 8, 1873, पीपी। 437-441 में) द्वारा खूबसूरती से समझाया है । मुझे संबंधित मार्ग उद्धृत करें:
जब धारा एफ के कामकाजी सदस्यों को जनगणना की एक रिपोर्ट, या आर्थिक और सामाजिक विज्ञान के संख्यात्मक डेटा वाले किसी अन्य दस्तावेज पर पकड़ मिलती है, तो वे उम्र, आयकर, शिक्षा के अनुसार पूरी आबादी को समूहों में बांटकर शुरू करते हैं, धार्मिक विश्वास, या अपराधी की सजा। प्रत्येक व्यक्ति के इतिहास को अलग-अलग ट्रेस करने की अनुमति देने के लिए व्यक्तियों की संख्या बहुत अधिक है, ताकि मानव सीमाओं के भीतर अपने श्रम को कम करने के लिए, वे कम संख्या में कृत्रिम समूहों पर अपना ध्यान केंद्रित करते हैं। प्रत्येक समूह में अलग-अलग व्यक्तियों की संख्या, और प्रत्येक व्यक्ति की अलग-अलग स्थिति नहीं, प्राथमिक डेटा है जिसमें से वे काम करते हैं।
यह, निश्चित रूप से, मानव प्रकृति का अध्ययन करने का एकमात्र तरीका नहीं है। हम अलग-अलग पुरुषों के आचरण का निरीक्षण कर सकते हैं और उस आचरण के साथ तुलना कर सकते हैं जो उनके पिछले चरित्र और उनकी वर्तमान परिस्थितियों, सर्वोत्तम मौजूदा सिद्धांत के अनुसार, हमें उम्मीद की ओर ले जाएगा। जो लोग इस पद्धति का अभ्यास करते हैं, वे मानव प्रकृति के तत्वों के बारे में अपने ज्ञान में सुधार करने का प्रयास करते हैं, ठीक उसी तरह जैसे कि एक खगोलविद ग्रह के तत्वों को अपनी वास्तविक स्थिति की तुलना करने के लिए सही करता है ताकि प्राप्त तत्वों से घटाया जा सके। इतिहासकारों और राजनेताओं द्वारा माता-पिता और स्कूली छात्रों द्वारा मानव प्रकृति का अध्ययन, इसलिए रजिस्ट्रार और टेबुलेटर द्वारा किए गए और उन राजनेताओं द्वारा किया जाता है, जो आंकड़ों में अपनी आस्था रखते हैं। एक को ऐतिहासिक कहा जा सकता है, और दूसरे को सांख्यिकीय पद्धति।
डायनामिक्स के समीकरण पूरी तरह से ऐतिहासिक विधि के नियमों को व्यक्त करते हैं जैसा कि मामले पर लागू होता है, लेकिन इन समीकरणों के आवेदन से सभी डेटा का एक सही ज्ञान निकलता है। लेकिन पदार्थ का सबसे छोटा हिस्सा जिसे हम प्रयोग कर सकते हैं उसमें लाखों अणु होते हैं, जिनमें से एक भी कभी भी हमारे लिए व्यक्तिगत रूप से समझदार नहीं होता है। इसलिए, हम इन अणुओं में से किसी एक की वास्तविक गति का पता नहीं लगा सकते हैं, ताकि हम सख्त ऐतिहासिक पद्धति को छोड़ने के लिए बाध्य हों, और अणुओं के बड़े समूहों से निपटने के सांख्यिकीय तरीके को अपना सकें।
वह कई अन्य कार्यों में सांख्यिकीय पद्धति का विवरण देता है। उदाहरण के लिए, "जांच की सांख्यिकीय पद्धति में, हम इसकी गति के दौरान प्रणाली का पालन नहीं करते हैं, लेकिन हम अपना ध्यान किसी विशेष चरण पर लगाते हैं, और यह पता लगाते हैं कि सिस्टम उस चरण में है या नहीं, और यह भी कि चरण में प्रवेश कब होता है और जब वह इसे छोड़ देता है "(ट्रांस कैम्ब्रिज फिलोस। 12, 1879, पीपी। 547-570)।
मैक्सवेल द्वारा "संभावना" के बारे में एक और सुंदर मार्ग है (एक पत्र से कैंपबेल, 1850 में, द लाइफ ऑफ जेम्स क्लर्क मैक्सवेल , पी। 143 में पुनर्मुद्रित )।
तर्कशास्त्र का वास्तविक विज्ञान वर्तमान में केवल कुछ, असंभव, या पूरी तरह से संदिग्ध चीजों के साथ बातचीत कर रहा है , जिनमें से कोई भी (सौभाग्य से) हम पर तर्क करने के लिए नहीं है। इसलिए इस दुनिया के लिए सही तर्क गणना की संभावनाओं का है, जो संभाव्यता के परिमाण को ध्यान में रखता है (जो कि एक उचित व्यक्ति के दिमाग में होना चाहिए)।
तो हम कह सकते हैं:
- आंकड़ों में हम "कृत्रिम समूहों की छोटी संख्या पर अपना ध्यान केंद्रित कर रहे हैं" या मात्रा; हम एक प्रकार की सूची या जनगणना कर रहे हैं।
- संभावना में हम कुछ घटनाओं या मात्राओं के बारे में अपनी अनिश्चितता की गणना कर रहे हैं।
दोनों अलग हैं, और हम एक दूसरे के बिना भी कर सकते हैं।
उदाहरण के लिए, यदि हम किसी राष्ट्र की संपूर्ण जनसंख्या की पूर्ण जनगणना करते हैं और विशेष समूहों जैसे कि आयु, लिंग, और इसी तरह के लोगों की सही संख्या की गणना करते हैं, तो हम आंकड़े कर रहे हैं। कोई अनिश्चितता - संभावना नहीं है - इसमें शामिल हैं, क्योंकि जो संख्या हम पाते हैं वे सटीक और ज्ञात हैं।
दूसरी ओर, सड़क पर हमारे सामने से गुजरने वाले किसी व्यक्ति की कल्पना करें, और हम उनकी उम्र के बारे में सोचें। इस मामले में हम अनिश्चित हैं और हम संभावना का उपयोग करते हैं, लेकिन इसमें कोई आँकड़े शामिल नहीं हैं, क्योंकि हम किसी प्रकार की जनगणना या कैटलॉग नहीं बना रहे हैं।
लेकिन दोनों एक साथ भी हो सकते हैं। यदि हम किसी जनसंख्या की पूर्ण जनगणना नहीं कर सकते हैं, तो हमें यह अनुमान लगाना होगा कि विशिष्ट आयु-लिंग समूहों में कितने लोग हैं। इसलिए हम आँकड़ों का उपयोग करते समय संभाव्यता का उपयोग कर रहे हैं। इसके विपरीत, हम लोगों की उम्र के बारे में सटीक सांख्यिकीय आंकड़ों पर विचार कर सकते हैं, और इस तरह के डेटा से हमारे सामने से गुजरने वाले व्यक्ति के बारे में बेहतर अनुमान लगाने की कोशिश करते हैं। इसलिए हम एक संभावना पर निर्णय लेते हुए आँकड़ों का उपयोग कर रहे हैं।