संभाव्यता और आँकड़ों के बीच अंतर क्या है?


116

संभाव्यता और आँकड़ों के बीच क्या अंतर है, और उन्हें एक साथ क्यों अध्ययन किया जाता है?

जवाबों:


114

पर्सि डियाकोनिस से मैंने जो संक्षिप्त उत्तर सुना है वह निम्नलिखित है: संभाव्यता और आँकड़ों द्वारा मानी जाने वाली समस्याएं एक-दूसरे के विपरीत हैं। संभाव्यता सिद्धांत में हम कुछ अंतर्निहित प्रक्रिया पर विचार करते हैं, जिसमें कुछ यादृच्छिकता या अनिश्चितता यादृच्छिक चर द्वारा मॉडलिंग की जाती है, और हम यह पता लगाते हैं कि क्या होता है। आंकड़ों में हम ऐसा कुछ देखते हैं जो हुआ है, और यह पता लगाने की कोशिश करें कि अंतर्निहित प्रक्रिया उन टिप्पणियों को क्या समझाएगी।


2
इसलिए आँकड़े देखते हैं कि भौतिक दुनिया में क्या होता है, अंतर्निहित प्रक्रिया के बारे में सिद्धांतबद्ध करता है, और फिर इस प्रक्रिया को पाया है, यह संभावना के अर्थ में इसका उपयोग करता है कि भविष्यवाणी करने के लिए कि आगे क्या होगा?
hslc

मैं एक सांख्यिकीविद् नहीं कर रहा हूँ, लेकिन मेरी समझ से मैं, कहेंगे हाँ, कि हिस्सा आंकड़े क्या करता है की।
मार्क मेक्स

16
प्रेरण बनाम कटौती
पाओलो

6
जैसा कि पाओलो ने कहा, संभाव्यता सिद्धांत मुख्य रूप से डिडक्टिव भाग के साथ संबंधित है, अनिश्चितता के साथ मॉडलिंग प्रक्रियाओं के आगमनात्मक भाग के साथ आँकड़े। शायद यह उल्लेख करना दिलचस्प है कि अगर कोई सोचता है कि प्रशंसनीय आगमनात्मक तर्क संगत होना चाहिए, तो वास्तव में परिणाम बायेसियन आँकड़े हैं, और अधिक दिलचस्प यह संभावना सिद्धांत से प्राप्त किया जा सकता है। इसलिए बायेसियन सांख्यिकी को मूल रूप से बोलने के लिए संभाव्यता सिद्धांत लागू किया जाता है।
थिएस हेइडेके

1
@Paolo स्टैटिस्टिकल इनवेंशन को "इंडक्टिव
स्टेटस

77

मुझे लाल और हरी जेली बीन्स के जार का उदाहरण पसंद है।

एक संभावनावादी प्रत्येक के अनुपात को जानने के बाद शुरू होता है और एक लाल जेली बीन ड्राइंग की संभावना पूछता है। एक सांख्यिकीविद जार से नमूना लेकर लाल जेली बीन्स के अनुपात को संक्रमित करता है।


लेकिन यह सिर्फ सूत्रीकरण नहीं है? एक संभावनावादी पूछ सकता है "दिया मैंने तीन लाल सेम खींचा है, क्या संभावना है कि अनुपात पचास पचास है?"
थॉमस अहले

2
@ThomasAhle: यह एक अच्छी तरह से परिभाषित संभावना सवाल नहीं है जब तक कि आप रंगों के मूल वितरण के लिए कुछ अंतर्निहित संभावित मॉडल नहीं मानते हैं।
मार्क

55

यह केवल यह कहना भ्रामक है कि आँकड़े केवल संभाव्यता का विलोम हैं। हां, सांख्यिकीय प्रश्न उलटे संभावना के प्रश्न हैं , लेकिन वे उल्टे-सीधे उल्टे समस्याएँ हैं , और यह इस बात से बड़ा फर्क पड़ता है कि उन्हें कैसे संबोधित किया जाता है।

प्रायिकता शुद्ध गणित की एक शाखा है - संभावना प्रश्नों को एक्सिओमेटिक रीजनिंग का उपयोग करके हल किया जा सकता है और इसलिए किसी भी प्रायिकता प्रश्न का एक सही उत्तर है।

सांख्यिकीय प्रश्नों को प्रायिकता मॉडल के उपयोग द्वारा प्रायिकता प्रश्नों में बदला जा सकता है । एक बार जब हम डेटा बनाने वाले तंत्र के बारे में कुछ धारणा बनाते हैं, तो हम संभाव्यता सिद्धांत का उपयोग करके सांख्यिकीय प्रश्नों का उत्तर दे सकते हैं। फिर भी, इन मॉडलों का उपयोग कर समस्या के बाद के विश्लेषण की तुलना में इन प्रायिकता मॉडल का उचित निर्माण और जाँच महत्वपूर्ण या अधिक महत्वपूर्ण है।

एक कह सकता है कि आँकड़े दो भागों के होते हैं। पहला भाग समस्या के लिए संभाव्य मॉडल तैयार करने और मूल्यांकन करने का प्रश्न है; यह प्रयास "विज्ञान के दर्शन" के क्षेत्र में निहित है। दूसरा भाग एक निश्चित मॉडल के बाद उत्तर प्राप्त करने का प्रश्न है। आँकड़ों का यह हिस्सा वास्तव में लागू संभावना सिद्धांत का मामला है, और व्यवहार में, संख्यात्मक विश्लेषण के साथ-साथ काफी हद तक शामिल है।

देखें: http://bactra.org/reviews/error/


2
मैं आपको इस जवाब के लिए प्यार करता हूँ
बदमाश

16

मुझे स्टीव स्कोएना के परिकलित दांव से यह पसंद है (पूरी चर्चा के लिए लिंक देखें):

सारांश में, प्रायिकता सिद्धांत हमें किसी दिए गए आदर्श दुनिया के परिणामों को खोजने में सक्षम बनाता है, जबकि सांख्यिकीय सिद्धांत हमें यह मापने में सक्षम करता है कि हमारी दुनिया किस हद तक आदर्श है।


13

संभाव्यता एक शुद्ध विज्ञान (गणित) है, आंकड़े आंकड़ों के बारे में हैं। चूंकि वे आँकड़ों के लिए किसी तरह की मौलिकता प्रदान करते हैं, इसलिए बुनियादी विचार प्रदान करते हुए वे जुड़े हुए हैं।


3
तो संभावना शुद्ध गणित है और सांख्यिकी को गणित लागू किया जाता है?
hslc

4
आँकड़े लागू हो सकते हैं और नहीं भी हो सकते हैं; अभी भी डेटा की अवधारणा हमेशा मौजूद है।

13

Intuitive Biostatistics की तालिका 3.1 नीचे दिखाए गए आरेख के साथ इस प्रश्न का उत्तर देती है। ध्यान दें कि सभी तीर संभावना के दाईं ओर इंगित करते हैं, और आंकड़ों के लिए बाईं ओर इंगित करते हैं।

संभावना

सामान्य ---> विशिष्ट

जनसंख्या ---> नमूना

मॉडल ---> डेटा

सांख्यिकी

सामान्य <--- विशिष्ट

जनसंख्या <--- नमूना

मॉडल <--- डेटा


1
तो आंकड़े डेटा विश्लेषण का पर्याय हैं?
hslc

3
मुझे कोई भेद नहीं दिखता।
हार्वे मोटुलस्की

3
कुछ डेटा विश्लेषण लगातार आंकड़ों पर भरोसा नहीं करते हैं।
Fr.

11

किस बारे में संभावना सवालों के जवाब होगा हो, सांख्यिकी के बारे में सवालों के जवाब था होता है।


3
इस परिभाषा से, हालांकि, आंकड़ों के बजाय एक पूर्वानुमान अंतराल संभावना है।
Glen_b

10

संभावना अनिश्चितता की मात्रा निर्धारित करने के बारे में है, जबकि आंकड़े ब्याज के कुछ माप में भिन्नता बता रहे हैं (जैसे, आय का स्तर अलग-अलग क्यों है?) जो हम वास्तविक दुनिया में देखते हैं।

हम कुछ अवलोकनीय कारकों (जैसे, लिंग, शिक्षा स्तर, आय उदाहरण के लिए आयु आदि) का उपयोग करके भिन्नता की व्याख्या करते हैं। हालाँकि, चूंकि हम संभवतः सभी संभावित कारकों को ध्यान में नहीं रख सकते हैं जो आय को प्रभावित करते हैं, हम यादृच्छिक त्रुटियों के लिए किसी भी अस्पष्टीकृत भिन्नता को छोड़ देते हैं (जो कि अनिश्चितता को बढ़ाता है)।

चूंकि, हम "भिन्नता = प्रेक्षण योग्य कारकों का प्रभाव + रैंडम त्रुटियों का प्रभाव" को दर्शाते हैं, इसलिए हमें उन भिन्नताओं पर यादृच्छिक त्रुटियों के प्रभाव को ध्यान में रखते हुए उपलब्ध कराए जाने वाले औजारों की आवश्यकता होती है।

कुछ उदाहरण निम्नलिखित हैं:

अनिश्चितता का परिमाण

उदाहरण 1: आप 6-पक्षीय मर जाते हैं। 1 प्राप्त करने की संभावना क्या है?

उदाहरण 2: क्या संभावना है कि संयुक्त राज्य अमेरिका से यादृच्छिक पर चयनित एक वयस्क व्यक्ति की वार्षिक आय $ 40,000 से कम है?

विभिन्नता की व्याख्या करना

उदाहरण 1: हम मानते हैं कि किसी व्यक्ति की वार्षिक आय बदलती रहती है। किसी व्यक्ति की आय में भिन्नता को कौन से कारक स्पष्ट करते हैं?

स्पष्ट रूप से, हम सभी कारकों का हिसाब नहीं दे सकते। इस प्रकार, हम कुछ अवलोकनीय कारकों (जैसे, शिक्षा स्तर, लिंग, आयु आदि) के लिए एक व्यक्ति की आय को विशेषता देते हैं और अनिश्चितता (या आंकड़ों की भाषा में: यादृच्छिक त्रुटियों) के लिए किसी भी शेष भिन्नता को छोड़ देते हैं।

उदाहरण 2: हम देखते हैं कि कुछ उपभोक्ता एक डिटर्जेंट खरीदने के लिए ज्यादातर समय टाइड चुनते हैं जबकि कुछ अन्य उपभोक्ता डिटर्जेंट ब्रांड xzz चुनते हैं। पसंद में भिन्नता क्या बताती है? हम कुछ अवलोकन योग्य कारकों जैसे कि मूल्य, ब्रांड नाम आदि के विकल्पों में भिन्नता को दर्शाते हैं और यादृच्छिक त्रुटियों (या अनिश्चितता) के लिए किसी भी अस्पष्टीकृत भिन्नता को छोड़ देते हैं।


1
क्या होगा अगर यादृच्छिक त्रुटियां समय के साथ अवलोकन योग्य कारकों से अधिक हो जाती हैं?
hslc

उस मामले में आप अपने मॉडल को फिर से काम करते हैं क्योंकि यह अब वास्तविकता के अनुरूप नहीं है।

8

संभाव्यता अनिश्चितता का आलिंगन है, जबकि आंकड़े सच्चाई का एक अनुभवजन्य, अशिष्ट पीछा है (निश्चित रूप से बहिष्कृत झूठे,)।


यहाँ मैं लगातार सभी / बायिसियन संभावना और सभी वर्णनात्मक / खोजपूर्ण / हीन सांख्यिकी के बारे में सोच रहा हूँ।

7

मार्क ने जो कहा, उसके समान, सांख्यिकी को ऐतिहासिक रूप से व्युत्क्रम प्रायिकता कहा जाता था , क्योंकि आँकड़े किसी घटना के कारणों को मानने की कोशिश करते हैं, जबकि टिप्पणियों को देखते हुए संभावना दूसरी तरफ हो जाती है।


6

किसी घटना की संभावना इसकी दीर्घकालिक सापेक्ष आवृत्ति है। इसलिए, यह मूल रूप से आपको मौका दे रहा है, उदाहरण के लिए, एक सिक्के के अगले फ्लिप पर 'सिर' प्राप्त करना, या एक मरने के अगले रोल पर '3' प्राप्त करना।

एक आँकड़ा जनसंख्या के नमूने से गणना की गई कोई संख्यात्मक माप है। उदाहरण के लिए, नमूना मतलब है। हम इसका उपयोग एक आंकड़े के रूप में करते हैं जो आबादी के मतलब का अनुमान लगाता है, जो एक पैरामीटर है। तो मूल रूप से यह आपको किसी नमूने का सारांश दे रहा है ।

  • आप केवल एक नमूने से एक आँकड़ा प्राप्त कर सकते हैं, अन्यथा यदि आप किसी जनसंख्या पर संख्यात्मक माप की गणना करते हैं, तो इसे जनसंख्या पैरामीटर कहा जाता है।

6

संभाव्यता अध्ययन, अच्छी तरह से, कैसे संभावित घटनाएँ हैं। आप सहजता से जानते हैं कि संभावना क्या है।

सांख्यिकी डेटा का अध्ययन है: इसे दिखाना (चार्ट जैसे उपकरण का उपयोग करके), इसे संक्षेप में प्रस्तुत करना (साधन और मानक विचलन आदि का उपयोग करना), उस दुनिया के बारे में निष्कर्ष तक पहुंचना जहां से डेटा खींचा गया था (डेटा के लिए फिटिंग लाइनें), और - यह महत्वपूर्ण है - हम अपने निष्कर्ष के बारे में कितना सुनिश्चित हो सकते हैं।

यह सुनिश्चित करने के लिए कि हम अपने निष्कर्ष के बारे में सुनिश्चित हो सकते हैं कि हमें संभाव्यता का उपयोग करने की आवश्यकता है। मान लीजिए कि आपके पास पिछले वर्ष के आंकड़ों के बारे में है कि आप किस क्षेत्र में रहते हैं और मैं कहां रहता हूं। पिछले साल इसने प्रति सप्ताह औसतन 1/4 इंच बारिश की जहाँ आप रहते हैं, और 3/8 इंच जहाँ मैं रहता हूँ। तो हम कह सकते हैं कि मेरे क्षेत्र में वर्षा औसतन 50% अधिक है जहाँ आप रहते हैं, ठीक है? इतनी जल्दी नहीं, स्पार्की। यह एक संयोग हो सकता है: शायद यह पिछले साल बहुत बारिश करने के लिए हुआ था जहां मैं रहता हूं। हम यह अनुमान लगाने के लिए प्रायिकता का उपयोग कर सकते हैं कि हम अपने निष्कर्ष में कितने आश्वस्त हो सकते हैं कि मेरा घर आपके मुकाबले 50% soggier है।

तो मूल रूप से आप कह सकते हैं कि संभाव्यता सांख्यिकी के सिद्धांत का गणितीय आधार है।


5

प्रायिकता सिद्धांत में, हमें यादृच्छिक चर X1, X2, ... किसी तरह से दिए जाते हैं, और फिर हम उनके गुणों का अध्ययन करते हैं, अर्थात B1 में प्रायिकता P {X1 \ "की गणना करते हैं, X1, X2, ... आदि के अभिसरण का अध्ययन करते हैं। ।

गणितीय आंकड़ों में, हमें कुछ यादृच्छिक चर एक्स के एन अहसास दिए गए हैं, और वितरण डी का सेट; समस्या डी वन से वितरण के बीच की खोज करना है जो हमारे द्वारा देखे गए डेटा को उत्पन्न करने की सबसे अधिक संभावना है।


तो हम केवल उन पैटर्नों को खोज सकते हैं जिन्हें हम पहले स्थान पर खोज रहे थे?
hslc

4

संभाव्यता में, वितरण पहले से ज्ञात और ज्ञात है - आप एक ज्ञात संभाव्यता वितरण फ़ंक्शन (या इसी तरह) से शुरू करते हैं, और इससे नमूना लेते हैं।

आंकड़ों में, वितरण अग्रिम में अज्ञात है। यह अनजाना भी हो सकता है। अवलोकन डेटा के पीछे संभाव्यता वितरण के बारे में अनुमान लगाया जाता है, ताकि उस डेटा के बारे में संभावना सिद्धांत को लागू करने में सक्षम हो सके ताकि यह पता चल सके कि उस डेटा के बारे में एक अशक्त परिकल्पना खारिज की जा सकती है या नहीं।

इस बारे में एक दार्शनिक चर्चा है कि क्या वास्तविक दुनिया में संभाव्यता जैसी कोई चीज है, या क्या यह हमारी गणितीय कल्पनाओं का एक आदर्श अनुमान है, और हमारी सभी टिप्पणियां केवल सांख्यिकीय हो सकती हैं।


3

अनिश्चितता का सामना करने में सांख्यिकी सत्य की खोज है। संभाव्यता वह उपकरण है जो हमें अनिश्चितता की मात्रा निर्धारित करने की अनुमति देता है।

(मैंने एक और, लंबे समय तक जवाब दिया है, यह मानकर कि जो कुछ पूछा जा रहा था वह "अपनी दादी को कैसे समझाएगा?" की तर्ज पर कुछ था।


3

उत्तर # 1: सांख्यिकी पैराट्राइज्ड प्रायिकता है। उपाय-सिद्धांत संबंधी संभाव्यता पर कोई भी पुस्तक आपको प्रायिकता के बारे में बताएगी: । लेकिन अगर आप आंकड़े कर रहे हैं, तो आप जोड़ने के लिए : ऊपर के लिए , यानी के लिए के विभिन्न मान , आप विभिन्न संभावना उपायों (विभिन्न वितरण) मिलता है।θ ( Ω , एफ , पी θ ) θ(Ω,F,P)θ(Ω,F,Pθ)θ

उत्तर # 2: संभावना आगे बढ़ने के बारे में है; आंकड़े पिछड़ जाने वाले हैं। प्रायिकता डेटा (जनरेटिंग) की प्रक्रिया के बारे में है जो कि मान को देता है । सांख्यिकी डेटा लेने के बारे में निष्कर्ष निकालना की प्रक्रिया के बारे में है ।θθθ

अस्वीकरण: उपरोक्त गणितीय उत्तर हैं। वास्तव में, बहुत सारे आंकड़े उपयुक्त मॉडल की डिजाइनिंग / खोज करने, मौजूदा मॉडल पर सवाल उठाने, प्रयोगों को डिजाइन करने, अपूर्ण डेटा से निपटने आदि के बारे में भी हैं, "सभी मॉडल गलत हैं।"


4
अनुरूपता, अगर पूछा गया "रसायन क्या है?" हम जवाब दे सकते हैं कि यह अंतर समीकरणों का एक समूह है। गणितीय सिद्धांत का विवरण हमें एक छोटे से विचार दे सकता है कि कोई विषय क्या है, लेकिन यह स्वयं विषय नहीं है।
whuber

3

प्रायिकता : ज्ञात मापदंडों को देखते हुए, डेटा के एक विशेष सेट के अवलोकन की संभावना खोजें।

सांख्यिकी : देखे गए डेटा के एक विशेष सेट को देखते हुए, पैरामीटर क्या हो सकते हैं, इस बारे में अनुमान लगाएं।

सांख्यिकी "अधिक व्यक्तिपरक" और "विज्ञान से अधिक कला" (संभावना के सापेक्ष) है।

Example_

हमारे पास एक सिक्का है जिसे फ़्लिप किया जा सकता है। चलिए सिक्के-फ़्लिप का अनुपात है जो सिर हैं।p

संभाव्यता : मान लीजिए । फिर (एक पंक्ति में तीन सिर) प्राप्त करने की संभावना क्या है ? एचएचएचp=12HHH

अधिकांश संभावनावादी एक ही, सरल उत्तर देंगे: "संभाव्यता ।"18

आँकड़े : मान लीजिए कि हमें मिलता है । फिर क्या है ?पीHHHp

अलग-अलग सांख्यिकीविद् अलग-अलग, अक्सर लंबे-लंबे उत्तर देंगे।


3

संभावनाओं और आंकड़ों के बीच अंतर यह है कि संभावनाओं में कोई गलती नहीं है। हम संभावना के लिए सुनिश्चित हैं क्योंकि हम जानते हैं कि वास्तव में कितने पक्षों में एक सिक्का है, या कितने नीले कारमेल फूलदान में हैं। लेकिन आंकड़ों में हम जो भी जांच करते हैं, उसकी आबादी का एक टुकड़ा जांचते हैं, और इसमें से हम सच्चाई को देखने की कोशिश करते हैं, लेकिन हमेशा एक गलत निष्कर्ष का% होता है। आंकड़ों में केवल यही सच है, क्या यह एक% गलती है, कि वास्तव में एक संभावना है।


2

सैवेज के टेक्स्ट फ़ाउंडेशन ऑफ़ स्टैटिस्टिक्स को Google विद्वान पर 12000 से अधिक बार उद्धृत किया गया है। [३] यह निम्नलिखित बताता है।

यह सर्वसम्मति से सहमत है कि सांख्यिकी संभावना पर किसी न किसी तरह निर्भर करती है। लेकिन, जैसा कि संभाव्यता क्या है और यह कैसे आँकड़ों से जुड़ा है, बाबुल के टॉवर के बाद से शायद ही कभी इस तरह की पूर्ण असहमति और संचार का टूटना हुआ हो। निस्संदेह, ज्यादातर असहमति केवल शब्दावली है और पर्याप्त रूप से तेज विश्लेषण के तहत गायब हो जाएगी।

https://en.wikipedia.org/wiki/Foundations_of_statistics

तो यह है कि प्रोबेबिलिटी थ्योरी फाउंडेशन ऑफ़ स्टैटिस्टिक्स शायद ही विवादित है। बाकी सब निष्पक्ष खेल है।

लेकिन एक उत्तर के साथ अधिक उपयोगी, व्यावहारिक होने की कोशिश में ...

हालाँकि, प्रायिकता सिद्धांत में बहुत कुछ है जो ज्यादातर गणितीय रुचि है और आंकड़ों के लिए सीधे प्रासंगिक नहीं है। इसके अलावा, सांख्यिकी में कई विषय प्रायिकता सिद्धांत से स्वतंत्र हैं

https://en.wikipedia.org/wiki/Probability_and_statistics

उपरोक्त किसी भी तरह से संपूर्ण या आधिकारिक नहीं है, लेकिन मेरा मानना ​​है कि यह उपयोगी है।

आमतौर पर इसने मुझे इस तरह की चीजें देखने में मदद की है ...

Descrete गणित >> संभाव्यता सिद्धांत >> सांख्यिकी

प्रत्येक का भारी उपयोग होने के साथ, औसतन, अगले की नींव में। यह है कि हम अगले नींवों का अध्ययन कैसे करते हैं, इसमें बड़े चौराहे हैं।

पुनश्च। इसमें इंडक्टिव और डिडक्टिव स्टेटिस्टिक्स होते हैं, इसलिए यह अंतर नहीं होता है।


0

कई लोग और गणितज्ञ कहते हैं कि 'सांख्यिकी प्रोबबिलिटी का विलोम है', लेकिन यह विशेष रूप से सही नहीं है। इन 2 को हल करने का तरीका या तरीका पूरी तरह से अलग है लेकिन वे इंटरकनेक्टेड हैं

मैं अपने दोस्त जॉन डी कुक का उल्लेख करना चाहूंगा ....।

“मुझे लाल और हरी जेली बीन्स के जार का उदाहरण पसंद है।

एक संभावनावादी प्रत्येक के अनुपात को जानने से शुरू होता है और कहता है कि लाल जेली की फलियों को खींचने की संभावना है। एक सांख्यिकीविद जार से नमूना लेकर लाल जेली बीन्स के अनुपात को संक्रमित करता है। ”

अब जार से नमूने द्वारा लाल जेली बीन के अनुपात को प्रोबबिलिस्ट द्वारा जार से लाल बीन खींचने की संभावना का पता लगाने के लिए उपयोग किया जाता है।

इस उदाहरण पर विचार करें ---- >>>

एक परीक्षा में 30% छात्र फिजिक्स में, 25% मैथ्स में फेल हुए, 12% फिजिक्स और मैथ्स दोनों में फेल हुए। एक छात्र का चयन यादृच्छिक रूप से किया जाता है, संभावना यह है कि छात्र भौतिकी में असफल हो गया है, यदि यह ज्ञात है कि वह गणित में असफल रहा है।

उपरोक्त योग संभावना की समस्या है, लेकिन अगर हम ध्यान से देखें तो हम पाएंगे कि यह राशि कुछ सांख्यिकीय आंकड़ों के साथ प्रदान की गई है

30% छात्र फिजिक्स में फेल हो गए, 25% "" "मैथ्स '' 'ये मूल रूप से आवृत्तियों हैं यदि प्रतिशत की गणना की जाती है। इस प्रकार हमें एक सांख्यिकीय डेटा प्रदान किया जाता है जो बदले में हमें संभावना खोजने में मदद करता है।

एसओ प्रोबिलीबिलिटी और स्टेटिस्टिक्स बहुत ज्यादा इंटरकनेक्टेड हैं या रिटरहार्ट हैं जो हम प्रोबिलीबिलिटी को बता सकते हैं कि स्टेटिस्टिक्स पर बहुत कुछ है


0

"सांख्यिकी" शब्द को जेसी मैक्सवेल ने लेख अणु ( प्रकृति 8, 1873, पीपी। 437-441 में) द्वारा खूबसूरती से समझाया है । मुझे संबंधित मार्ग उद्धृत करें:

जब धारा एफ के कामकाजी सदस्यों को जनगणना की एक रिपोर्ट, या आर्थिक और सामाजिक विज्ञान के संख्यात्मक डेटा वाले किसी अन्य दस्तावेज पर पकड़ मिलती है, तो वे उम्र, आयकर, शिक्षा के अनुसार पूरी आबादी को समूहों में बांटकर शुरू करते हैं, धार्मिक विश्वास, या अपराधी की सजा। प्रत्येक व्यक्ति के इतिहास को अलग-अलग ट्रेस करने की अनुमति देने के लिए व्यक्तियों की संख्या बहुत अधिक है, ताकि मानव सीमाओं के भीतर अपने श्रम को कम करने के लिए, वे कम संख्या में कृत्रिम समूहों पर अपना ध्यान केंद्रित करते हैं। प्रत्येक समूह में अलग-अलग व्यक्तियों की संख्या, और प्रत्येक व्यक्ति की अलग-अलग स्थिति नहीं, प्राथमिक डेटा है जिसमें से वे काम करते हैं।

यह, निश्चित रूप से, मानव प्रकृति का अध्ययन करने का एकमात्र तरीका नहीं है। हम अलग-अलग पुरुषों के आचरण का निरीक्षण कर सकते हैं और उस आचरण के साथ तुलना कर सकते हैं जो उनके पिछले चरित्र और उनकी वर्तमान परिस्थितियों, सर्वोत्तम मौजूदा सिद्धांत के अनुसार, हमें उम्मीद की ओर ले जाएगा। जो लोग इस पद्धति का अभ्यास करते हैं, वे मानव प्रकृति के तत्वों के बारे में अपने ज्ञान में सुधार करने का प्रयास करते हैं, ठीक उसी तरह जैसे कि एक खगोलविद ग्रह के तत्वों को अपनी वास्तविक स्थिति की तुलना करने के लिए सही करता है ताकि प्राप्त तत्वों से घटाया जा सके। इतिहासकारों और राजनेताओं द्वारा माता-पिता और स्कूली छात्रों द्वारा मानव प्रकृति का अध्ययन, इसलिए रजिस्ट्रार और टेबुलेटर द्वारा किए गए और उन राजनेताओं द्वारा किया जाता है, जो आंकड़ों में अपनी आस्था रखते हैं। एक को ऐतिहासिक कहा जा सकता है, और दूसरे को सांख्यिकीय पद्धति।

डायनामिक्स के समीकरण पूरी तरह से ऐतिहासिक विधि के नियमों को व्यक्त करते हैं जैसा कि मामले पर लागू होता है, लेकिन इन समीकरणों के आवेदन से सभी डेटा का एक सही ज्ञान निकलता है। लेकिन पदार्थ का सबसे छोटा हिस्सा जिसे हम प्रयोग कर सकते हैं उसमें लाखों अणु होते हैं, जिनमें से एक भी कभी भी हमारे लिए व्यक्तिगत रूप से समझदार नहीं होता है। इसलिए, हम इन अणुओं में से किसी एक की वास्तविक गति का पता नहीं लगा सकते हैं, ताकि हम सख्त ऐतिहासिक पद्धति को छोड़ने के लिए बाध्य हों, और अणुओं के बड़े समूहों से निपटने के सांख्यिकीय तरीके को अपना सकें।

वह कई अन्य कार्यों में सांख्यिकीय पद्धति का विवरण देता है। उदाहरण के लिए, "जांच की सांख्यिकीय पद्धति में, हम इसकी गति के दौरान प्रणाली का पालन नहीं करते हैं, लेकिन हम अपना ध्यान किसी विशेष चरण पर लगाते हैं, और यह पता लगाते हैं कि सिस्टम उस चरण में है या नहीं, और यह भी कि चरण में प्रवेश कब होता है और जब वह इसे छोड़ देता है "(ट्रांस कैम्ब्रिज फिलोस। 12, 1879, पीपी। 547-570)।

मैक्सवेल द्वारा "संभावना" के बारे में एक और सुंदर मार्ग है (एक पत्र से कैंपबेल, 1850 में, द लाइफ ऑफ जेम्स क्लर्क मैक्सवेल , पी। 143 में पुनर्मुद्रित )।

तर्कशास्त्र का वास्तविक विज्ञान वर्तमान में केवल कुछ, असंभव, या पूरी तरह से संदिग्ध चीजों के साथ बातचीत कर रहा है , जिनमें से कोई भी (सौभाग्य से) हम पर तर्क करने के लिए नहीं है। इसलिए इस दुनिया के लिए सही तर्क गणना की संभावनाओं का है, जो संभाव्यता के परिमाण को ध्यान में रखता है (जो कि एक उचित व्यक्ति के दिमाग में होना चाहिए)।

तो हम कह सकते हैं:

- आंकड़ों में हम "कृत्रिम समूहों की छोटी संख्या पर अपना ध्यान केंद्रित कर रहे हैं" या मात्रा; हम एक प्रकार की सूची या जनगणना कर रहे हैं।

- संभावना में हम कुछ घटनाओं या मात्राओं के बारे में अपनी अनिश्चितता की गणना कर रहे हैं।

दोनों अलग हैं, और हम एक दूसरे के बिना भी कर सकते हैं।

उदाहरण के लिए, यदि हम किसी राष्ट्र की संपूर्ण जनसंख्या की पूर्ण जनगणना करते हैं और विशेष समूहों जैसे कि आयु, लिंग, और इसी तरह के लोगों की सही संख्या की गणना करते हैं, तो हम आंकड़े कर रहे हैं। कोई अनिश्चितता - संभावना नहीं है - इसमें शामिल हैं, क्योंकि जो संख्या हम पाते हैं वे सटीक और ज्ञात हैं।

दूसरी ओर, सड़क पर हमारे सामने से गुजरने वाले किसी व्यक्ति की कल्पना करें, और हम उनकी उम्र के बारे में सोचें। इस मामले में हम अनिश्चित हैं और हम संभावना का उपयोग करते हैं, लेकिन इसमें कोई आँकड़े शामिल नहीं हैं, क्योंकि हम किसी प्रकार की जनगणना या कैटलॉग नहीं बना रहे हैं।

लेकिन दोनों एक साथ भी हो सकते हैं। यदि हम किसी जनसंख्या की पूर्ण जनगणना नहीं कर सकते हैं, तो हमें यह अनुमान लगाना होगा कि विशिष्ट आयु-लिंग समूहों में कितने लोग हैं। इसलिए हम आँकड़ों का उपयोग करते समय संभाव्यता का उपयोग कर रहे हैं। इसके विपरीत, हम लोगों की उम्र के बारे में सटीक सांख्यिकीय आंकड़ों पर विचार कर सकते हैं, और इस तरह के डेटा से हमारे सामने से गुजरने वाले व्यक्ति के बारे में बेहतर अनुमान लगाने की कोशिश करते हैं। इसलिए हम एक संभावना पर निर्णय लेते हुए आँकड़ों का उपयोग कर रहे हैं।


आपके सहयोग के लिए धन्यवाद। यद्यपि यह दिलचस्प है, यह इस बात से मेल नहीं खाता है कि सांख्यिकीविदों का मानना ​​है कि आँकड़े न तो हैं और न ही वे वास्तव में क्या करते हैं, जैसा कि आँकड़े.स्टैकएक्सचेंज . com / questions / 140547/… पर दिखाया गया है ।
whuber

यह एक मूट प्वाइंट है। मैं पेशेवर सांख्यिकीविदों को जानता हूं जो एएसए की परिभाषा (जो बहुत अस्पष्ट है) से असहमत हैं और मैक्सवेल से सहमत हैं।
pglpm
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.