आँकड़े क्यों उपयोगी होते हैं जब कई चीजें जो एक शॉट वाली चीजें होती हैं?


18

मुझे नहीं पता कि यह सिर्फ मेरे लिए है, लेकिन मैं सामान्य रूप से आंकड़ों पर बहुत संदेह करता हूं। मैं इसे पासा के खेल, पोकर गेम आदि में समझ सकता हूं। बहुत छोटे, सरल, अधिकतर आत्म-निहित दोहराया खेल ठीक हैं। उदाहरण के लिए, इसके किनारे पर एक सिक्का उतरना इस संभावना को स्वीकार करने के लिए काफी छोटा है कि लैंडिंग सिर या पूंछ ~ 50% है।

95% जीत के लिए पोकर का 10 डॉलर का गेम खेलना ठीक है। लेकिन क्या होगा अगर आपकी पूरी जिंदगी की बचत + अधिक आप एक जीत पर निर्भर है या नहीं? यह जानकर कि आप उस स्थिति में ९ ५% समय में कैसे जीतेंगे, मेरी पूरी मदद करेगा? अपेक्षित मूल्य वहाँ बहुत मदद नहीं करता है।

अन्य उदाहरणों में जीवन-धमकाने वाली सर्जरी शामिल है। यह जानने में कैसे मदद मिलती है कि यह मौजूदा डेटा के मुकाबले 51% की जीवित रहने की दर बनाम 99% की जीवित रहने की दर है? दोनों मामलों में, मुझे नहीं लगता कि यह मेरे लिए मायने रखेगा कि डॉक्टर मुझसे क्या कहता है, और मैं इसके लिए जाऊंगा। यदि वास्तविक डेटा 75% है, तो वह मुझे (नैतिकता और कानून को छोड़कर) बता सकता है, कि 99.99999% बचने की संभावना है, इसलिए मैं बेहतर महसूस करूंगा। दूसरे शब्दों में, मौजूदा डेटा द्विपद को छोड़कर कोई फर्क नहीं पड़ता। फिर भी, इससे कोई फर्क नहीं पड़ता कि अगर 99.99999% उत्तरजीविता दर है, अगर मैं इससे मर रहा हूं।

इसके अलावा, भूकंप की संभावना। इससे कोई फर्क नहीं पड़ता कि अगर हर दिन औसतन हर x (जहां x> 100) एक मजबूत भूकंप आया। मुझे नहीं पता कि मेरे जीवनकाल में कभी भूकंप आएगा। तो यह उपयोगी जानकारी क्यों है?

एक कम गंभीर उदाहरण, कहते हैं, 100% स्थानों पर जो मुझे पसंद है कि मैं अमेरिका में हूं, यूरोप में 100% स्थानों के प्रति उदासीन हूं, और उन 100% स्थानों से नफरत करता हूं जो मेरे पास हैं एशिया में रहा है। अब, इसका मतलब यह नहीं है कि मुझे अपनी अगली यात्रा पर एशिया में प्यार या यूरोप में घृणा या अमेरिका के प्रति उदासीन होने का कोई स्थान नहीं मिलेगा, बस बहुत ही स्वभाव से कि आंकड़े सभी जानकारी पर कब्जा नहीं करते हैं जरूरत है, और मैं शायद उन सभी जानकारी को कभी भी कब्जा नहीं कर सकता जो मुझे चाहिए, भले ही मैंने उन सभी महाद्वीपों के x% से अधिक की यात्रा की हो। सिर्फ इसलिए कि उन महाद्वीपों के 1-x% में अज्ञात हैं जिन्हें मैंने नहीं किया है। (किसी भी अन्य प्रतिशत के साथ 100% को बदलने के लिए स्वतंत्र महसूस करें)।

मैं समझता हूं कि हर चीज को बल देने का कोई तरीका नहीं है और आपको कई स्थितियों में आंकड़ों पर निर्भर रहना पड़ता है, लेकिन हम कैसे विश्वास कर सकते हैं कि आंकड़े हमारी एक शॉट स्थिति में सहायक होते हैं, खासकर जब आँकड़े मूल रूप से बाहरी घटनाओं के लिए अतिरिक्त रूप से नहीं होते हैं?

आँकड़ों के मेरे संदेह पर पाने के लिए कोई अंतर्दृष्टि?


5
(+1) हमारी साइट पर आपका स्वागत है! यह सिर्फ आप नहीं है: यह एक गहरा सवाल है जो आंकड़ों की नींव पर जाता है।
व्हिबर er

3
"जीवन बचत" उदाहरण अलग-अलग मुद्दों को मिलाता है। अर्थशास्त्र में, तर्कसंगत जोखिम से बचने का एक सामान्य मॉडल अपेक्षित उपयोगिता को अधिकतम करना है, अपेक्षित धन नहीं, जहां उपयोगिता आम तौर पर लॉग (धन) की तरह अवतल (उदासीन) कार्य है। इसका मतलब है कि नुकसान एक ही आकार के लाभ से अधिक होता है, और यह प्रभाव बड़े बदलावों के लिए बड़ा होता है। यह मानने से बहुत अलग है कि और 99 % के बीच कोई अंतर नहीं है , जो असंगत और तर्कहीन व्यवहार की ओर जाता है। 50%99%
डगलस ज़ारे

@DouglasZare यह एक बहुत ही दिलचस्प क्षेत्र की तरह लगता है। क्या आप लाइव बचत के संबंध में व्यक्तिगत जोखिम उठाने के विषय में एक परिचयात्मक लेख प्रदान कर सकते हैं?
स्टीफेन

@ ऑस्टेफ़ेन: यह सामग्री कई बुनियादी अर्थशास्त्र ग्रंथों में शामिल है। अपेक्षित उपयोगिता अधिकतमकरण के सिद्धांत को कई लोगों द्वारा बहुत सरल, और कई घटनाओं को समझाने के लिए अपर्याप्त देखा जाता है, लेकिन यह संभावना सिद्धांत जैसे विचारों पर आगे बढ़ने से पहले समझने के लिए एक महत्वपूर्ण प्रारंभिक बिंदु है। कुछ जो आसानी से अपेक्षित धन अधिकतमकरण के बजाय अपेक्षित उपयोगिता अधिकतमकरण द्वारा समझाया गया है, उसे संभाव्यता सिद्धांत की विफलता के रूप में नहीं देखा जाना चाहिए। en.wikipedia.org/wiki/Expected_utility_hypothesis
डगलस ज़ेरे

यह मुझे एक महत्वपूर्ण विषय और चर्चा के रूप में प्रभावित करता है जो खुला रह सकता है। (मैं अगर लोगों को यह सीडब्ल्यू बनाना चाहते थे, हालांकि समझना होगा।)
को पुनः स्थापित मोनिका - गुंग

जवाबों:


25

पहले मुझे लगता है कि आप "सांख्यिकी" को भ्रमित कर सकते हैं जिसका अर्थ है समूह या स्थिति का वर्णन करने वाले संख्याओं या अन्य तथ्यों का एक संग्रह, और "आंकड़े" का अर्थ है भिन्नता का सामना करने के लिए दुनिया को समझने के लिए डेटा और जानकारी का उपयोग करने का विज्ञान (अन्य) हो सकता है मेरी परिभाषाओं में सुधार करने में सक्षम)। सांख्यिकीविद शब्द की दोनों इंद्रियों का उपयोग करते हैं, इसलिए जब लोग उन्हें मिलाते हैं तो आश्चर्य की बात नहीं है।

सांख्यिकी (विज्ञान) रणनीतियों को चुनने और सबसे अच्छी रणनीति चुनने के बारे में बहुत कुछ है, भले ही हम इसे केवल एक बार लागू करने के लिए प्राप्त करें। कुछ बार जब मैं (और अन्य) संभावना सिखाते हैं तो हम इसे प्रेरित करने के लिए क्लासिक मोंटी हॉल समस्या (3 दरवाजे, 2 बकरियां, 1 कार) का उपयोग करते हैं और हम दिखाते हैं कि कैसे हम खेल का एक गुच्छा खेलकर संभावनाओं का अनुमान लगा सकते हैं (पुरस्कारों के लिए नहीं) ) और हम देख सकते हैं कि "स्विच" रणनीति समय की 2/3 जीतती है और "रहना" रणनीति समय का 1/3 जीतती है। अब अगर हमें एक बार भी गेम खेलने का मौका मिला तो हमें कुछ चीजों के बारे में पता चलेगा कि कौन सी रणनीति जीतने का बेहतर मौका देती है।

सर्जरी उदाहरण समान है, आपके पास केवल एक बार सर्जरी होगी (या सर्जरी नहीं है), लेकिन क्या आप जानना नहीं चाहते हैं कि कौन सी रणनीति अधिक लोगों को लाभ देती है? यदि आपकी पसंद 0% से अधिक जीवित रहने या सर्जरी न करने और 0% जीवित रहने की संभावना के साथ सर्जरी है, तो हाँ सर्जरी में 51% उत्तरजीविता और 99.9% उत्तरजीविता के बीच बहुत कम अंतर है। लेकिन क्या होगा अगर अन्य विकल्प भी हों, तो आप सर्जरी के बीच चयन कर सकते हैं, जिसमें कुछ भी नहीं करना (जिसमें 25% जीवित है) या आहार और व्यायाम का परिवर्तन जिसमें 75% उत्तरजीविता है (लेकिन आपकी ओर से प्रयास की आवश्यकता है), नहीं। यदि आप सर्जरी के विकल्प में ५१% बनाम ९९% जीवित रहते हैं, तो आपको इसकी परवाह है?

डॉक्टर पर भी विचार करें, वह केवल आपकी सर्जरी से अधिक कर रहा होगा। यदि सर्जरी में 99.9% जीवित है, तो उसके पास विकल्पों पर विचार करने का कोई कारण नहीं है, लेकिन अगर यह केवल 51% जीवित है, तो आज यह सबसे अच्छा विकल्प हो सकता है, उसे अन्य विकल्पों की तलाश होनी चाहिए जो उस अस्तित्व को बढ़ाते हैं। हां, 90% जीवित रहने के बावजूद वह कुछ रोगियों को ढीला कर देगा, लेकिन कौन सी रणनीति उसे सबसे अधिक रोगियों को बचाने का सबसे अच्छा मौका देती है?

आज सुबह मैंने गाड़ी चलाते समय अपनी सीट बेल्ट पहनी थी (मेरी सामान्य रणनीति), लेकिन किसी भी दुर्घटना में नहीं मिली, तो क्या मेरी रणनीति समय की बर्बादी थी? अगर मुझे पता होता कि मैं किसी दुर्घटना में पड़ जाऊंगा, तो मैं उन मौकों पर केवल सीट बेल्ट लगाकर समय बचा सकता था, दूसरों पर नहीं। लेकिन मुझे नहीं पता कि जब मैं किसी दुर्घटना में होगा तो मैं अपनी सीट बेल्ट की रणनीति के साथ पहनूंगा क्योंकि मेरा मानना ​​है कि यह मुझे सबसे अच्छा मौका देगा अगर मैं कभी भी दुर्घटना में हूं, भले ही वह समय बर्बाद कर रहा हो और उच्च प्रतिशत में (उम्मीद है कि 100%) बार कोई दुर्घटना न हो।


+1 ग्रेग अच्छी पोस्ट! मैं उसी समय आप के रूप में मेरा लिख ​​रहा था। हम थोड़ा ओवरलैप कर सकते हैं लेकिन मुझे लगता है कि हम दोनों के पास कहने के लिए चीजें थीं जो निशान पर सही थीं और ओवरलैप नहीं थीं। मुझे यकीन नहीं है कि ओपी को क्या लगता है कि आंकड़े क्या हैं। यह अच्छा है कि आपने उसे संदेह का लाभ दिया। मैंने इस पर अधिक गुस्सा किया।
माइकल आर। चेरिक

हाय ग्रेग, मुझे आपका उत्तर पसंद आया, लेकिन क्या मैं इसे इस तरह से बता सकता हूं: आंकड़े (विज्ञान) स्वयं एक आँकड़ा है, यह समय के x% के लिए काम करता है, (संभवतः उच्च x), लेकिन 1-x% अज्ञात हैं / यादृच्छिक कारक जिन्हें हमें हमेशा जागरूक रहने की आवश्यकता होती है। यह देखते हुए कि हम किसी भी तरीके से अज्ञात (संभवतः अनंत) मॉडल कर सकते हैं, हम कभी भी एक्स को नहीं जान पाएंगे। उम्मीद है कि ये आउटलेयर कभी नहीं होंगे, लेकिन हमें रूढ़िवादी पर हमेशा ध्यान और गलत होना चाहिए, खासकर अगर घटना भयावह हो (जैसे, क्षुद्रग्रह, वित्तीय उत्पाद, समाज के लिए परमाणु दुर्घटनाएं और व्यक्तिगत के लिए कार दुर्घटनाएं)। इसका कोई मतलब भी है क्या?
स्टैटिसप्टिक

@statskeptic, आप जो कहते हैं वह सभी क्षेत्रों पर लागू होता है, न कि केवल आँकड़ों पर। वास्तव में अन्य क्षेत्रों की तुलना में सही आंकड़ों पर कम लागू होता है क्योंकि जब आंकड़े सही किए जाते हैं तो धारणाएं स्पष्ट होती हैं। अधिकांश बार जो आंकड़े विफल हुए हैं, वह तकनीक नहीं है, लेकिन यह कि उन्हें गलत तरीके से लागू किया गया था। किसी भी क्षेत्र में अनिश्चितता शामिल है (जो कि धर्म या शुद्ध गणित के अलावा बहुत कुछ है, और यहां तक ​​कि उनके पास कुछ भी है) आपके पास एक जवाब हो सकता है जो या तो गलत है, बेकार है, या आंकड़ों का उपयोग करता है।
ग्रेग स्नो

(+1) आंकड़ों के लिए "विविधता का सामना करने के लिए दुनिया को समझने के लिए डेटा और जानकारी का उपयोग करने का विज्ञान"
अर्ध-पास

4

सिर्फ इसलिए कि आप अपने दैनिक जीवन में आँकड़ों का उपयोग नहीं करते हैं, इसका मतलब यह नहीं है कि क्षेत्र सीधे आपको प्रभावित नहीं करता है। जब आप डॉक्टर के पास होते हैं और वे दूसरे पर एक उपचार की सलाह देते हैं, तो आप शर्त लगा सकते हैं कि उस सिफारिश के पीछे कई नैदानिक ​​परीक्षण थे जो उनके प्रयोगों के परिणामों की व्याख्या करने के लिए आँकड़ों का उपयोग करते थे।

यह पता चला है कि अपेक्षित मूल्य की अवधारणा बहुत उपयोगी है, भले ही आप व्यक्तिगत रूप से अवधारणा का उपयोग न करें। अपने जीवन की बचत को दांव पर लगाने का आपका उदाहरण यह ध्यान रखने में विफल रहता है कि आप कितने जोखिम में हैं। अन्य स्थितियां अपने आप को कम जोखिम वाला पा सकती हैं, या जहां भयावह परिणाम नहीं हैं। व्यापार, वित्त, एक्चुरियल संदर्भ और अन्य इसके उदाहरण हैं। शायद आप होम इंश्योरेंस पॉलिसी जारी कर रहे हैं - फिर अचानक किसी निर्दिष्ट अवधि के भीतर भूकंप की संभावना को जानना सभी के लिए बहुत मायने रखता है।

अंत के आंकड़ों में अनिश्चितता से निपटने का एक शानदार तरीका है। आपका अंतिम उदाहरण आपने उन स्थानों के बारे में कुछ डेटा तैयार किया है जहाँ आप यात्रा करना पसंद करते हैं और दावा किया है कि आँकड़े कहेंगे कि आपको कभी भी एशिया में ऐसी जगह नहीं मिलेगी जो आपको पसंद है। यह सिर्फ गलत है। निश्चित रूप से यह डेटा आपको यह विश्वास दिलाएगा कि एशिया में आपके पसंद की जगह होने की संभावना कम है, लेकिन आप अपनी पसंद के अनुसार अपना पूर्व विश्वास सेट कर सकते हैं, और आंकड़े आपको बताएंगे कि नए डेटा को दिए गए आपके विश्वास को कैसे अपडेट किया जाए। इसके अलावा, यह आपको अपने विश्वास को एक राजसी तरीके से संशोधित करने की अनुमति देता है जो आपको अनिश्चितता की उपस्थिति में तर्कसंगत रूप से कार्य करने की अनुमति देगा।


यात्रा का उदाहरण सिर्फ एक बना हुआ था, लेकिन यह विचार यह है कि आँकड़े अज्ञात पर कब्जा नहीं करते हैं। व्यावसायिक संदर्भों के आपके उदाहरण ने मुझे डब्ल्यूटीसी की बीमा कंपनियों के उदाहरण के बारे में सोचा जो संभवतः इमारत को नष्ट करने वाले विमानों को ध्यान में रखते हुए भवन का बीमा करने की लागत / लाभ का अनुमान लगाते थे, लेकिन फिर भी यह सबसे महत्वपूर्ण बात है।
स्टैटिसप्टिक सेप

+1 @ jjund3 ओपी विशिष्ट प्रश्नों को संबोधित करने के लिए और बिना किसी संघर्ष के बेइज़ियन और अक्सरवादी विशेषताओं को बीच में लाने के लिए।
माइकल आर। चेरिक

@statskeptic आपका कहना है कि आँकड़े सभी संभावित अनिश्चितताओं का हिसाब नहीं दे सकते हैं। लेकिन यह उपयोगी होने के लिए पूर्ण और सही होना जरूरी नहीं है। हमें आतंकवादियों के बारे में जानकारी नहीं है। 9/11 से पहले हमारे पास आत्मघाती अभियानों पर जाने वाले आतंकवादियों के उदाहरण थे और हमारे पास विमानों को हाईजैक करने का अनुभव था। विश्व व्यापार केंद्र में एक दुर्घटनाग्रस्त विमान को निर्धारित करने के लिए जानकारी को एक साथ जोड़ा जा सकता था, एक संभावना थी, हालांकि हमने शायद इसे एक दूरस्थ संभावना के रूप में मूल्यांकन किया होगा।
बजे माइकल आर। चेरिक

हमें पता था कि वर्ल्ड ट्रेड सेंटर एक पसंदीदा क्षेत्र लक्ष्य था। तहखाने में बम विस्फोट के साथ एक बार पहले भी हमला किया गया था। यह तथ्य कि बम पर्याप्त रूप से मजबूत नहीं था कि वांछित क्षति कम से कम एक संकेत था कि अगली बार कुछ बहुत अलग विधि का उपयोग किया जाएगा। बेशक अक्सर कहा जाता है कि दृष्टि 20-20 है। ऐसे कई उदाहरण हैं जहां अप्रत्याशित या अनुचित होता है। लेकिन चुनौती आपदा के मामले में नहीं। वहाँ थियोकोल इंजीनियरों को सीमित डेटा के साथ भी पता था कि कम तापमान पर ओ-रिंग की विफलता के कारण एक भयावह विफलता थी।
बजे माइकल आर। चेरिक

1
@statskeptic आपकी दलील उनकी किताब ब्लैक स्वान में टेलिब के संदेहवाद / आंकड़ों को कोसने जैसी है। मुझे लगता है कि कई सांख्यिकीविदों ने खुद अपने तर्क में छेद किए हैं, जो आधारभूत रूप से कहते हैं कि आंकड़े बेकार हैं क्योंकि यह अनुमान नहीं लगा सकता कि दुर्लभ और अकल्पनीय घटना (आपके उदाहरण में 9/11, स्टॉक मार्केट क्रैश)।
माइकल आर। चेरिक

1

संसार निर्धारक नहीं है। यदि यह निर्धारित किया गया कि भौतिक विज्ञानी दुनिया पर राज करेंगे और सांख्यिकीविद् नौकरी से बाहर हो जाएंगे। लेकिन वास्तविकता यह है कि लगभग हर अनुशासन में सांख्यिकीविद् उच्च मांग में हैं। यह कहना नहीं है कि भौतिकी और अन्य विज्ञानों के लिए कोई जगह नहीं है, लेकिन आंकड़े विज्ञान के साथ हाथ से काम करते हैं और कई वैज्ञानिक खोजों के लिए आधार हैं।

पर्याप्त बातें और बारीकियों के लिए नीचे। मैंने चिकित्सा उद्योग में पिछले 17 वर्षों में काम किया है, पहले चिकित्सा उपकरणों में, फिर फार्मास्यूटिकल्स और अब सामान्य चिकित्सा अनुसंधान में। ड्रग्स और चिकित्सा उपकरण जो जीवन की गुणवत्ता में सुधार करते हैं और अक्सर जीवन को बचाते हैं या बढ़ाते हैं, इस देश और दुनिया भर में नियमित आधार पर विकसित और अनुमोदित होते हैं। अमेरिका में अनुमोदन से पहले एफडीए द्वारा दवा या चिकित्सा उपकरण को विपणन करने की अनुमति देने से पहले सुरक्षा और प्रभावकारिता के प्रमाण की आवश्यकता होती है। FDA के साक्ष्य चरणों में नैदानिक ​​परीक्षणों से आते हैं। सभी नैदानिक ​​परीक्षणों को वैध सांख्यिकीय डिजाइन और विश्लेषण विधियों की आवश्यकता होती है। कुछ भी पूर्ण नहीं है। ड्रग्स कुछ लोगों के लिए अच्छी तरह से काम करते हैं, जबकि अन्य प्रतिक्रिया नहीं कर सकते हैं या प्रतिकूल घटनाएं (बुरी प्रतिक्रियाएं जो बीमारी या मृत्यु का कारण बन सकती हैं) हो सकती हैं। परीक्षण प्रभावी से अप्रभावी दवाओं को अलग करता है। अधिकांश दवाएं विफल हो जाती हैं और अक्सर परीक्षण के अंत में अनुमोदन और विपणन के साथ चरण III के अंत तक प्रारंभिक चरण के विकास से दस साल का चक्र होता है। पोस्टमार्केट निगरानी जिसे आँकड़ों की भी आवश्यकता होती है, तब यह सुनिश्चित करने के लिए आवेदन किया जाता है कि दवा सामान्य आबादी के लिए पर्याप्त रूप से काम करती है। कभी-कभी सामान्य आबादी जिसे दवा के लिए अनुमोदित किया जाता है, उन रोगियों की तुलना में कम प्रतिबंधात्मक समूह है जो नैदानिक ​​परीक्षणों के लिए पात्र थे। इसलिए कभी-कभी ड्रग्स खतरनाक साबित होते हैं और बाजार से खींच लिए जाते हैं। सांख्यिकी दवा सुरक्षा के सभी पहलुओं में मदद करती है। पोस्टमार्केट निगरानी जिसे आँकड़ों की भी आवश्यकता होती है, तब यह सुनिश्चित करने के लिए आवेदन किया जाता है कि दवा सामान्य आबादी के लिए पर्याप्त रूप से काम करती है। कभी-कभी सामान्य आबादी जिसे दवा के लिए अनुमोदित किया जाता है, उन रोगियों की तुलना में कम प्रतिबंधात्मक समूह है जो नैदानिक ​​परीक्षणों के लिए पात्र थे। इसलिए कभी-कभी ड्रग्स खतरनाक साबित होते हैं और बाजार से खींच लिए जाते हैं। सांख्यिकी दवा सुरक्षा के सभी पहलुओं में मदद करती है। पोस्टमार्केट निगरानी जिसे आँकड़ों की भी आवश्यकता होती है, तब यह सुनिश्चित करने के लिए आवेदन किया जाता है कि दवा सामान्य आबादी के लिए पर्याप्त रूप से काम करती है। कभी-कभी सामान्य आबादी जिसे दवा के लिए अनुमोदित किया जाता है, उन रोगियों की तुलना में कम प्रतिबंधात्मक समूह है जो नैदानिक ​​परीक्षणों के लिए पात्र थे। इसलिए कभी-कभी ड्रग्स खतरनाक साबित होते हैं और बाजार से खींच लिए जाते हैं। सांख्यिकी दवा सुरक्षा के सभी पहलुओं में मदद करती है।

आंकड़े सही नहीं हैं। हम यादृच्छिकता और अनिश्चितता के कारण कुछ गलतियों के साथ रहते हैं। लेकिन इसे नियंत्रित किया जाता है और हमारे जीवन बेहतर होते हैं और त्रुटियों को कम किया जाता है, जिसमें वे सांख्यिकीय विज्ञान शामिल नहीं थे।


मुझे गलत मत समझो मैं समझता हूं कि हर चीज में आँकड़े होते हैं, यहाँ तक कि क्वांटम यांत्रिकी के साथ भौतिकी भी प्रायिकता के बारे में है, और आँकड़ों के बिना गणना करने के लिए पर्याप्त परमाणु नहीं हैं। मैं केवल यह जानना चाहता हूं कि यादृच्छिकता और अनिश्चितता से कैसे निपटा जाए जो किसी भी वास्तविक सांख्यिकीय या वितरण से अधिक मेरे (या अन्य लोगों के) जीवन को प्रभावित कर सकता है।
22

ठीक है आँकड़ेकेप्टिक ताकि आप भ्रमित न हों। लेकिन यह देखना इतना कठिन क्यों है कि आंकड़े सफलता के लिए आपके मौके को बेहतर बनाते हैं। संभावना सिद्धांत आपको मौका के खेल जीतने की संभावना बताता है। यदि आप लाठी में थोर्पे की बीट डीलर रणनीति का उपयोग कर सकते हैं और आपके पास धन का एक बड़ा बैंक है तो आप लंबे समय में भाग्य बना सकते हैं। MIT के छात्रों ने लास वेगास में यह साबित कर दिया कि गिनती में फायदा कई डेक के मिश्रण के इस्तेमाल से कम हो गया है। यह सत्य है। कैसीनो जानता है कि कार्ड काउंटर एक खतरा हैं।
माइकल आर। चेरिक

वे उन्हें खोजते हैं और जब उन्हें लगता है कि वे उसे ढूंढते हैं तो वे उसे या कैसीनो से बाहर फेंक देते हैं कोई सवाल नहीं पूछा जाता है।
माइकल आर। चेरिक

इसके अलावा, कृपया यह न सोचें कि मैं आपके पेशे को चमकाने की कोशिश कर रहा हूं। ऐसे कंप्यूटर हैं जो शक्ति को बचाने के लिए सांख्यिकीय रूप से गणना कर रहे हैं, और मैं इसका सम्मान करता हूं। मैं सिर्फ यह जानने की कोशिश कर रहा हूं कि आंकड़ों में मुझसे ज्यादा ज्ञान रखने वाले लोग इन सवालों से कैसे निपटते हैं।
स्टैटकेप्टिक

@statskeptic I fyou ने अपनी मूल पोस्ट देखी जिसमें मैंने अपने inital टिप्पणियों के लिए माफी मांगी। उन्हें एक मॉडरेटर द्वारा सही तरीके से संपादित किया गया। मुझे लगता है कि आप जो कहना चाह रहे थे, मैं उसे गलत समझ गया। मुझे उम्मीद है कि हमने आपके प्रश्न का अच्छी तरह से उत्तर दिया और आपके कुछ संदेह को दूर किया।
माइकल आर। चेरिक

1

मुझे स्वयं भी प्रायिकता और आँकड़ों की उपयोगिता के बारे में एक ही संदेह है, जब किसी एक घटना के बारे में निर्णय लेने की बात आती है। मेरी राय में, संभाव्यता, वास्तविक या अनुमानित जानना, अत्यंत महत्वपूर्ण है जब उद्देश्य नमूनों के परिणामों का अनुमान लगा रहा हो, तो वे एक ही घटना को कई बार दोहराते हैं या एक निश्चित आबादी से एक नमूना डूब जाता है। संक्षेप में, संभावना जानने से कैसीनो के लिए अधिक समझ में आता है, जो संभाव्यता गणनाओं के आधार पर उन नियमों को डाल सकता है जो गारंटी देता है कि वह लंबे समय में जीत जाएगा (कई नाटकों के बाद) और एक जुआरी के लिए नहीं जो एक समय खेलने का नाटक करता है, इसलिए वह जीता या ढीला (ये प्रयोग एक बार चलने पर परिणाम हैं)। यह उन जनरलों के लिए भी महत्वपूर्ण है जो अपने सैनिकों को 10% खोने के जोखिम (संभावना) के साथ लड़ाई में भेजने का विचार करते हैं, लेकिन एक निश्चित मिलाप के लिए नहीं (कहते हैं, जॉन) जो केवल मरने या जीवित रहने के लिए जा रहा है। वास्तविक जीवन में इन जैसे कई उदाहरण हैं।

मैं जो बिंदु बनाना चाहता हूं वह यह है कि, प्रोबेबिलिटी एंड स्टैटिस्टिक्स, न केवल वास्तविक जीवन में उपयोगी हैं, बल्कि अधिक सटीक रूप से, वे सभी आधुनिक वैज्ञानिक शोधों और निर्णय लेने के नियमों के लिए एक उपकरण हैं। हालांकि, यह कहना सही नहीं है कि तर्कसंगतता का अर्थ किसी एकल घटना की संभावना पर निर्भर है, बिना इरादे या इसे दोहराने की संभावना, परिणाम का अनुमान लगाने के लिए। एक निश्चित व्यक्ति के निर्णय को प्रभावित करने की संभावना की प्रवृत्ति, उसके या उसके जोखिम जोखिम की डिग्री के आधार पर, स्पष्ट रूप से व्यक्तिपरक है। जोखिम औसत और जोखिम प्रेमी का एक ही लॉटरी (समान अपेक्षित मूल्य) की ओर अलग-अलग दृष्टिकोण (निर्णय) होता है।


जोखिम से बचने के बारे में यह बात एक दिलचस्प है कि लोग किसी अनिश्चित घटना पर कैसे प्रतिक्रिया देते हैं। लेकिन ध्यान दें कि जब अर्थशास्त्री अनिश्चितता के तहत विकल्प पर विचार करते हैं (उदाहरण के लिए दुनिया की स्थिति पर निर्भर होने वाली वस्तुएं), तो सही संभावना निष्पक्ष बाधाओं की रेखा (एक बजटीय निष्पक्ष जुआ के तहत संभावित बंडल को दर्शाती बजट बाधा ) के माध्यम से सामने आती है । एजेंट न केवल अपनी वरीयताओं के अनुसार व्यवहार करते हैं (उदाहरण के लिए जोखिम का फैलाव), बल्कि उनके बजट की बाधा (उपलब्ध जुआ) और उचित बाधाओं की रेखा के आकलन के अनुसार भी।
सिल्वरफिश

संक्षेप में, यह सच नहीं है कि सभी जोखिम-ग्रस्त लोग "कभी भी जुआ नहीं बोलते" (शब्द के व्यापक अर्थ में), बस यह कि उन्हें एक्ट्युरली फेयर ऑड्स द्वारा जुआ खेलने के लिए प्रलोभन नहीं दिया जा सकता है। एक पर्याप्त जोखिम प्रीमियम (उनकी जोखिम की डिग्री पर निर्भर) उस निर्णय को बदल सकता है, हालांकि। चूंकि यह विश्लेषण निष्पक्ष बाधाओं के एजेंट की धारणा पर निर्भर करता है, यहां तक ​​कि "वन-ऑफ शॉट" पर भी तर्कसंगत एजेंट संभावनाओं को तौलेगा।
सिल्वरफिश

1- मैंने यह नहीं कहा कि जोखिम वाले व्यक्ति कभी जुआ नहीं खेलते। 2-मुझे "व्यक्तिपरक" से क्या मतलब है कि लॉटरी के अपेक्षित मूल्य को जानने से उसके प्रति किसी व्यक्ति का दृष्टिकोण निर्धारित नहीं होता है। अन्य सभी चीजें समान हैं, यह रवैया एक व्यक्तिगत विशेषता का कार्य है जो जोखिम के फैलाव की डिग्री है जो जुआ की अपेक्षित उपयोगिता को निर्धारित करता है। 3-आर्थिक सिद्धांत में तर्कसंगतता परिकल्पना पर निर्भर करती है और इसलिए सापेक्ष है। इसीलिए एक ही अपेक्षित मूल्य के प्रति अलग-अलग दृष्टिकोण दिखाने वाले दो व्यक्तियों को "तर्कसंगत" कहा जा सकता है।
मोहम्मद लेमिने

काश हम इस चर्चा के केंद्रीय बिंदु को याद नहीं करते, जो इस तथ्य से निपट रहा है कि बहुत कम संभावना वाली घटनाएं किसी भी निशान में हो सकती हैं। और विसे वर्सा।
मोहम्मद लेमिन

-4

इसका लंबा और छोटा होना यह है कि संभाव्यता 0 और 1 के बीच विश्वास की डिग्री के लिए साधारण सच्चे / झूठे तर्क का अद्वितीय सामान्यीकरण है। यह संभाव्यता की तथाकथित तार्किक बायेसियन व्याख्या है, जो आरटी कॉक्स द्वारा उत्पन्न की गई है और बाद में ईटी के साथ चैंपियन बनी है। Jaynes।

इसके अलावा कमजोर धारणाओं के अनुसार यह दिखाया जा सकता है कि वरीयता द्वारा अनिश्चित परिणामों का आदेश देने का सही तरीका उन्हें अपेक्षित उपयोगिता द्वारा आदेश देना है, परिणामों के साथ संभाव्यता वितरण के संबंध में अपेक्षित के साथ।

रॉबर्ट क्लेमेन, "मेकिंग हार्ड डिसीजन", एक प्रस्ताव निर्णय विश्लेषण पर एक परिचय और प्रदर्शनी के लिए, जो बेयसियन संभावना और अपेक्षित उपयोगिता पर आधारित है।

आप पारंपरिक लगातार आंकड़ों के बारे में संदेह करने के लिए बिल्कुल सही हैं; अपने अन्वेषकों (आरए फिशर, जे। नेमन, ई। पियर्सन) के डिजाइन से यह दोहरावदार घटनाओं तक सीमित है। लेकिन कई रोजमर्रा की समस्याओं में दोहराव वाली घटनाएं शामिल नहीं होती हैं। क्या करें? विशिष्ट दृष्टिकोण गोल छेद में चौकोर खूंटे को मजबूर करने और गोलपोस्ट को स्थानांतरित करने का कुछ संयोजन है। शर्मनाक, सच में।


4
-1 मेरी राय में लगातार आंकड़ों के बहुत खराब और अनुचित चित्रण। मैं बायेसियन दृष्टिकोण के ऐसे नकारात्मक दृष्टिकोण को नहीं ले जाऊंगा। लेकिन बायेसियन (कोई भी शिविर) आलोचना से मुक्त नहीं हैं। विश्वास की डिग्री अनुमान का मूल है? क्या विश्वास व्यक्तिपरक और व्यक्तिगत है, ताकि दो लोग दो अलग-अलग उत्तर दे सकें? पूर्व वितरण की आवश्यकता के बारे में क्या? इसे कैसे चुना जाना चाहिए? अनुमान के लिए किसी भी प्रतिमान के लिए बहुत सारे प्रश्न। लेकिन क्या हम नींव के ऊपर हॉस्टल बीकरिंग के चरण नहीं हैं?
माइकल आर। चेरिक

5
हमें एकजुट करने और वैज्ञानिक रूप से कहने के बारे में अधिक है कि एक संशय का सामना करने पर STAISTICS IS महत्वपूर्ण है। इसके बजाय आप अक्सरवादी तरीकों पर एक सस्ते शॉट लेने के लिए संशय से सहमत हैं! जो कि शर्मनाक है।
बजे माइकल आर। चेरिक

@MichaelChernick: (1) केवल स्टैटिस्टिक्स चिल्लाने के लिए महत्वपूर्ण है कि शायद ही कोई तर्क है जो एक संदेह पर जीत जाएगा। (२) बायिसियन इंट्रेंस का साधारण तर्क के रूप में समस्या डेटा से समान संबंध है। यही कारण है कि कुछ परिसरों को देखते हुए, आप संभावना के कानूनों को लागू करके एक समाधान को क्रैंक करते हैं। डेटा (जैसे कोई पूर्व वितरण) न तो सही है और न ही गलत है; वे बस हैं उचित लोग पूर्व वितरण के बारे में असहमत हैं जैसे वे किसी अन्य समस्या डेटा के बारे में हो सकते हैं।
राबर्ट डोडिएर

2
मुझे नींव के बारे में चर्चा करने में कोई आपत्ति नहीं है। यह उपयुक्त जगह नहीं है और आपके लिए मेरा एकमात्र बिंदु यह था कि मुझे लगता है कि आपने एक सस्ता शॉट लिया और आपका जवाब अनुचित था। इसके लिए आंकड़ों की नींव की चर्चा की आवश्यकता नहीं है।
माइकल आर। चेर्निक

4
इसे गले लगाओ दोस्तों।
ब्रैंडन बर्टेल्सन

-4

मुझे निम्नलिखित कारणों से आंकड़ों पर संदेह है।

  1. मुझे यकीन है कि सांख्यिकी में स्नातक की डिग्री के बिना किसी को कोई सुराग नहीं है कि वे क्या कर रहे हैं। यूएनएफ। सांख्यिकी में स्नातक की डिग्री के बिना अनुसंधान कर रहे दुनिया भर में लाखों लोग हैं। मैं मैरीलैंड कॉलेज, पार्क के यूनीवर्सिस्टी में एक अंडरग्रेजुएट गणित प्रमुख था। मैंने 4 400 स्तर की गणित कक्षाएं लीं। सभी शिक्षकों ने आपको सिखाया कि सामान की गणना कैसे करें। किसी ने मुझे यह नहीं सिखाया कि किसी भी चीज़ का अर्थ कैसे बनाया जाए या किसी भी सांख्यिकीय विश्लेषण को छोड़कर परिकल्पना परीक्षण के लिए, जो 2 कारणों से कोई मतलब नहीं है।
    1. हर परिकल्पना परीक्षण के लिए मुझे सिखाया गया था, मुझे पहले से धारणाएँ बनानी थीं। किसी ने भी मुझे यह नहीं सिखाया कि मुझे कौन सी धारणा है। 2. P मान तार्किक रूप से कोई मतलब नहीं रखते हैं। आंकड़ों में स्नातक की डिग्री आपको सिखा सकती है कि वास्तव में एपी मूल्य क्या है। हालांकि, मैं आश्वस्त हूं कि कोई भी स्नातक यह नहीं जानता कि इसका उपयोग कैसे किया जाए। स्नातक की परिभाषा कुछ इस बात की संभावना मानती है कि परिकल्पना सही होने पर निर्भर करती है। तार्किक रूप से, परिभाषा का कोई मतलब नहीं है। इससे भी बदतर, NOBODY ने कभी भी मुझे बताया है कि संभावना कहाँ से आती है। मैंने वास्तव में लगभग अपने पूरे गणित विभाग (200 से अधिक लोगों) को ईमेल किया है अगर कोई मुझे जवाब दे सकता है। सबसे लोकप्रिय और केवल प्रतिक्रियाएं थीं "एक को संभाव्यता के लिए त्रुटि दर का अनुमान लगाना होगा" (जब मैंने लोगों से पूछा कि यह कैसे किया गया था, तो उन्होंने सभी मुझे जवाब दिया "
    यही बात तब हुई जब मैंने googled किया कि एपी वैल्यू का संकेत क्या है। यह मुझे निष्कर्ष की ओर ले जाता है ...

  2. यहां तक ​​कि एक एसआईजी। गणित और सांख्यिकी प्रोफेसरों की संख्या के पीछे कोई सुराग नहीं है कि आंकड़ों के पीछे क्या तर्क है। मुझे उम्मीद नहीं है कि लोगों को गहराई से ज्ञान होगा। हालाँकि, मुझे लगता है कि एक भी है। शोध और प्रोफेसरों का% आँकड़ों के पीछे के किसी भी अंतर्निहित तर्क को नहीं समझता है।

  3. सांख्यिकीय त्रुटि वास्तविक त्रुटि के समान नहीं है। क्योंकि लोग उन चीजों के अनुमानों को प्राप्त करने के लिए आँकड़ों का उपयोग करना पसंद करते हैं जो विनम्र हैं, लोग इस तथ्य को "मुखौटा" करने के लिए सांख्यिकीय त्रुटि का उपयोग करना पसंद करते हैं कि उनके पास कोई सुराग नहीं है कि वास्तविक त्रुटि क्या है।

  4. लोग बड़ी आबादी के लिए छोटे नमूनों का उपयोग करते हैं क्योंकि सांख्यिकीय सिद्धांत उन्हें बताता है कि वे कर सकते हैं। मैंने अपने कॉलेज के एक पाठ्यक्रम से सीखा, कि लोग डेटा का उपयोग करना पसंद करते हैं जो देश के लगभग 30 स्कूलों से एक अनुमान है कि पूरे देश में स्कूलों में कुछ हिंसक घटनाएं होती हैं। लगभग 100,000 स्कूल हैं। यह पागल लगता है। एक लोकप्रिय आंदोलन पूरे देश में लगभग 30 स्कूलों से बना है।

  5. लोग प्रमाण सांख्यिकीय का बोझ बनाना पसंद करते हैं। हिग्स बोसोम को कभी खोजा नहीं गया था। यह सांख्यिकीय रूप से खोजा गया था, लेकिन इसका कोई मतलब नहीं है। विशुद्ध रूप से सांख्यिकीय रूप से खोजी जा रही कुछ चीज़ बेकार है क्योंकि कोई भी आंकड़ों की सटीकता को नहीं जानता है।

  6. महत्वपूर्ण विवरण बनाने के लिए लोग आंकड़ों का उपयोग करना पसंद करते हैं। आँकड़ों का उपयोग एक मार्गदर्शक के रूप में किया जा सकता है, लेकिन कोई नहीं जानता कि यह वास्तव में कितना सही है। सिर्फ इसलिए कि एक समस्या को हल करना असंभव लगता है इसका मतलब यह नहीं है कि आंकड़े अगली सबसे अच्छी बात है। तथ्य यह है कि डीएनए परीक्षण आँकड़ों के आधार पर है मुझे ठंड लगना देता है। क्या मुझे आँकड़ों की वजह से मृत्युदंड दिया जा सकता है? क्या आँकड़ों की वजह से किसी हत्यारे को जेल से छोड़ा जा सकता है?

मेरा मानना ​​है कि आंकड़े उपयोगी हो सकते हैं, लेकिन केवल अगर यह निष्कर्ष के रूप में उपयोग नहीं किया जाता है। मेरा मानना ​​है कि आंकड़े हमें बता सकते हैं कि कुछ संभावनाएं क्या हैं। तब तर्क, न कि सांख्यिकीय तर्क का उपयोग यह साबित करने के लिए किया जाना चाहिए कि कौन सी संभावना सही है।


1
"... बेकार क्योंकि कोई भी आंकड़ों की सटीकता को नहीं जानता है", और स्कूलों या डीएनए के नमूने जैसे सांख्यिकीय साक्ष्य से निष्कर्ष निकालने के बारे में आपकी शिकायतें बताती हैं कि आप सांख्यिकीय अनुमान पर भरोसा नहीं करते हैं । फिर भी अक्सर एक सीमित नमूना उपलब्ध सभी सबूत हैं, या सभी डेटा जिन्हें आप कैप्चर कर सकते हैं। ऐसे सबूतों को कैसे तौलना चाहिए? हम अनिश्चितता का सामना करते हैं, क्योंकि हमारा नमूना व्यापक आबादी को बिल्कुल प्रतिबिंबित नहीं करेगा। उस अनिश्चितता के साथ इंजेक्शन, उदाहरण के लिए आत्मविश्वास अंतराल नमूना आंकड़ों में अनिश्चितता को मापता है जैसे नमूना माध्य (लगभग, आंकड़ों की "सटीकता" ज्ञात है)।
सिल्वरफिश

2
"प्रोफेसर आँकड़ों के पीछे के किसी भी अंतर्निहित तर्क को नहीं समझते हैं" - आँकड़ों के कुछ अलग-अलग दर्शन हैं (उदाहरण के लिए बायेसियन-फ़्रीक्वेंटिस्ट बहस देखें) लेकिन अधिकांश लोग उन तकनीकों के बारे में व्यावहारिक हैं जो वे एक विशेष समस्या पर लागू होते हैं। यह बहुत अधिक सुविधा नहीं हो सकता है, अगर सब कुछ, एक अंडरग्रेजुएट कोर्स पर, लेकिन एक दिन लिफाफे के पीछे निश्चित रूप से आँकड़ों का दर्शन यादृच्छिक रूप से नहीं किया गया था। पी-मानों के लिए, "तार्किक रूप से, परिभाषा का कोई मतलब नहीं है": शायद आपको सीवी पर इस प्रश्न से परामर्श करना चाहिए ।
सिल्वरफिश

1
एसई साइटों पर सट्टा रेंट को उचित जवाब नहीं माना जाता है। वे मनोरंजक हो सकते हैं - और कुछ सत्य हो सकते हैं, जैसा कि मेरा मानना ​​है कि यह एक करता है - लेकिन अंत में वे दुखी मौत मर जाते हैं, जैसा कि मैकबेथ
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.