आप बिना सांख्यिकीय पृष्ठभूमि वाले लोगों को सांख्यिकीय महत्व कैसे समझाएंगे?


11

पृष्ठभूमि:
मुझे एक क्लाइंट (किसी प्रकार के वकील) के लिए डेटा विश्लेषण करना था, जो आंकड़ों में एक पूर्ण शुरुआत थी। उन्होंने मुझसे पूछा कि "सांख्यिकीय महत्व" शब्द का क्या अर्थ है और मैंने वास्तव में इसे समझाने की कोशिश की ... लेकिन जब से मैं चीजों को समझाने में अच्छा नहीं हूँ, तब तक मैं असफल रहा हूँ;)

जवाबों:


15

अवसर के परिणामस्वरूप मतभेद होते हैं।

जब हम मानते हैं कि कुछ सांख्यिकीय रूप से महत्वपूर्ण है, तो हमारा मानना ​​है कि यह अंतर बड़ा है क्योंकि इसे एक मौका घटना के रूप में समझाया जा सकता है।


मुझे मौके का उपयोग पसंद है, लेकिन लगता है कि आम तौर पर परीक्षण को कितना महत्व दिया जाता है, इस संदर्भ में यह बहुत ही भ्रामक है। उदाहरण के लिए, बड़े नमूना आकार का मतलब है कि आप "मौका" आधारभूत अंतर के कारण लगभग हमेशा महत्व प्राप्त करेंगे। यह बहुत व्यापक रूप से स्वीकार किया जाता है कि उन परिणामों को "सांख्यिकीय रूप से महत्वपूर्ण" कहा जा सकता है, मौका द्वारा उचित रूप से समझाया जाने के बावजूद।
फ्लास्क

@Flask: किस आधार पर मौका मिलने के कारण ये आधारभूत अंतर हैं?
स्कॉर्टी - मोनिका

@Scortchi यदि रैंडमाइजेशन का प्रदर्शन किया गया है, तो संयोग के कारण अंतर हो सकता है। यहाँ देखें । भले ही यह कुछ प्रदर्शन किया गया हो, बाद में पूर्वाग्रह का परिचय दे सकता है। यहाँ देखें । यदि यादृच्छिकरण का प्रदर्शन नहीं किया गया है, तो यह मौका या अन्वेषक पूर्वाग्रह या किसी भी कारण से हो सकता है।
फ्लास्क

1
इसके अलावा उपयोगी उत्तर केवल यह मतभेदों के परीक्षणों पर लागू होता है।
रोलैंडो 2

2
+1 यह एक उत्कृष्ट उत्तर है क्योंकि यह पी-मान, संभाव्यता, वितरण, अशक्त परिकल्पना इत्यादि के आर्काना से बचता है, और इस तरह से उस बिंदु पर सही हो जाता है जो सबसे अधिक वकीलों के साथ लागू होगा। यह व्यापक नहीं हो सकता है बिंदु के बगल में है: विवरण और विविधताओं को बाद में संभाला जा सकता है। अगर इस पर सुधार करने के लिए दबाव डाला जाता है, तो मैं जो मुख्य बदलाव करूंगा, वह यह होगा कि सांख्यिकीय महत्व के बारे में मान्यताएं डेटा पर आधारित हों : जो कि इस विवरण को, धार्मिक मान्यताओं से अलग करेगा।
whuber

3

ध्यान दें: मैं इस जवाब में जो भी जोर देना चाहता हूं वह यह है कि सांख्यिकीय महत्व एक उपयोगी उपकरण है, लेकिन सच्चाई से अलग भी है।

52 कार्ड का एक पैकेट लें। अगर मेरा मुवक्किल निर्दोष है तो यह कार्ड का एक सामान्य पैक है, 13 दिल। अगर मेरा ग्राहक झूठ बोल रहा है तो यह एक निश्चित पैक है और सभी 52 कार्ड दिल हैं।

मैं पहला कार्ड खींचता हूं और यह एक दिल है। अहा, दोषी! ठीक है, स्पष्ट रूप से सामान्य ज्ञान हमें बताता है कि ऐसा नहीं है: चार में से एक मौका था यह तब भी होगा जब वह निर्दोष था। हमारे पास केवल एक कार्ड को देखने से सांख्यिकीय महत्व नहीं है ।

इसलिए हम दूसरा कार्ड बनाते हैं। एक और दिल। ह्ह्म्म्म ... निश्चित रूप से तब दोषी! खैर, बाकी के 51 कार्डों में अभी भी 12 दिल थे, इसलिए असंभव नहीं था। गणित (१३/५२ * १२/५१ = ०.०५ tells time) हमें बताता है कि यह ६% समय होता है, भले ही निर्दोष हो। अधिकांश वैज्ञानिकों के लिए यह अभी भी नहीं गिना जाएगा।

तीसरा कार्ड ड्रा करें, एक और दिल! एक पंक्ति में तीन। ऐसा होने की संभावना है (13/52 * 12/51 * 11/50 = 0.01294), इसलिए समय के 1% से अधिक यह संयोग से हो सकता है।

विज्ञान के अधिकांश भाग में 5% का उपयोग कट-ऑफ पॉइंट के रूप में किया जाता है। इसलिए यदि आपके पास उन तीन कार्डों के अलावा कोई अन्य सबूत नहीं है, तो आपके पास सांख्यिकीय रूप से महत्वपूर्ण परिणाम है कि वह दोषी है।

महत्वपूर्ण बिंदु यह है कि जितने अधिक कार्ड आपको अपने अपराध में बेहतर आत्मविश्वास को देखने की अनुमति देते हैं, यह कहने का एक और तरीका है कि सांख्यिकीय महत्व अधिक हो जाता है।

ध्यान दें: जब तक आपको 14 कार्डों को देखने की अनुमति नहीं है, आपके पास उसके अपराध का प्रमाण नहीं है । कार्ड के एक सामान्य पैक के साथ सैद्धांतिक रूप से संभवतः 13 दिलों को एक पंक्ति में खींचना है, लेकिन 14 असंभव है। [बच्चों के लिए अलग: चलो मान लेते हैं कि कार्ड पर नंबर दिखाई नहीं दे रहे हैं; सभी कार्ड चार संभावित सूटों में से एक हैं, और वह यह है।]

नोट: आपके पास उसकी मासूमियत का प्रमाण है जिस क्षण आप दिल के अलावा कोई कार्ड खींचते हैं। ऐसा इसलिए है क्योंकि केवल दो संभावित पैक थे: सामान्य या सभी दिल। वास्तविक जीवन अधिक जटिल है, और गणित अधिक जटिल हो जाता है।

वैसे, यदि आपका ग्राहक कार्ड खिलाड़ी नहीं है, तो एकाधिकार का प्रयास करें: हर कोई कुछ समय में एक डबल-सिक्स रोल करता है; लेकिन अगर कोई हर बार आपको संदेह होने पर दोहरा छक्का लगाता है। आंकड़े हमें एक सटीक संख्या डालने की अनुमति देते हैं कि हमें कितना संदिग्ध होना चाहिए।


3

मेरी अपनी सलाह निम्न बातों के बारे में बात करने की नहीं है:

  1. पी-मूल्यों,
  2. परीक्षण के आँकड़े,
  3. अकेले संयोग से होने वाली चीजों की संभावना।

वकील के बारे में अपने आप पर बहुत कठोर मत बनो। यह एक शिक्षित व्यक्ति है जिसने विश्वविद्यालय के सांख्यिकी वर्ग में कम से कम एक सेमेस्टर बिताया है, और इसमें से कुछ भी उसके साथ नहीं जुड़ा है। यह लगभग हर दूसरे गैर-वैज्ञानिक के लिए एक ही कहानी है जिसके साथ मैंने काम किया है - सांख्यिकीय महत्व छड़ी नहीं करता है । यह सिर्फ एक अप्राकृतिक अवधारणा है।

मैं आपको साक्ष्य के संदर्भ में सांख्यिकीय महत्व समझाने के लिए प्रोत्साहित करता हूं । शास्त्रीय सांख्यिकीविदों ने 0 से 1 के पैमाने पर सबूतों को एन्कोड किया है, जहां छोटे मान अधिक प्रमाण का गठन करते हैं और 0.05 वह जगह है जहां लाइन पारंपरिक रूप से खींची गई है।


सिग के विचार imo। गैर-वैज्ञानिकों के साथ रह सकते हैं; अस्वाभाविक के रूप में अक्सर जो देखा जाता है, वह तकनीकी परिभाषा है, अगर लोगों को ऐसा लगता है। जहाँ तक सबूत है, निश्चित रूप से यह सबूतों के बारे में है: सवाल यह है कि किसी एक निर्णय पर पहुंचने के लिए सांख्यिकीय रूप से सबूतों के साथ कैसे व्यवहार किया जाता है।
रोलैंडो 2

मुझे आपका आशावाद पसंद है, लेकिन मैं असहमत हूं कि यह विशिष्ट व्यक्ति के लिए स्पष्ट है कि सांख्यिकीय महत्व सभी साक्ष्य के बारे में है। मुझे लगता है कि वे इसे फ़्लिप पर किसी प्रकार के स्विच के रूप में देखते हैं जब आपका डेटा सेट काफी बड़ा हो जाता है और गणना किए गए सभी नंबर अब किसी तरह मान्य होते हैं। " आप यह दावा कर रहे हैं कि यह निर्धारित करने के लिए कि कैसे प्रमाण निर्धारित किए गए हैं, यह जानना महत्वपूर्ण है, इसलिए एक परिकल्पना के तहत गणना की जाने वाली संभावनाओं के बारे में बात करने के लिए तैयार हो जाएं, जो शायद आप नहीं मानते कि पहली जगह में सच था।
बेन ओगोरक

आह, लेकिन अगर आप सबूत के बारे में बात करते हैं, तो आप बायेसियन भूमि में प्रवेश करते हैं।
आर्थर बी।

1
मुझे नहीं लगता कि बायेसियन के पास "सबूत" (अवधारणा) है, हालांकि उन्होंने निश्चित रूप से इसे औपचारिक रूप दिया है। मेरा तर्क है कि एक छोटा सा पी-वैल्यू किसी चीज का सबूत है।
बेन ओगोरक

1

"सांख्यिकीय रूप से महत्वपूर्ण" का अर्थ है कि कुछ बस यादृच्छिक रूप से हो सकता है, लेकिन यह संभावना नहीं है। इसके बजाय, अधिक संभावना है कि किसी प्रकार का कारण है। आपको इसे अपने ग्राहक के लिए प्रासंगिक उदाहरण के साथ और अधिक ठोस बनाना चाहिए, क्योंकि यह स्पष्टीकरण बहुत सार है।

उदाहरण के लिए, यदि वकील ऐनी ने बिल की तुलना में औसतन कई अधिक मामले जीते हैं, तो यह केवल यादृच्छिक रूप से हो सकता है। हालाँकि, यदि ऐने ने सांख्यिकीय रूप से महत्वपूर्ण अधिक मामले जीते हैं, तो यह बहुत अधिक संभावना है कि ऐसा कुछ है जो यह समझाने में मदद कर सकता है कि ऐनी ने बिल से अधिक मामलों को क्यों जीता है। हम इसका कारण नहीं जानते। शायद ऐनी एक बेहतर वकील है या बिल जानबूझकर उन मामलों को चुनती है जो अधिक कठिन हैं।


0

इसे सरल और संक्षिप्त रखें!

एक पी-मान को परिणाम के रूप में या उससे अधिक चरम होने की संभावना के रूप में परिभाषित किया जाता है, जिसे हमने शून्य माना है। यदि पी-मान पर्याप्त छोटा है, तो अशक्त सही नहीं है। हम मनमाने ढंग से एक कट-ऑफ चुनते हैं, जिसे हम "छोटा पर्याप्त" (अल्फा) मानते हैं और अल्फा से नीचे आने वाले सभी पी-वैल्यू के लिए, हम अशक्त को अस्वीकार करते हैं।

मैं इसे अपने इंट्रो स्टैटस क्लास में समझाता हूं।


लेकिन क्या होगा यदि आपके पास एक प्रशंसनीय अशक्त परिकल्पना को चुनने का कोई तरीका नहीं है (यानी, लोगों के दो समूह कभी समान नहीं हैं, लेकिन आपके पास पर्याप्त जानकारी नहीं है जो मीन 1 = माध्य 2 से बेहतर कुछ भी भविष्यवाणी कर सके)? सीमाओं का उल्लेख किए बिना सांख्यिकीय महत्व की व्याख्या करना नुकसान पहुंचा सकता है।
फ्लास्क

0

मै कोशिश करुॅगा।

पहले आप औसत डेटा के आधार पर एक पी-मान की गणना करते हैं और डेटा कितना परिवर्तनशील है। अधिक चर, एक छोटा पी-मूल्य प्राप्त करने की संभावना कम है। दूसरी ओर, यदि, उदाहरण के लिए, आप दो समूहों की तुलना कर रहे हैं, तो उनमें से औसत के बीच का अंतर, पी-मान जितना छोटा होगा।

इसके अलावा, अधिक डेटा होने से डेटा की परिवर्तनशीलता को कुछ हद तक रद्द किया जा सकता है। दो औसत और समान परिवर्तनशीलता के बीच समान अंतर के साथ दो सेट डेटा का इमेजिंग। इस मामले में, बड़े नमूना आकार वाले सेट का छोटा पी-मान होगा।

परीक्षण भाग सिर्फ यह देख रहा है कि पी-मान कुछ संख्या से कम है या नहीं। आमतौर पर लोग .05 का उपयोग करते हैं, लेकिन यह मनमाना सामाजिक रिवाज है। बहुत सारे लोग सोचते हैं कि यह एक मनमाना संख्या का उपयोग करने का कोई मतलब नहीं है, फिर भी यह ऐतिहासिक कारणों से बहुत आम है।

यह भी ध्यान रखें कि सिर्फ इसलिए कि आपका महत्व परीक्षण कहता है कि दो समूहों के बीच अंतर है इसका मतलब यह नहीं है कि आप जानते हैं कि अंतर क्यों है। दूसरी ओर, यदि परीक्षण कहता है कि कोई महत्वपूर्ण अंतर नहीं है, यह सिर्फ इसलिए हो सकता है क्योंकि आपकी परिवर्तनशीलता बहुत बड़ी थी और आपके पास कम पी मान प्राप्त करने के लिए पर्याप्त डेटा नहीं था, इसका मतलब यह नहीं है कि कोई वास्तविक अंतर नहीं है।

संपादित करें:

संक्षेप में, निम्न पी मान का मतलब भविष्यवाणी के खिलाफ अधिक सबूत है:

अनुमानित परिणाम से अंतर -> डाउन पी-मूल्य

अधिक डेटा -> डाउन पी-वैल्यू

अधिक परिवर्तनशीलता -> पी-मूल्य

डाउन पी-वैल्यू का अर्थ है कि अधिक सबूत यह कहते हैं कि भविष्यवाणी झूठी है। इतिहास में हर भविष्यवाणी को कुछ दशमलव स्थान के लिए गलत दिखाया गया है।


0

सांख्यिकीय महत्व एक अवधारणा है जो किसी परिकल्पना को स्वीकार करने या अस्वीकार करने का औचित्य प्रदान करने के लिए उपयोग किया जाता है। डेटा के एक सेट को देखते हुए एक विश्लेषक आँकड़ों की गणना कर सकता है और विभिन्न चर के बीच विभिन्न संबंधों की परिमाण निर्धारित कर सकता है।

आँकड़ों का काम यह निर्धारित करना है कि क्या डेटा में पर्याप्त सबूत हैं ताकि आप यह निष्कर्ष निकाल सकें कि चर के बीच देखे गए गणना किए गए आँकड़ों या रिश्तों की व्याख्या सच्चे कथन के रूप में की जा सकती है या यदि आपके नमूना डेटा में देखे गए परिणाम केवल संयोग के कारण हैं। यह कुछ नमूना आंकड़ों का निर्धारण करके किया जाता है जो कुछ विशेषताओं को प्रदर्शित करता है यदि अशक्त परिकल्पना सही है लेकिन शून्य परिकल्पना झूठी है। अधिक प्रासंगिक नमूना सांख्यिकीय शून्य परिकल्पना के तहत अपेक्षित विशेषताओं को प्रदर्शित करने के लिए प्रकट होता है, सांख्यिकीय प्रमाण जितना मजबूत होता है कि अशक्त परिकल्पना सही है। इसी तरह, कम परिकल्पना आँकड़ा शून्य परिकल्पना के तहत अपेक्षित विशेषताओं को प्रदर्शित करने के लिए प्रकट होता है, कमजोर सांख्यिकीय प्रमाण जो शून्य परिकल्पना सही है।

नल सांख्यिकीय के तहत अपेक्षित विशेषताओं को प्रदर्शित करने वाले नमूने की मात्रा डिग्री का मामला है, लेकिन यह निष्कर्ष निकालने के लिए कि शून्य परिकल्पना को स्वीकार किया जाता है या खारिज कर दिया जाता है, कुछ मनमाना कटऑफ होना चाहिए। जैसे, एक कटऑफ मान चुना जाता है। यदि नमूना आँकड़ा कटऑफ वैल्यू के एक तरफ या उसके भीतर गिरता है, तो इसे शून्य परिकल्पना के तहत अपेक्षित विशेषताओं के अनुरूप कहा जाता है, और इस प्रकार दिए गए कटऑफ मान के लिए सांख्यिकीय रूप से महत्वपूर्ण माना जा सकता है (उदाहरण के लिए 5% अल्फा) स्तर)। यदि प्रासंगिक नमूना आँकड़ा कटऑफ मूल्य के दूसरी तरफ गिरता है, तो यह अशक्त परिकल्पना के तहत अपेक्षित विशेषताओं के अनुरूप नहीं है, और इस प्रकार परिणाम को कटऑफ मूल्य के लिए सांख्यिकीय रूप से महत्वपूर्ण नहीं माना जाता है।


लेकिन कितनी बार वास्तव में एक अलग आबादी पहले से निर्धारित है कि परिणाम लागू करने वाले हैं। आमतौर पर अध्ययन किए गए सटीक आबादी से परे परिणाम को लागू करने के लिए एक तर्क दिया जाता है, जो एक अद्वितीय नमूना था। विषयों की यह विशिष्टता कितनी है / जो कुछ भी है वह कई परिस्थितियों में अज्ञात है। एक अपवाद विनिर्माण गुणवत्ता नियंत्रण हो सकता है, लेकिन महत्व परीक्षण का उपयोग उससे कहीं अधिक व्यापक रूप से किया जाता है। मेरा मतलब केवल प्रक्रिया की सीमाओं पर जोर देना है, जो मेरी अपनी शिक्षा से छोड़े गए थे।
फ्लास्क

@Flask यह एक अच्छी बात है। मैंने अपना उत्तर संपादित करने का प्रयास किया है और इसे और अधिक सामान्य बनाने के लिए।
tjnel
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.