एक तालिका में डालने के लिए महत्वपूर्ण आंकड़ों की संख्या?


13

क्या प्रकाशित करने के लिए महत्वपूर्ण आंकड़ों की संख्या के लिए एक अच्छी तरह से स्थापित नियम है?

यहाँ कुछ विशिष्ट उदाहरण / प्रश्न दिए गए हैं:

  • क्या भिन्नता के गुणांक के लिए महत्वपूर्ण आंकड़ों की संख्या से संबंधित कोई तरीका है? उदाहरण के लिए, यदि अनुमान 12.3 है और सीवी 50% है, तो क्या इसका मतलब है कि '.3' द्वारा दर्शाई गई जानकारी शून्य है?

  • यदि एक आत्मविश्वास अंतराल में परिमाण के आदेशों की एक सीमा होती है, तो क्या उन्हें अभी भी कई महत्वपूर्ण आंकड़े चाहिए, जैसे:

    12.3 (1.2, 123.4) बनाम 12 (1.2, 120)

  • क्या एक त्रुटि अनुमान में महत्वपूर्ण आंकड़ों की संख्या एक मतलब में महत्वपूर्ण आंकड़ों की संख्या के समान या उससे कम होनी चाहिए?


यदि आप कर सकते हैं, तो एक तालिका का उपयोग न करें :) एक ग्राफिक है, आईएमओ, लगभग हमेशा एक तालिका की तुलना में पढ़ने में आसान होता है (यदि आपके पास कई नंबर नहीं हैं तो स्पष्ट अपवाद है)। पत्रिकाएँ और उनके समीक्षक हमेशा सहमत नहीं हैं, दुर्भाग्य से ....
JMS

3
@ जेएमएस गुड पॉइंट, लेकिन टेबल्स सांख्यिकीय इकाइयों की विस्तृत विशेषताओं को सारांशित करने के लिए उपयोगी होते हैं (विभिन्न कारकों द्वारा क्रॉस-क्लासिफाइड, जैसे नैदानिक ​​निदान या जो भी), विभिन्न प्रकारों के चर (निरंतर, नाममात्र और क्रमिक), और अन्य अन्य व्युत्पन्न के साथ। प्रति से सांख्यिकीय मॉडलिंग (भ्रम की स्थिति मैट्रिक्स, प्रतिगमन coef। आदि) है कि आंकड़े में फिट नहीं होगा (या हमेशा अगर आप के लिए के बारे में सोच नहीं है। दिखा रहा है। हमें दोनों की आवश्यकता है; सवाल यह है कि हमें वास्तव में टेबल, आईएमओ के बजाय एक चित्रा की आवश्यकता है।
chl

@ उची मेला। मैंने लगभग हमेशा कहा :)। बड़े एन-वे टेबल जैसी चीजें (पूरी तरह से) रेखांकन के लिए असंभव हैं। यह उस मंच पर निर्भर करता है जो मैं कहूंगा। टेबल्स को पूर्ण, सुनिश्चित होने का लाभ है, लेकिन क्या आपका पाठक वास्तव में उस अतिरिक्त जानकारी को अवशोषित करता है? यदि किसी ग्राफ़ में फिट होने के लिए बहुत सारे पैरामीटर हैं, तो मैं चाहता हूँ कि एक टेबल को पढ़ना कम से कम मुश्किल हो। हालांकि, मुझे लगता है कि पूर्ण परिणाम सुलभ होना चाहिए (ऑनलाइन, परिशिष्ट, आदि) अगर और कुछ नहीं बल्कि प्रतिलिपि प्रस्तुत करने योग्य हो। उस स्थिति में मैं भी डेटा और कोड पसंद करूंगा! भटकते हुए ओटी, सॉरी ..
JMS

मुझे यह भी लगता है कि प्रतिगमन गुणांक और भ्रम (सहसंबंध, सहसंयोजक, ...) मैट्रिसेस आमतौर पर पूर्व के लिए एक ग्राफिकल डिस्प्ले, डॉटप्लॉट या पूर्व और हीटमैप्स या ग्राफ़ के लिए बेहतर होते हैं।
JMS

@JMS मैं आपकी बात से सहमत हूं, लेकिन इस मामले में एक आंकड़ा सीमा है, कुछ अन्य मामलों में आंकड़ा शुल्क हैं। इस मामले में, यदि पाठक तालिका पर नज़र रखते हैं और प्रस्तुत किए गए आंकड़ों पर ध्यान केंद्रित करते हैं, तो वे एक गूढ़ आंकड़े के बिंदु का पता लगाने की कोशिश में समय बर्बाद नहीं करेंगे। लेकिन मैं पूरी तरह से प्रतिलिपि प्रस्तुत करने योग्यता का समर्थन करता हूं, और जब मैं इस पर होता हूं, तो मैं (यदि मैं इसके चारों ओर मिलता है) तालिका के दृश्य को उस कोड में जोड़ सकता हूं जो संलग्न है।
डेविड लेबॉउर

जवाबों:


19

मुझे संदेह है कि एक सार्वभौमिक नियम है इसलिए मैं कोई भी बनाने वाला नहीं हूं। मैं इन विचारों और उनके पीछे के कारणों को साझा कर सकता हूं:

  • जब सारांश स्वयं डेटा को प्रतिबिंबित करते हैं - अधिकतम, न्यूनतम, ऑर्डर आंकड़े, आदि ।-- पहली बार में डेटा रिकॉर्ड करने के लिए उपयोग किए जाने वाले महत्वपूर्ण आंकड़ों की समान संख्या का उपयोग करें। यह डेटा की शुद्धता से संबंधित पूरे दस्तावेज़ में एक सुसंगत प्रतिनिधित्व प्रदान करता है।

  • जब सारांश में डेटा की तुलना में अधिक सटीकता होती है, तो मूल्यों को इस तरह से लिखें जो उस अतिरिक्त परिशुद्धता को दर्शाता है । उदाहरण के लिए, मानों के माध्य में व्यक्तिगत मानों की सटीकता का गुना होता है: मोटे तौर पर, लिए एक अतिरिक्त महत्वपूर्ण आंकड़ा , लिए दो , आदि शामिल हैं। (यह लॉग -10 पैमाने पर गोल है, जाहिर है।)nn3n3030<n300

    -Note कि सीवी करता नहीं इस संबंध में उपयोगी जानकारी प्रदान करते हैं।

    -कुछ अनुमानों को बड़ी सटीकता के साथ प्राप्त किया जा सकता है। उन्हें कुछ और मैच करने के लिए गोल करने की जरूरत नहीं है। उदाहरण के लिए, 1,000,000 पूर्णांक का मतलब 0.00301 की मानक त्रुटि के साथ 10.977 हो सकता है। तीन दशमलव स्थानों (और 4-5 सिग अंजीर) पर माध्य लिखने का मेरा निर्णय एसई के परिमाण के क्रम पर आधारित था, जो अंतिम अंक को आंशिक रूप से विश्वसनीय बताता है। एसई को तीन सिग अंजीर (पांच दशमलव स्थान) लिखने का निर्णय अधिक मनमाना है: दो सिग अंजीर काम करेगा; एक शायद नहीं होगा; चार सिग अंजीर भी काम करेंगे और माध्य में 4-5 सिग अंजीर के अनुरूप होंगे; चार से अधिक सिग अंजीर ओवरकिल होगा। (डेटा के चौथे क्षण के संदर्भ में कोई भी स्वयं SE की मानक त्रुटि का अनुमान लगा सकता है, और इसका उपयोग उचित मात्रा में गोलाई निर्धारित करने के लिए कर सकता है, लेकिन हम में से अधिकांश ऐसी परेशानी में नहीं जाते हैं ...)

  • जब आप पर्याप्त गोलाई कर रहे हों तब पाठक को संकेत देंविशेष रूप से सावधान रहें जब रिपोर्ट सांख्यिकीय परीक्षण पर चर्चा कर रही हो । कारण यह है कि लोग आपके काम का उपयोग अपनी गणना की जांच करने के लिए कर सकते हैं। कभी-कभी एक मामूली अंतर भी एक त्रुटि को प्रकट कर सकता है। आप परेशानी का कारण नहीं बनना चाहते हैं क्योंकि आपने 123 से 120 और किसी और ने काम की जाँच की, 123 प्राप्त करता है और संदेह है कि आप में से एक को मिटा दिया गया है।

  • सुसंगत रहें । यदि आप एक बिंदु पर 123 के रूप में एक मूल्य को सूचीबद्ध करते हैं और बाद में इसे 120 के रूप में संदर्भित करते हैं, तो आप कुछ पाठकों को खो सकते हैं।

  • हास्यास्पद मत बनो । (मैं स्वचालित रूप से अक्षमता पर संदेह करता हूं जब मैं उन रिपोर्टों का सामना करता हूं जो 15 सिग अंजीर को सांख्यिकीय परिणाम देते हैं जब उदाहरण के लिए डेटा में केवल दो सिग अंजीर होते हैं।)


2
मेरी बहुत बड़ी +1 क्योंकि यह वास्तव में बहुत अच्छी सलाह है। उसी नस में, मैं छात्रों को यह दिखाना पसंद करता हूं कि सर्वेक्षण आकार (या वोट) से एकत्र किए गए डेटा को संक्षेप में व्यर्थ करना बहुत कुछ दशमलव के साथ नमूना आकार पर विचार किए बिना (जो मानक त्रुटि को प्रभावित करता है)।
२०:४६ पर मार्ल

0

मैं 12 (1.2, 123.4) का सुझाव दूंगा। Omit .3 चूंकि यह लगभग निरर्थक है, लेकिन बहुत से लोग जब वे देखते हैं (1.2, 120) मान लेंगे कि 120 में अंतिम '0' महत्वपूर्ण है।


यदि आप उन्हें CI में दिखाने के लिए सहमत हैं (यानी, यदि यह 12 के लिए अर्थहीन है, तो यह 123.4 के लिए क्यों मायने रखता है) के लिए एक दशमलव को छोड़ने का सुझाव क्यों देते हैं?
CHL

@chl: इसका बहुत अर्थ नहीं है, लेकिन इसे छोड़ना भ्रामक हो सकता है। अगर मैं 123.4 में डाल देता हूं, तो आप जैसा कोई व्यक्ति अतिरिक्त अंक देखेगा और उन्हें अवहेलना करेगा, कोई नुकसान नहीं हुआ। अगर मैं 120 में डालूं, तो कई पाठक सोचेंगे कि यह 3 अंकों के लिए सटीक है - बुरा।
AVB

अभी भी स्पष्ट नहीं है कि आप 123 के बजाय 123.4 की सिफारिश क्यों करते हैं (उदाहरण में क्यों .3 लेकिन नहीं ।4 उदाहरण में?)
डेविड लेबॉयर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.