वर्णनात्मक और विभेदक आंकड़ों के बीच अंतर क्या है?


21

मेरी समझ यह थी कि वर्णनात्मक आँकड़े मात्रात्मक रूप से एक डेटा सैंपल की विशेषताओं का वर्णन करते थे, जबकि हीन सांख्यिकी आँकड़ों के बारे में अनुमान लगाते थे जिनसे नमूने लिए गए थे।

हालाँकि, सांख्यिकीय अनुमान के लिए विकिपीडिया पृष्ठ :

अधिकांश भाग के लिए, सांख्यिकीय निष्कर्ष जनसंख्या के बारे में प्रस्ताव बनाता है, जो कि यादृच्छिक नमूनाकरण के कुछ प्रकार के माध्यम से ब्याज की आबादी से खींचा गया डेटा है।

"अधिकांश भाग के लिए" ने मुझे लगता है कि मैं शायद इन अवधारणाओं को ठीक से नहीं समझता। क्या हीन सांख्यिकी के उदाहरण हैं जो आबादी के बारे में प्रस्ताव नहीं बनाते हैं?


वर्णनात्मक आँकड़े: एक सिक्का दस बार उछाला गया और छह बार नीचे आया। सांख्यिकीय अनुमान: प्रमुखों की संभावना का अधिकतम अनुमान अनुमान , या, यह जानकारी इस परिकल्पना को खारिज करने के लिए अपर्याप्त है कि सिक्का एक उचित सिक्का है। 0.6
दिलीप सरवटे

2
"जनसंख्या" की अवधारणा के बिना इंजेक्शन: मान लें कि आपके डेटा कुछ (आंशिक रूप से) अज्ञात यादृच्छिक तंत्र / नियम द्वारा उत्पन्न होते हैं। अव्यवस्थित तरीके डेटा के आधार पर इस तंत्र के गुणों का आकलन करने की अनुमति देते हैं। उदाहरण: आप परिणामों के आधार पर एक विद्युत-भौतिक सूत्र को सत्यापित करना चाहते हैं जिसे केवल लगभग या अपूर्ण परिस्थितियों में मापा जा सकता है।
माइकल एम

1
@ मिचेल: हाँ; या वास्तव में कर प्रयोगात्मक उपचार के यादृच्छिक असाइनमेंट - अपने डेटा एक ज्ञात यादृच्छिक तंत्र द्वारा उत्पन्न किया जा।
Scortchi - को पुनः स्थापित मोनिका

जवाबों:


19

एक व्यवहार विज्ञान पृष्ठभूमि से आने वाले, मैं इस शब्दावली को विशेष रूप से परिचयात्मक सांख्यिकी पाठ्यपुस्तकों के साथ जोड़ता हूं। इस संदर्भ में भेद यह है कि:

  • वर्णनात्मक आँकड़े नमूना डेटा के कार्य हैं जो डेटा की कुछ विशेषता का वर्णन करने में आंतरिक रूप से दिलचस्प हैं। क्लासिक वर्णनात्मक आंकड़ों में माध्य, न्यूनतम, अधिकतम, मानक विचलन, माध्यिका, तिरछा, कुर्तोसिस शामिल हैं।
  • इंफ़रेंशियल आँकड़े नमूना डेटा का एक फ़ंक्शन है जो आपको जनसंख्या पैरामीटर के बारे में एक परिकल्पना के बारे में एक निष्कर्ष निकालने के लिए सहायता करता है। क्लासिक हीनता के आँकड़ों में z, t, , F-ratio आदि शामिल हैंχ2

महत्वपूर्ण बिंदु यह है कि कोई भी आँकड़ा, अनुमानात्मक या वर्णनात्मक, नमूना डेटा का एक कार्य है। एक पैरामीटर आबादी का एक फ़ंक्शन है, जहां शब्द की आबादी अंतर्निहित डेटा जनरेट करने की प्रक्रिया के समान है।

इस दृष्टिकोण से एक वर्णनात्मक या हीन सांख्यिकी के रूप में डेटा के दिए गए फ़ंक्शन की स्थिति उस उद्देश्य पर निर्भर करती है जिसके लिए आप इसका उपयोग कर रहे हैं।

उस ने कहा, कुछ आंकड़े स्पष्ट रूप से डेटा की प्रासंगिक विशेषताओं का वर्णन करने में अधिक उपयोगी हैं, और कुछ अच्छी तरह से सहायता के संदर्भ में अनुकूल हैं।

  • अव्यवहारिक आँकड़े: किसी दिए गए डेटा जनरेट करने की प्रक्रिया के लिए टी और जेड जैसे मानक परीक्षण आँकड़े, जहाँ अशक्त परिकल्पना झूठी है, अपेक्षित मूल्य नमूना आकार से बहुत प्रभावित होता है। अधिकांश शोधकर्ता इस तरह के आँकड़े को आंतरिक हित के जनसंख्या पैरामीटर के आकलन के रूप में नहीं देखेंगे।
  • वर्णनात्मक आँकड़े : इसके विपरीत वर्णनात्मक आँकड़े जनसंख्या मापदंडों का अनुमान लगाते हैं जो आमतौर पर आंतरिक हित के होते हैं। उदाहरण के लिए नमूना माध्य और मानक विचलन बराबर जनसंख्या मापदंडों के अनुमान प्रदान करते हैं। यहां तक ​​कि न्यूनतम और अधिकतम जैसे वर्णनात्मक आँकड़े समकक्ष या समान जनसंख्या मापदंडों के बारे में जानकारी प्रदान करते हैं, हालांकि इस मामले में, बहुत अधिक देखभाल की आवश्यकता होती है। इसके अलावा, कई वर्णनात्मक आँकड़े पक्षपाती हो सकते हैं या अन्यथा आदर्श अनुमानकर्ताओं से कम हो सकते हैं। हालांकि, ब्याज की जनसंख्या पैरामीटर का आकलन करने में उनकी अभी भी कुछ उपयोगिता है।

तो इस दृष्टिकोण से, समझने के लिए महत्वपूर्ण बातें हैं:

  • आँकड़ा : नमूना डेटा का कार्य
  • पैरामीटर : जनसंख्या का कार्य (डेटा जनरेट करने की प्रक्रिया)
  • अनुमानक : एक पैरामीटर का अनुमान प्रदान करने के लिए उपयोग किए गए नमूना डेटा का कार्य
  • निष्कर्ष : एक पैरामीटर के बारे में किसी निष्कर्ष पर पहुंचने की प्रक्रिया

इस प्रकार, आप या तो सांख्यिकीय का उपयोग करते हुए शोधकर्ता के इरादे के आधार पर वर्णनात्मक और हीनता के बीच के अंतर को परिभाषित कर सकते हैं, या आप आमतौर पर कैसे उपयोग किया जाता है, इसके आधार पर एक आँकड़ा को परिभाषित कर सकते हैं।


टी-एफ स्कोर (उदाहरण के लिए टी- टेस्ट के बजाय ) हीन आँकड़ों को कॉल करना कैसे उचित है ?
जोना

@ जोना टी-स्कोर "स्टेटिस्टिक" है जिसका उपयोग टी-टेस्ट में किया जाता है, इसलिए जब कोई ऐसी हीन प्रक्रिया का हिस्सा होता है, तो टी-स्कोर को हीन सांख्यिकी के रूप में वर्णित कर सकता है। मुझे लगता है कि मैंने इस धारणा के साथ शुरुआत की है कि एक आंकड़ा डेटा का एक फ़ंक्शन है। लेकिन शायद आप इस बात की ओर संकेत कर रहे हैं कि हम अक्सर अनुमान लगाने वाले आँकड़ों के बारे में सोचते हैं क्योंकि तकनीक का व्यापक सेट किसके लिए इस्तेमाल किया जाता है?
जेरोमे एंग्लीम

मुझे इसे अलग तरह से वाक्यांशित करना है - एक टी-स्टेटिस्टिक नमूना का विवरण नहीं है, बल्कि एक हीनतापूर्ण कथन (जैसे कि पी-मान) के बजाय?
जोना

ठीक है, डेटा का एक फ़ंक्शन एक नमूने के विवरण के बराबर है। मुझे लगता है कि मैं सोच रहा था कि इस तरह के आँकड़े एक हीन प्रक्रिया में उपयोग किए जाते हैं (उदाहरण के लिए, शोधकर्ता पी-मूल्य प्राप्त करने के लिए टी-वितरण के लिए टी-स्टेटिस्टिक से संबंधित हैं और फिर एक अनुमान बनाने के लिए पी से अल्फा से संबंधित हैं)। मैंने अक्सर देखा है कि पाठ्यपुस्तकें इन उदाहरणों का उपयोग करती हैं। लेकिन मुझे लगता है कि पी-वैल्यू और बाइनरी इंट्रेंस को आंकड़ों के रूप में देखा जा सकता है (यानी, नमूना डेटा के कार्य)। और द्विआधारी निष्कर्ष को ही सबसे स्पष्ट रूप से प्रवेश के रूप में देखा जा सकता है। क्या आपको यही मिल रहा है?
जेरोमे एंग्लीम

1
इसलिए, उदाहरण के लिए, आप डेटा का उपयोग उस t से प्राप्त करने के लिए करते हैं जो एक वितरण से संबंधित है, जो आपको p देता है , जो बदले में एक जनसंख्या पैरामीटर के बारे में एक द्विआधारी निष्कर्ष निकालता है। तो एक अतिवादी दृष्टिकोण से, टी, पी, और बाइनरी इनवेंशन सभी यादृच्छिक चर हैं। सभी हीन प्रक्रिया में शामिल थे। मुझे यकीन नहीं है कि पेशेवरों और विपक्षों को सभी या केवल कुछ ऐसे आँकड़ों को लेबल करने की आवश्यकता है जो हीनतापूर्ण हैं।
जेरोमे एंग्लीम

8

अनुमान का एक रूप प्रायोगिक उपचारों के यादृच्छिक असाइनमेंट पर आधारित है, और जनसंख्या से यादृच्छिक नमूनाकरण पर नहीं (यहां तक ​​कि काल्पनिक रूप से)। ऑस्कर केम्पथोर्न एक प्रस्तावक थे।

बीटीटी10/252=0.04

भविष्यवाणी एक और क्षेत्र है जहाँ आप जरूरी नहीं कि आबादी के बारे में प्रस्ताव तैयार कर रहे हों। (मुझे नहीं पता है कि हर कोई भविष्यवाणी "अनुमान" को कॉल करना चाहेगा, लेकिन वहां गीजर (1993), प्रिडिक्टिव इन्वेंटरी: एन इंट्रोडक्शन )। अक्सर भविष्यवाणी एक फिटेड जनसंख्या मॉडल से होती है, लेकिन हमेशा नहीं; उदाहरण के लिए @ मैट का वर्गीकरण उदाहरण, मॉडल औसत (बायसीयन या एकाइक वज़न पर आधारित), या घातांक चौरसाई जैसे पूर्वानुमान एल्गोरिदम।

एनबी मुझे लगता है कि "अनुमानात्मक बनाम वर्णनात्मक आँकड़े" अधिक बार अनुशासन सांख्यिकी को संदर्भित करता है, बजाय नमूनों से गणना की गई मात्रा के। हीन और वर्णनात्मक सांख्यिकीय के बीच कोई आवश्यक अंतर नहीं है; जैसा कि @ जेरेमी ने बताया है, यह बात है कि आप इसे किस उपयोग में ला रहे हैं।


2

मुझे यकीन नहीं है कि वर्गीकरण जरूरी जनसंख्या (नों) के बारे में एक बयान देता है जिससे डेटा बिंदु खींचे जाते हैं। वर्गीकरण, जैसा कि आप शायद जानते हैं, प्रशिक्षण डेटा का उपयोग करता है जिसमें कुछ "फ़ीचर" वैक्टर शामिल होते हैं, प्रत्येक को एक विशिष्ट वर्ग के साथ लेबल किया जाता है, ताकि अन्य अनलेब किए गए फ़ीचर वैक्टर से संबंधित क्लास लेबल का अनुमान लगाया जा सके। उदाहरण के लिए, हम यह अनुमान लगाने के लिए रोगी के महत्वपूर्ण संकेतों और एक चिकित्सक के निदान का उपयोग कर सकते हैं कि क्या अन्य रोगी स्वस्थ हैं या बीमार हैं।

पी(कक्षा=सी|विशेषताएं)सी

हालांकि, अन्य क्लासिफायर खुद कक्षाओं को मॉडलिंग किए बिना कक्षाओं के बीच अंतर की तलाश करते हैं; इन्हें विभेदक वर्गीकरण कहा जाता है। एक क्लासिक उदाहरण निकटतम पड़ोसी क्लासिफायर है, जो अपने निकटतम पड़ोसी के वर्ग के लिए एक गैर-सूचीबद्ध उदाहरण प्रदान करता है (जहां समस्या के लिए कुछ समझदार तरीके से करीब परिभाषित किया गया है)। ऐसा नहीं लगता है कि इसमें बहुत कुछ है, यदि कोई हो, तो आबादी के बारे में जानकारी जिसमें से डेटा बिंदु खींचे गए थे।

टी


0

एक पंक्ति में, डेटा को देखते हुए, वर्णनात्मक आंकड़े आपके डेटा की सामग्री को न्यूनतम नुकसान की जानकारी (आप किस उपाय का उपयोग करते हैं) के आधार पर संक्षेप में प्रस्तुत करने का प्रयास करते हैं। आपको डेटा का भूगोल देखने को मिलता है। (कुछ इस तरह, कक्षा का प्रदर्शन ग्राफ देखें और कहें कि कौन शीर्ष पर है, नीचे और इतने पर)

एक पंक्ति में, डेटा को देखते हुए, आप अनुमान लगाने की कोशिश करते हैं और उस काल्पनिक आबादी के गुणों का पता लगाते हैं जहां से डेटा आता है। (कुछ ऐसा है, कक्षा से अच्छे नमूने के माध्यम से 7 वीं कक्षा के छात्रों को समझना, यह मानते हुए कि अंतर्निहित आबादी इतनी बड़ी है कि आप उन्हें समग्रता में ध्यान में नहीं रख सकते हैं)


3
मुझे नहीं लगता कि यह वर्णनात्मक आंकड़ों की एक परिभाषा या लक्षण वर्णन है जिसका उद्देश्य वे सूचना के न्यूनतम नुकसान के लिए हैं। यह पूरी तरह से वर्णनात्मक आंकड़े रखना संभव है जो वास्तव में महत्वपूर्ण विवरण छोड़ते हैं और यह अक्सर एक समस्या है।
निक कॉक्स

0

संक्षेप में

वर्णनात्मक आँकड़े डेटा का विश्लेषण है जो डेटा को सार्थक में वर्णन, प्रदर्शित या सारांशित करता है; यह हमारे डेटा / पूरी आबादी के बारे में बात करने का एक तरीका है। उनमें से कुछ केंद्रीय प्रवृत्ति के उपाय और फैलाव के उपाय हैं

अवर आँकड़ों की तकनीक है जो हमें नमूनों को आबादी के बारे में सामान्यीकरण करने के लिए नमूनों का उपयोग करने की अनुमति देती है जिससे नमूने खींचे गए थे। परिकल्पना परीक्षण और


0

वर्णनात्मक आँकड़े डेटा का विश्लेषण है जो किसी सार्थक डेटा का वर्णन, प्रदर्शन या सारांश करता है; यह हमारे डेटा / पूरी आबादी के बारे में बात करने का एक तरीका है। उनमें से कुछ केंद्रीय प्रवृत्ति के उपाय और फैलाव के उपाय हैं

हीनतापूर्ण तकनीक वह तकनीक है जो हमें उन आबादी के बारे में सामान्यीकरण करने के लिए नमूनों का उपयोग करने की अनुमति देती है जिनसे नमूने खींचे गए थे। इस परिकल्पना का परीक्षण करें और इस उत्तर को साझा करें


वेलिडेट पार करने के लिए आपका स्वागत है ! कृपया हमारे दौरे को देखने के लिए कुछ समय लें । ऐसा लगता है कि आप एक अच्छा जवाब खत्म करने वाले थे, लेकिन कुछ हुआ। अपने विचार को पूरा करने के लिए अपने उत्तर को संपादित करने के लिए स्वतंत्र महसूस करें। आप अपने उत्तर को उद्धरणों / संदर्भों में जोड़कर अपने उत्तर को बेहतर बनाना चाहते हैं, जो आपके द्वारा यहां रखे गए सहयोग करते हैं। आपको इस प्रश्न का उत्तर देने की भी आवश्यकता है "क्या अनुमान आंकड़ों के उदाहरण हैं जो आबादी के बारे में प्रस्ताव नहीं बनाते हैं?"
तावरोक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.