एक वाक्य में आँकड़ों का वर्णन कैसे करें?


27

जब मैंने पहली बार आँकड़ों को सीखना शुरू किया, तो टी-टेस्ट, एनोवा, ची-स्क्वेर्ड और लीनियर रिग्रेशन जैसी प्रक्रियाएँ बहुत अलग-अलग प्राणियों की प्रतीत हुईं। लेकिन अब मुझे एहसास है कि ये प्रक्रियाएं कमोबेश एक ही काम करती हैं। और इसी तरह, भिन्नता, अवशिष्ट, मानक त्रुटि और माध्य जैसे मान भी कमोबेश एक ही चीज को मापते हैं।

इसलिए मैं इन सभी प्रक्रियाओं और मूल्यों को मानता हूं, और वास्तव में सभी आंकड़ों को, केवल एक सरल वाक्य में वर्णित किया जा सकता है:

अपेक्षित मूल्य क्या है और इस मूल्य के आसपास क्या भिन्नता है?

अपेक्षित शब्द को इनमें से किसी भी शब्द से बदला जा सकता है: परिकल्पित, अनुमानित या केंद्रीय।

अन्य लोग एक वाक्य में आंकड़ों का वर्णन कैसे करेंगे?


10
@Trynna यह वर्णन है अब तक बहुत संकीर्ण: यह केवल बिंदु आकलन की विशेषता है। यह संख्याओं को जोड़ने और गुणा करने के रूप में गणित का वर्णन करने जैसा है - जो बहुत अच्छी तरह से किसी ऐसे व्यक्ति का दृष्टिकोण हो सकता है जिसने स्कूल में कुछ वर्षों के लिए अंकगणित का अध्ययन किया है - लेकिन इस क्षेत्र में जो भी शामिल है उससे बहुत कम गिरता है।
whuber

जवाबों:


26

आंकड़े डेटा के उत्पादन और समझने के लिए तर्क और तरीके प्रदान करते हैं।

अमेरिकी सांख्यिकीय एसोसिएशन


+1 मैं इस धारणा के बहुत करीब की अभिव्यक्ति के साथ आने की कोशिश कर रहा था। मैंने डेटा के आधार पर निष्कर्ष पर आने के बारे में कुछ जोड़ा होगा, लेकिन यह बहुत अधिक सफल नहीं है।
Glen_b -Reinstate मोनिका

3
@ ग्लेन आप बता सकते हैं कि इस चरित्र-चित्रण में बहुत कुछ सोचा गया था। मुझे हमारी साइट पर कहीं न कहीं यह पसंद है। यह, और मशीन सीखने का एक समान रूप से वर्णन, हमारे सहायता पृष्ठों में होना चाहिए।
whuber

2
मुझे यकीन नहीं है कि मैं उद्धरण से सहमत हूं (हालांकि यह एक सुंदर आकांक्षा है)। एक महामारी विज्ञानी के रूप में, मुझे पता है कि मुझे अध्ययन के डिजाइन और डेटा के उत्पादन और उसी के आसपास औचित्य के बारे में बातें पता हैं, जो मेरे आसपास के कई अच्छे सांख्यिकीविदों के केन के बाहर है। वास्तव में पुनरावर्ती कारण रेखांकन के लिए फैंसी कारण निष्कर्ष, तीन क्षेत्रों में उत्पन्न हुए हैं जिनका नाम सांख्यिकी (महामारी विज्ञान, कंप्यूटर विज्ञान और समाजशास्त्र नहीं है, जैसा कि मैं समझता हूं)। यह एक बेलिस्टिक स्पिरिट में नहीं बढ़ा रहा है, लेकिन क्योंकि उद्धृत वाक्य विज्ञान का बहुत वर्णन करता है, और प्रति से आँकड़े नीचे कील नहीं करता है
एलेक्सिस

3
एएसए विवरण मानव ज्ञान और गतिविधि के एक क्षेत्र के रूप में आंकड़ों के बारे में बहुत अधिक है, यह चिह्नित नहीं करता है कि "सांख्यिकीविद्" कौन हो सकता है। WW2 तक पेशेवर सांख्यिकीविद् दुर्लभ थे, लेकिन इसका मतलब यह नहीं है कि वाणिज्यिक और शैक्षणिक सेटिंग्स में आँकड़े लागू नहीं किए गए थे। मुझे नहीं लगता कि आंकड़ों की एक अच्छी परिभाषा पेशेवर सांख्यिकीविदों तक सीमित हो सकती है।
सिल्वरफिश

1
@ एलेक्सिस शायद "समझने" शब्द से निहित समझ के स्तर के साथ कुछ कठिनाई है , जो एएसए परिभाषा अपनी संक्षिप्तता में अस्पष्टता छोड़ती है। एक व्यापक व्याख्या अधिक शामिल हो सकती है। निश्चित रूप से अगर हम "समझ" के हिस्से के रूप में ठोस भौतिक या सामाजिक व्याख्या और अंतर्निहित तंत्र शामिल करते हैं, तो यह "मात्र" आंकड़ों से परे है। दूसरी ओर, यह मेरे लिए स्पष्ट नहीं है कि डेटा, कारण या अन्यथा से, वैज्ञानिक और सांख्यिकीय दोनों प्रयासों के डोमेन के भीतर झूठ क्यों नहीं हो सकता है।
सिल्वरफिश

13

आंकड़ों में संरचना की समझ के साथ सांख्यिकी मूल रूप से संबंधित है।

बिल वेनबल्स और ब्रायन रिप्ले, एस के साथ आधुनिक एप्लाइड सांख्यिकी के अध्याय 1 में पहला वाक्य


1
यह आंकड़ों पर एक दिलचस्प है, एक सीमित एक के बावजूद। संभावित अस्पष्टताएं खुलासा कर रही हैं: एक कंप्यूटर वैज्ञानिक गैर-सांख्यिकीय तरीके से "डेटा में संरचना" को समझेगा। (वेनबेल और रिप्ले सांख्यिकी और कंप्यूटिंग के प्रतिच्छेदन पर काम करते हैं।)
व्ह्यूबर

@ जब भी मैं आपसे सहमत हूँ। यह सुझाव देने के लिए कुछ भी नहीं है कि V & R ने इसे सभी आँकड़ों का एक-वाक्य वर्णन करने का इरादा किया है, लेकिन जब से मैंने पहली बार इसे पढ़ा है, मैंने सोचा है कि यह एक अच्छा विवरण था। मैं "डेटा में संरचना" की व्याख्या करता हूं, "उस जनसंख्या की विशेषताओं से जिसमें नमूना लिया गया था"।
mark999


8

स्वर्गीय लियो ब्रेमेन के शब्दों में:

आंकड़ों में लक्ष्य डेटा का उपयोग भविष्यवाणी करने और अंतर्निहित डेटा तंत्र के बारे में जानकारी प्राप्त करने के लिए है।

http://projecteuclid.org/euclid.ss/1009213726


5

व्यक्तिगत रूप से, मैं मौत के साथ Dicing में स्टीफन सेन के निम्नलिखित उद्धरण को पसंद करता हूं संभावना, जोखिम और स्वास्थ्य (कैम्ब्रिज यूनिवर्सिटी प्रेस, 2003)। मैंने एक वाक्य (या दो) पर प्रकाश डाला, मेरा मानना ​​है कि, उनके मुख्य बिंदु को संक्षेप में प्रस्तुत करता हूं, हालांकि पूरा पैराग्राफ पढ़ने लायक है।

आंकड़े हैं और आंकड़े हैं।
सांख्यिकी, एकवचन, लोकप्रिय धारणा के विपरीत, वास्तव में तथ्यों के बारे में नहीं है; यह इस बारे में है कि हम कैसे जानते हैं, या संदेह करते हैं, या विश्वास करते हैं, कि कुछ एक तथ्य है। क्योंकि चीजों के बारे में जानने में गिनती करना और उन्हें मापना शामिल है, तो, यह सच है, कि सांख्यिकी बहुवचन सांख्यिकी एकवचन की चिंता का हिस्सा है, जो मात्रात्मक तर्क का विज्ञान है। यह विज्ञान लेखांकन के साथ दर्शन (विशेष रूप से महामारी विज्ञान) में बहुत अधिक है। सांख्यिकीविदों को दार्शनिक लागू किया जाता है। दार्शनिक तर्क देते हैं कि सुई के सिर पर कितने स्वर्गदूत नृत्य कर सकते हैं; सांख्यिकीविदों ने उन्हें गिना । या यों कहें, गिन सकते हैं कि कितने लोग शायद नृत्य कर सकते हैं।संभावना इस मामले का दिल है, सभी मामलों का दिल अगर क्वांटम भौतिकविदों पर विश्वास किया जा सकता है। जहां तक ​​सांख्यिकीविद् का सवाल है यह सच है, चाहे दुनिया कड़ाई से निर्धारक हो, जैसा कि आइंस्टीन ने माना या क्या कोई अवशिष्ट अयोग्य अनिश्चितता है। हम निश्चितता के साथ कुछ भी नहीं कर सकते हैं, लेकिन हम भविष्यवाणी कर सकते हैं कि हमारी भविष्यवाणियां कितनी अनिश्चित होंगी, औसतन। सांख्यिकी वह विज्ञान है जो हमें बताता है कि कैसे।


5

सांख्यिकी डेटा से सीखने और मापने, नियंत्रण और अनिश्चितता का संचार करने का विज्ञान है।

मैरी डेविडियन और थॉमस लुइस

वे जारी रहे:

; और यह वैज्ञानिक और सामाजिक प्रगति के पाठ्यक्रम को नियंत्रित करने के लिए आवश्यक नेविगेशन प्रदान करता है


मुझे यह परिभाषा पसंद है क्योंकि यह "अनिश्चितता" पहलू को एकल करता है। दूसरा भाग अच्छा है क्योंकि यह कहता है कि आँकड़े केवल स्वयं ही मौजूद नहीं होते हैं, लेकिन उन्हें व्यापक संदर्भ में देखा जाना चाहिए। हालांकि पूरी तरह से संतुष्ट होने के लिए, मैं शायद एएसए एक के साथ विलय करूंगा:
मोमो

1
डेटा से सीखने और मापने, नियंत्रण, और अनिश्चितता का संचार करने के विज्ञान के रूप में आंकड़े डेटा के उत्पादन और समझने के लिए तर्क और तरीके प्रदान करते हैं।
मोमो

2

सांख्यिकी विचार के तरीकों और तरीकों का एक किटबैग है जो लोगों को शोर की जानकारी से स्पष्ट निष्कर्ष निकालने में मदद करता है।


2

चूँकि हम अनिश्चितताओं से जूझने वाले एक देवतुल्य प्राणी नहीं हैं और सांख्यिकी उस अनिश्चितता को शामिल करने और प्रतिबिंबित करने के तरीके प्रदान करती है।


2

सांख्यिकी दर्शन का एक उप-क्षेत्र है जो कठोर गणितीय अवधारणाओं का उपयोग करते हुए निम्नलिखित प्रश्न 'हम कैसे टिप्पणियों से सीखते हैं' से संबंधित है।

बस एक तरफ ध्यान दें कि आप 'एक वाक्य' बहुत लंबा कर सकते हैं, बी। हरबल द्वारा लिखित एक पुस्तक है जिसमें एक लंबा वाक्य शामिल है, देखें: आयु में उन्नत के लिए नृत्य पाठ



2

सांख्यिकी तार्किक, सटीक और प्रासंगिक तरीकों से मात्रात्मक जानकारी को सारांशित करने के लिए गणितीय तरीकों का एक सेट है।


1

मेरे अपने शब्दों में

Statistics is the science of what might be

यह जीभ-इन-गाल की तरह है


1
यदि आप पहले शब्द को मुखौटा बनाते हैं और लोगों को रिक्त स्थान भरने के लिए कहते हैं, तो मुझे संदेह है कि "आंकड़े" पहली चीज नहीं होगी जो वे साथ आते हैं - और शायद दूसरा या तीसरा नहीं, या तो। "फ्यूचुरोलॉजी," "अटकलें," "विज्ञान कथा", और हो सकता है - अपने इरादे के थोड़ा करीब हो - "भविष्यवाणी" और "पूर्वानुमान" - संभवतः लोकप्रिय विकल्प होंगे। यहां तक ​​कि "वनिरोलॉजी" और "एपोट्रोपिज्म" भी संभावनाएं होंगी। :-)
whuber

1

फिशर ( 1922 ) ने निम्नलिखित उद्धरण में आंकड़ों के सार पर अपना विचार दिया ( एक वाक्य की आवश्यकता के लिए मेरे द्वारा जोड़ा गया बोल्ड फ़ॉन्ट ):

सांख्यिकीय समस्याओं के एक अलग सूत्रीकरण पर पहुंचने के लिए, उस कार्य को परिभाषित करना आवश्यक है जिसे सांख्यिकीविद खुद निर्धारित करते हैं: संक्षेप में, और इसके सबसे ठोस रूप में, सांख्यिकीय तरीकों का उद्देश्य डेटा की कमी है । डेटा की एक मात्रा, जो आमतौर पर उसके मात्र थोक द्वारा, मन में प्रवेश करने में असमर्थ होती है, को अपेक्षाकृत कुछ मात्राओं द्वारा प्रतिस्थापित किया जाना है जो पर्याप्त रूप से पूरे का प्रतिनिधित्व करेगा, या जो, दूसरे शब्दों में, जितना संभव हो सके, आदर्श रूप में पूरे शामिल होंगे मूल डेटा में निहित प्रासंगिक जानकारी का।


0

एक परिणाम-उन्मुख (और वास्तव में वर्णनात्मक नहीं ) एक-लाइनर मेरे लिए होगा,

सांख्यिकी वह है जो मानव दुनिया को गोल बनाती है, चाहे जो भी हो प्रकृति के लिए ऐसा ही करती है।


3
क्या आप राजनीति के साथ आंकड़ों को भ्रमित कर रहे हैं? या शायद प्यार से?
whuber

@whuber (+1) नहीं, दोनों अपने ज्यादातर फैसले सांख्यिकी के आधार पर करते हैं, चाहे उन्हें इसका एहसास हो या न हो।
एलेकोस पापाडोपोलोस

2
मैं इसे अब देख सकता हूं, एक आगामी फिल्म में, जब पुरुष नेतृत्व करने के लिए अपने घुटनों पर बैठ जाता है: "बेबी, तुम मेरी UMVUE हो, क्या तुम मुझसे शादी करोगी?" :-) (आइए एक संकोचन आकलनकर्ता का उपयोग करें और हमारे गुणांक को एक साथ लाएं ...)
४:४१

@whuber (+2) ... यह "इसका एहसास नहीं है" भाग: यह ठीक उसी तरह है जैसे पुरुष नेतृत्व का अर्थ है , भले ही वह भाषा का उपयोग न करता हो! (मैंने स्वीकार किया कि मैं यहां दार्शनिक साम्राज्यवाद का दोषी हो सकता हूं)।
एलेकोस पापाडोपुलोस

2
आपकी गहरी सम्मानजनक सांस्कृतिक पृष्ठभूमि (आपका नाम और स्थान के रूप में इंफ़ॉगर एक व्यक्ति को इसका पता लगाने की अनुमति देता है), जो कि कम से कम शुरुआती सोफिस्टों को वापस ट्रेस कर सकता है, आपको उस संबंध में थोड़ा सा अक्षांश देता है। :-)
whuber

0

सांख्यिकी अनिश्चित और / या संभाव्य प्रक्रियाओं द्वारा डेटा की पीढ़ी के मॉडलिंग के लिए एक उपकरण है।


-1

सांख्यिकी डेटा को लंबे समय तक यातना देने के बारे में है जब तक कि यह कुछ भी स्वीकार नहीं करता है जिसे आप दिखाना चाहते हैं।

मैं रोनाल्ड कोसे को परास्त कर रहा हूं, लिंक देखें


-1, क्या यह गाल में जीभ के रूप में था?
गूँज - मोनिका

@gung हां और नहीं, मैं रोनाल्ड कोसे को उद्धृत कर रहा था।
व्लादिस्लाव्स डोवलगेक्स

3
यहाँ संस्करण के आधार पर , यह सबसे अच्छा एक बुरा विरोधाभास है। यह आंकड़ों का एक अच्छा 1-वाक्य सारांश नहीं है।
गूँग - मोनिका

3
@ अच्छी तरह से, ओपी ने पूछा कि विभिन्न लोग इसका वर्णन कैसे करेंगे। यह हमेशा उसका दृष्टिकोण या राय होगी। यह अलग-अलग लोगों के लिए अलग-अलग होगा। ओपी ने अलग-अलग राय आईएमएचओ को इकट्ठा करने की कोशिश की।
व्लादिस्लाव डोवगलकेस

2
xeon यह आपके जवाब को ठीक से उद्धृत करने और अटेंशन को स्रोत करने के लिए Coase के लिए एक बड़ी दया होगी।
एलेक्सिस

-2

सांख्यिकी गणितीय विज्ञान है जो आपको यह पता लगाने की अनुमति देता है कि टिप्पणियों के सेट के बीच का अंतर सिर्फ यादृच्छिक है या नहीं।


1
क्षेत्र क्या है की एक संकीर्ण सबसेट का वर्णन करता है।
रोलैंडो 2

मैं इसे अलग तरह से देखता हूं। अंततः, चाहे आप परिकल्पना परीक्षण, प्रतिगमन मॉडलिंग, या किसी भी अन्य अनुमान का आयोजन कर रहे हों, आप हमेशा मापते हैं कि आपके अनुमान बनाम भोले मॉडल के बीच का अंतर, या टिप्पणियों में अंतर सांख्यिकीय रूप से महत्वपूर्ण है या नहीं। मेरा वाक्य सांख्यिकीय महत्व के सार बनाम यादृच्छिकता को दर्शाता है। यदि अन्य सहमत हैं, तो क्या आप मुझे कुछ वोट दे सकते हैं, इसलिए मेरी टिप्पणी जो आसानी से न्यायसंगत है, उसे संकीर्णता के एक व्यक्तिपरक व्याख्या के कारण सिर्फ एक सादे गलत जवाब के रूप में नहीं माना जाता है।
सिम्पा

2
कृपया इस प्रकार के प्रश्नों पर विचार करें, जो अक्सर आंकड़ों का उपयोग करके जवाब देना चाहते हैं: इस वितरण का आकार क्या है? इन 2 चर के बीच संबंध की प्रकृति क्या है? इन कई चर को कैसे वर्गीकृत किया जा सकता है ताकि हम सामान्य मुद्दों / विषयों / विषयों / आयामों को देख सकें? इन कई मामलों को कैसे वर्गीकृत किया जा सकता है ताकि हम सामान्य प्रकार / प्रोफाइल देख सकें? कार्य-कारण की ओर एक आँख के साथ संबंधों के इस वेब का वर्णन करने का सबसे अच्छा तरीका क्या है? समय के साथ इस चर की प्रवृत्ति को क्या दर्शाता है? भविष्य के मूल्यों का पूर्वानुमान लगाने का सबसे अच्छा तरीका क्या है?
rolando2

उन मामलों में से प्रत्येक में, उन सवालों के जवाब में सांख्यिकीय महत्व का एक मजबूत तत्व है और क्या आप किसी भी आकार या रूप में देख रहे हैं, अलग-अलग है जो कि सरासर यादृच्छिकता से हो सकता है। हम में से अधिकांश के लिए एक नकारात्मक वोट का मतलब स्पष्ट रूप से गलत उत्तर है। मैं यह नहीं देखता कि मेरे उत्तर को इस तरह कैसे वर्गीकृत किया जा सकता है।
सिम्पा

1
डाउनवोट एरो पर हॉवर टेक्स्ट बताता है "यह उत्तर उपयोगी नहीं है।" मुझे यह दिलचस्प लगता है - और इसलिए अप्रयुक्त नहीं है - क्योंकि यह सोचा-समझा है, लेकिन मैंने इसे कई कारणों से नहीं उकेरा है। कि असुविधाजनक गलत धारणा है (विशेष रूप से कुछ गणितज्ञों के बीच) के करीब आता है कि आँकड़े है: पहला यह है कि आँकड़े एक "गणितीय विज्ञान" है दावा है सिर्फ गणित की एक शाखा। दूसरा यह है कि यह केवल दो-नमूना परिकल्पना परीक्षण की विशेषता है, जो आंकड़ों का एक बहुत ही संकीर्ण (यद्यपि व्यापक) भाग है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.