एक आकलनकर्ता और एक सांख्यिकीय के बीच क्या अंतर है?


30

मैंने सीखा है कि एक आँकड़ा एक विशेषता है जिसे आप नमूनों से प्राप्त कर सकते हैं। एक ही आकार के कई नमूने लेना, उन सभी के लिए इस विशेषता की गणना करना और पीडीएफ की साजिश रचना, हमें संबंधित विशेषता का वितरण या संबंधित आंकड़ों का वितरण मिलता है।

मैंने यह भी सुना कि आँकड़े अनुमानक बनाए जाते हैं, ये दोनों अवधारणाएँ कैसे भिन्न हैं?


2
सभी उत्तर के लिए धन्यवाद ... अवधारणा अब मेरे लिए बहुत अधिक स्पष्ट है ..
gutto

जवाबों:


17

परिभाषा

विकिपीडिया से:

एक आँकड़ा [...] एक नमूने की कुछ विशेषता का एक माप है (उदाहरण के लिए, इसका अंकगणितीय माध्य मान)।

तथा

[ए] एन आकलनकर्ता अवलोकन किए गए आंकड़ों के आधार पर किसी दिए गए मात्रा के [अंतर्निहित वितरण का] अनुमान लगाने के लिए एक नियम है।

महत्वपूर्ण अंतर है:

  • एक आँकड़ा एक नमूने का एक कार्य है।
  • एक अनुमानक वितरण की कुछ मात्रा से संबंधित नमूने का एक कार्य है ।

("मात्रा" का क्या अर्थ है, नीचे अनुभाग देखें)

एक आँकड़ा एक अनुमानक नहीं है

एक अनुमानक कुछ जोड़ा के साथ एक आँकड़ा है । एक अनुमानक में एक आँकड़ा बदलने के लिए, आप बस अनुमान लगाते हैं कि आप किस लक्ष्य मात्रा का अनुमान लगाना चाहते हैं। यह भ्रामक है, क्योंकि आप सांख्यिकीय में "वास्तविक" कुछ भी नहीं जोड़ते हैं, लेकिन केवल कुछ इरादा रखते हैं।

यह देखने के लिए कि अंतर महत्वपूर्ण है, आपको यह महसूस करना होगा कि आप एक मात्र सांख्यिकीय के लिए एक अनुमानक (जैसे पूर्वाग्रह , विचरण , आदि) के गुणों की गणना नहीं कर सकते । पूर्वाग्रह की गणना करने के लिए , आपको उस मूल्य के बीच अंतर खोजना होगा जो आपके आंकड़े आपको और सच्चे मूल्य को देते हैं। केवल एक अनुमानक "सही मूल्य" के साथ आता है जो पूर्वाग्रह की गणना करने की अनुमति देता है। एक आंकड़ा डेटा का एक फ़ंक्शन है, और यह न तो सही है और न ही गलत है।

एक ही आँकड़ा के आधार पर विभिन्न अनुमानक

आप एक ही आंकड़े के लिए अलग-अलग लक्ष्य मात्राएँ निकाल सकते हैं, जिसके परिणामस्वरूप अलग-अलग अनुमानक होंगे। इस तरह के प्रत्येक अनुमानक का अपना पूर्वाग्रह होता है, हालाँकि वे सभी एक ही मूल्य (समान मूल्य) पर आधारित होते हैं।

  • आप वितरण माध्य के लिए एक अनुमानक के रूप में नमूना माध्य का उपयोग कर सकते हैं । इस अनुमानक में शून्य पूर्वाग्रह है
  • आप वितरण विचरण के लिए एक अनुमानक के रूप में नमूना माध्य का उपयोग कर सकते हैं । यह अनुमानक अधिकांश वितरणों के लिए पक्षपाती है

इसलिए "नमूना मतलब निष्पक्ष है" कहने का कोई मतलब नहीं है। नमूना माध्य निष्पक्ष है जब आप इसका उपयोग वितरण माध्य का अनुमान लगाने के लिए करते हैं। लेकिन एक ही समय में यह वितरण भिन्नता का अनुमान लगाने के लिए उपयोग करते समय पक्षपाती है।

वितरण की मात्रा और नमूनों की मात्रा

यहां मात्रा वितरण की कुछ संपत्ति को संदर्भित करती है, जो आमतौर पर अज्ञात होती है और इस तरह अनुमान लगाना पड़ता है। यह एक आंकड़े के विपरीत है , जो एक नमूने की एक संपत्ति है, उदाहरण के लिए वितरण का मतलब आपके वितरण की मात्रा है, जबकि नमूना का मतलब एक आंकड़ा (आपके नमूने की मात्रा) है।


1
इन उद्धरणों के साथ कुछ भी गलत नहीं है, लेकिन वे मुझे छोड़ देते हैं कि वास्तव में "मात्रा" का क्या मतलब है। उदाहरण के लिए, कोटेशन इस संभावना से इंकार नहीं करते हैं कि एक "मात्रा" समान डेटा पर आधारित एक और आँकड़ा है या शायद इसी तरह के डेटा के एक अलग सेट पर आधारित एक और आँकड़ा है। (उत्तरार्द्ध मामले में पहले आंकड़े किसी के रूप में इस्तेमाल किया जा सकता है भविष्यवक्ता। पूर्व के मामले मैं इसके लिए एक नाम है नहीं लगता कि में, लेकिन यह निश्चित रूप नहीं है "आकलनकर्ता।")
whuber

@whuber देखें संपादित करें। शुरू में मैं एक छोटा जवाब देना चाहता था ...:
ziggystar

संभवतः नमूना माध्य और नमूना माध्य केवल उसी अंतर्निहित मूल्य का अनुमान लगाएगा यदि वितरण वह है जहाँ माध्य = माध्य ...
स्टम्पी जो पीट

मेरी आलोचना आपके संपादन के प्रकाश में कम मायने रखती है। मैं केवल यह कह रहा था कि कई वितरणों में माध्यिका! = माध्य है, इसलिए नमूना माध्यिका और नमूना माध्य इस तरह के मामलों में एक ही मूल्य में परिवर्तित नहीं होगा (यानी, एक ही बात का अनुमान न लगाएं)।
स्टम्पी जो पीट

1
@ स्टम्पी मुझे लगता है कि आपको यहां थोड़ी गलतफहमी है। इससे कोई फर्क नहीं पड़ता कि माध्यिका और माध्य एक ही चीज़ (या किसी भी चीज़ में) में "अभिसरण" होता है। इसे स्पष्ट करने के लिए, मुझे थोड़ा हास्यास्पद होने दें: मैं, यदि मैं चाहूं , मतलब का अनुमान लगाने के लिए नमूना विचरण का उपयोग कर सकता हूं । कोई सैद्धांतिक प्रतिबंध नहीं है - और न ही ऐसा हो सकता है - जो कहता है कि मैं ऐसा नहीं कर सकता। मेरी प्रक्रिया परिभाषा के सभी हिस्सों को पूरा करती है: नमूना प्रसरण वास्तव में एक आँकड़ा है और माध्य वास्तव में अंतर्निहित वितरण की एक संपत्ति है। परिभाषाओं के लिए, यह अप्रासंगिक है कि यह (अक्सर) एक भयानक प्रक्रिया है।
whuber

15

यह धागा थोड़ा पुराना है, लेकिन ऐसा प्रतीत होता है कि विकिपीडिया ने इसकी परिभाषा बदल दी है और यदि यह सटीक है, तो यह मेरे लिए और अधिक स्पष्ट रूप से समझाता है:

एक "अनुमानक" या "बिंदु अनुमान" एक सांख्यिकीय (जो डेटा का एक फ़ंक्शन) है, जिसका उपयोग सांख्यिकीय मॉडल में एक अज्ञात पैरामीटर के मूल्य का अनुमान लगाने के लिए किया जाता है।

तो एक आँकड़ा डेटा को संदर्भित करता है और उस डेटा के साथ एक गणना। जबकि एक अनुमानक एक मॉडल में एक पैरामीटर को संदर्भित करता है।

अगर मैं इसे सही तरीके से समझूं, तो इसका मतलब एक आँकड़ा है और एक अनुमानक भी हो सकता है। नमूने का अर्थ एक आँकड़ा है (नमूने के आकार से विभाजित नमूने का योग)। एक नमूना का मतलब आबादी के औसत का एक अनुमानक भी है, यह मानते हुए कि यह सामान्य रूप से वितरित किया गया है।

मैं @whuber और अन्य लोगों से पूछूंगा जो वास्तव में इस सामान को जानते हैं यदि (नया?) विकिपीडिया उद्धरण सटीक है।


6
+1 मुझे लगता है कि आपके पास यह मूल रूप से सही है। आपको यह जानने में दिलचस्पी हो सकती है कि एक अनुमानक के लक्ष्य के लिए किसी मॉडल का विशेष रूप से "पैरामीटर" होना जरूरी नहीं है: यह मॉडल की कोई भी संपत्ति हो सकती है , जैसे कि इसके मापदंडों का एक फ़ंक्शन। उदाहरण के लिए, एक सामान्य के लिए एक पैरामीटर नहीं है ( μ , σ 2 ) मॉडल, लेकिन यह अनुमान लगाया जा सकता। μ2(μ,σ2)
whuber

5

चूँकि अन्य उत्तर यह कहते हैं कि वे एक ही आधिकारिक संदर्भ नहीं देते हैं, इसलिए मैं आपको Casella और Berger द्वारा सांख्यिकीय अनुमान पुस्तिका से दो उद्धरण देता हूं :

परिभाषा ५.२.१ चलो जनसंख्या से आकार n का एक यादृच्छिक नमूना हो और T ( x , , x n ) एक वास्तविक-मूल्यवान या वेक्टर-मूल्यवान फ़ंक्शन हो जिसके डोमेन में नमूना स्थान शामिल है का ( X 1 , , X n ) । फिर रैंडम वैरिएबल या रैंडम वेक्टर Y = T ( X 1 , , X n ) कहलाता हैX1,,XnnT(x1,,xn)(X1,,Xn)Y=T(X1,,Xn)आँकड़ा । आँकड़ों की संभावना वितरण कहा जाता है के नमूने वितरण वाईYY

तथा

परिभाषा 7.1.1 एक बिंदु आकलनकर्ता नमूने के किसी भी कार्य है; वह है, कोई भी आँकड़ा एक बिंदु आकलनकर्ता है।W(X1,,Xn)

मैं यहाँ यह नहीं कह रहा हूँ कि यह प्रश्न का निश्चित उत्तर है, क्योंकि मैं दो सबसे उत्तोलित उत्तरों से सहमत हूँ जो यह सुझाव देते हैं कि एक अंतर है, बस एक संदर्भ दे रहा है जो विपरीत को उजागर करने के लिए कहता है कि यह कोई नहीं है स्पष्ट-कट मामला।


4

(XX)1XY

एक अच्छा टीए ने एक बार मुझे इस तरह से एक अनुमानक की अवधारणा को समझाया।

मूल रूप से, एक अनुमानक एक ऐसी चीज है जो आप उस मात्रा को प्राप्त करने के लिए डेटा पर लागू करते हैं जिसे आप का मूल्य नहीं जानते हैं। आप एक आंकड़े का मूल्य जानते हैं - यह डेटा का एक फ़ंक्शन है जिसके बारे में कोई "सर्वश्रेष्ठ" या "इष्टतम" नहीं है। कोई "सर्वश्रेष्ठ" मतलब नहीं है। बस एक मतलब है।

मान लें कि आपके पास प्रति व्यक्ति बकरियों की संख्या और प्रत्येक व्यक्ति की खुशी पर एक डेटासेट है। आप इस बात में रुचि रखते हैं कि बकरियों की संख्या के साथ लोगों की खुशी कैसे बदलती है। एक अनुमानक आपके डेटा से उस रिश्ते का अनुमान लगाने में आपकी मदद कर सकता है। आँकड़े आपके पास मौजूद डेटा के केवल कार्य हैं। उदाहरण के लिए, बकरी के स्वामित्व का विचरण बराबर हो सकता है। विचरण की गणना के लिए ते फॉरुला बकरियों और टोस्टर के बीच समान होगा, या आप कैंसर को पाने के लिए खुशी या प्रवृत्ति में रुचि रखते हैं या नहीं। उस अर्थ में, सभी समझदार अनुमानक आँकड़े हैं।


3

दिलचस्प सवाल। हालांकि अनुमानकर्ताओं और आंकड़ों को अलग-अलग चीजें होने की जरूरत नहीं है। वे विभिन्न अवधारणाएं हैं।

एक आँकड़ा एक फ़ंक्शन (व्यापक शब्दों में) है जिसमें इनपुट (सांख्यिकीय) डेटा है। प्रभाव यह है कि आप इस आंकड़े से, आमतौर पर एक संख्या प्राप्त करते हैं। अधिक सार शब्द में, एक आंकड़े में एक से अधिक संख्या हो सकती है। आंकड़ा डेटा पर निर्भर करता है, लेकिन प्रक्रिया नियतात्मक है। तो आँकड़ा यह हो सकता है: "सभी संख्याओं को गिनें और गिनती द्वारा विभाजित करें" या, व्यापक अर्थ में "जीडीपी डेटा लें और उस पर एक रिपोर्ट तैयार करें"।
सांख्यिकीय अर्थ में हम निश्चित रूप से एक गणितीय कार्य के बारे में एक सांख्यिकीय के रूप में बात कर रहे हैं।

इसका महत्व यह है कि यदि आप उस डेटा के गुणों को जानते हैं जिसे आप इनपुट करते हैं (उदाहरण के लिए यह एक यादृच्छिक चर मधुमक्खी का), तो आप अपने आंकड़ों के गुणों की गणना कर सकते हैं, वास्तव में अनुभवजन्य डेटा में डाले बिना।

अनुमानक अनुमानक हैं क्योंकि आप इरादे से हैं: एक संपत्ति का अनुमान लगाने के लिए। जैसा कि यह पता चला है, कुछ आँकड़े अच्छे अनुमानक हैं।
उदाहरण के लिए यदि आप डेटा बिंदुओं को आईड चर के एक पूल से बाहर खींचते हैं, तो अंकगणित का अर्थ है - आपके द्वारा खींचे गए डेटा के आधार पर, उस वितरण के अपेक्षित मूल्य के लिए एक अच्छा अनुमानक होगा । लेकिन फिर एक चीज जो अनुमान पैदा करती है, वह एक अनुमानक है।

व्यवहार में, आपके द्वारा उपयोग किए जाने वाले अनुमानक आंकड़े होंगे, लेकिन ऐसे आंकड़े हैं जो अनुमानक नहीं हैं। उदाहरण के लिए परीक्षण-आँकड़े - हालांकि कोई इस कथन के शब्दार्थ के बारे में बहस कर सकता है और मामले को बदतर बनाने के लिए, एक परीक्षण सांख्यिकीय न केवल हो सकता है, बल्कि इसमें अनुमानक भी शामिल हो सकते हैं। हालांकि वैचारिक रूप से ऐसा नहीं है।

और निश्चित रूप से आपके पास अनुमानक हो सकते हैं जो आंकड़े नहीं हैं, हालांकि वे अनुमान लगाने में बहुत अच्छे नहीं हैं।


1
क्या आप उस अंतिम वाक्य पर थोड़ा विस्तार कर सकते हैं? उदाहरण के लिए, आकार के एक आइडी नमूने पर विचार करें2n। मैं जनसंख्या के मध्यमान का अनुमान लगाऊंगा कि किस सिक्के को चुनने के लिए फ्लिप का उपयोग किया जाएnध और n+1नमूने में सेंट सबसे बड़ा मूल्य। अपनी परिभाषा के अनुसार यह एक आंकड़ा है, क्योंकि यह एक "नियतात्मक" प्रक्रिया नहीं है (हालांकि यह नहीं है है एक आंकड़ा एक आम अधिक सामान्य परिभाषा के अनुसार)। यह एक बहुत अच्छा अनुमानक भी है। इसलिए मैं सोच रहा हूं कि जब आप किसी "अनुमानक" का उल्लेख करते हैं तो आपके मन में किस प्रकार की वस्तु है, जो "आँकड़ा" नहीं है।
whuber

हाँ, मैं तर्क दूंगा कि "एक मूल्य चुनना" नियतात्मक आँकड़ा है और पहले से जो कुछ भी चुना गया है, उसके संशोधन से संबंधित है। फिर से "प्रक्रिया" के बाद से यदि आप करेंगे - निर्धारक है तो मैं सांख्यिकीय के रूप में मेरी परिभाषा में इस तरह के स्टोकेस्टिक तत्वों को अनुमति दे सकता है ... संकेत है कि अनुमान लगाने वाले जो एक आँकड़ा नहीं हैं कम से कम वे हो सकते हैं जो किसी भी डेटा से स्वतंत्र हैं। उदाहरण के लिए नीचे दिए गए उत्तर में "6" संख्या। कृपया ध्यान दें कि मैंने यह नहीं कहा कि गैर-सांख्यिकीय अनुमानक आवश्यक रूप से खराब हैं।
आईएमए

1
मुझे लगता है कि शायद आप बहुत अधिक बारीक भेद कर रहे हैं जो अनावश्यक हैं और अंत में, आपके प्रदर्शन को जटिल करते हैं। उदाहरण के लिए, "1/2" एक बर्नौली चर के पैरामीटर का एक बड़ा अनुमानक है (यह द्विघात हानि के लिए न्यूनतम है), इसलिए इसे केवल इसलिए नियमबद्ध करना शर्म की बात होगी क्योंकि यह डेटा से स्वतंत्र है। (यह यूक्लिडियन ज्यामिति में आयतों के उदाहरण के रूप में वर्गों को सत्तारूढ़ करने के लिए अनुरूप होगा: आप ऐसा कर सकते हैं, लेकिन फिर आयतों के गुणों के विषय में अधिकांश कथनों की लंबाई दोगुनी होगी।) यह इसी तरह यादृच्छिक आँकड़ों को बाहर निकालने में मदद नहीं करता है।
whuber

मुझे नहीं लगता कि हम वास्तव में एक ही चीज के बारे में बात कर रहे हैं। मैं कुछ भी कहां से करूं? यदि एक-आधा एक महान अनुमानक है, तो यह एक ऐसा मामला है जहां यह है। मुझे नहीं लगता कि आंकड़ों का मधुमक्खी पालन न करने वाले अधिकांश संभावित अनुमानक बहुत महान हैं। बर्नौली चर के लिए "1/2" अच्छा है। लेकिन -क्वाइट- "एक वास्तविक संख्या" वर्ग के कुछ अन्य अनुमानक बहुत अच्छे नहीं हैं, क्या आप सहमत नहीं होंगे? डेटा के आधार पर अभी भी रैंडमाइज्ड आंकड़ों की बात पर- मैंने इसे खारिज नहीं किया क्योंकि मैं अभी भी कहूंगा कि आपको एक नियतकालिक प्रक्रिया की आवश्यकता होगी। लेकिन मैंने स्वीकार किया कि मुझे इसे ऊपर जोड़ना चाहिए।
IMA

2

मुझे लगता है कि एक नमूना क्या है, इसके बारे में बेहतर समझ है ।

[Updated: Sample is a very broad concept, I was talking about "the random sample" . I don't know whether an estimator makes sense or not when the sample is not random.]

from wikipedia:

A random sample is defined as a sample where each individual member of the population has a known, non-zero chance of being selected as part of the sample.

An estimator is a function of a sample. A sample is actually a set of (say, n) i.i.d. random variables. That means an estimator is also a function of random variables. An estimator defines a measurement, but not the values of an actual measurement. But we can call it, "the rule for estimating a given quantity based on observed data." Because based on n specific experiments, we can have n specific values for the n i.i.d. random variables. And we get a specific value of the size-n sample.

We replace the sample in the estimator by the value of the sample. We get a value of the estimator, this is a specific measure. And this specific measure is a statistic.

(Check this link for the definition of an estimator, the last sentence reveals why we are always confused.)


1

The Goal of This Piece of Writing:

What I want to do here is to provide you with the similarities and differences between the two intimately related concepts called "statistic" and "estimator". However, I do not want to go through the differences between a parameter and a statistic, which I assume is clear enough to everyone who is struggling with the differences between a statistic and an estimator. If it is not the case for you, you need to study earlier posts first, and then start studying this post.

Relationship:

Basically, any real-valued function of observable random variables in a sample is called a statistic. There are some statistics that if they are well designed, and have some good properties (e.g. consistency, ... ), they can be used to estimate the parameters of the underlying distribution of the population. Therefore, statistics are a large set, and estimators are a subset inside the set of statistics. Hence, every estimator is a statistic, but not every statistic is an estimator.

Similarities:

Speaking of the similarities, as mentioned earlier, both are functions of random variables. In addition, both have distributions called "sampling distributions."

Differences:

Speaking of the differences, they are different in terms of their goals and tasks. The goals and tasks of a statistic could be summarizing the information in a sample (by using sufficient statistics), and sometimes doing hypothesis test, etc. In contrast, the primary goal and task of an estimator, as its name implies, is to estimate the parameters of the population being studied. It is important to mention that there are a wide variety of estimators, each of which has its own computational logic behind, such as MOMEs, MLEs, OLS estimators and so on. Another difference between these two concepts has to do with their desired properties. While one of the most desired properties of a statistic is "sufficiency", the desired properties of an estimator are things like "consistency", "unbiasedness", "precision", etc.

Caution:

Therefore, you need to be careful about using terminology correctly when dealing with statistics and estimators. For instance, it does not make much sense to talk about the biasedness of a mere statistic, which is by no means an estimator, because there is no parameter involved in such a context in order for us to be able to calculate the bias, and talk about it. Thus, you need to be careful about the terminology!

The Bottom Line:

To sum up, any function of observable random variables in a sample is a statistic. If a statistic has capability to estimate a parameter of a population, then we call it an estimator (of the parameter of interest). However, there are some statistics that are not designed to estimate parameters, so these statistics are not estimators, and here we call them "mere statistics".

What I offered above is the way I look at and think of these two concepts, and I tried my best to put it in simple words. I hope it helps!


0

New answer to an old Q:

Definition 1. A statistic is a function that maps each sample to a real number.

Every estimator is a statistic.

But we tend to call only those statistics that are used to generate estimates ("guesses") some parameter an estimator.

So for example, the t-statistic and the sample mean are BOTH statistics. The sample mean is also an estimator (because we often use it to estimate the true population mean).

In contrast, we rarely/never call the t-statistic an estimator, because we rarely/never use it to estimate any parameter.

In the example below, P is a statistic, but not an estimator. While Q is both a statistic and an estimator.

Example_

Suppose our parameter-of-interest is the average outcome θ of a die-roll.

θ is some fixed real number that is perhaps known only to God. Nonetheless, we can try to estimate it.

Here's one possible method. We roll a die 3 times.

A sample is any s=(x1,x2,x3), where x1 is the outcome of the first roll, x2 that of the second, and x3 that of the third.

Here are three examples of samples: s1=(5,4,1), s2=(4,1,6), and s3=(6,3,2).

Here are two examples of statistics P and Q (remember that a statistic is simply a function). Define P and Q by: For any s=(x1,x2,x3),

P(s)=x1ln(x2+x3),
Q(s)=x1+x2+x33.

The statistic P is a rather-bizarre statistic and is probably not very useful for anything. Nonetheless, it is a statistic all the same, simply because it satisfies the definition of a statistic (it is a function that maps each sample to a real number).

Q is also a statistic. But in addition, it is also an estimator for the parameter θ.

(We could, of course, claim that P is also an estimator for θ. But it would be a very poor estimator that no one would want to use.)


1
This answer is headed in a good direction. "Definition 2," though, does not appear to be a valid definition, because of its circularity (it defines "estimator" in terms of "estimate" without explaining the latter). For it to be effective you need to explain what an "estimate of a parameter" is in sufficient detail and clarity that people can formulate quantitative measurements of how well an estimator works.
whuber

@whuber: I'm trying to keep it simple. A parameter is any real number (e.g. the average outcome θ of a die roll). Informally, an estimate for a parameter is simply a "guess" of what a parameter is. An estimate is thus simply also a real number. (E.g., an estimate of θ is 5.) // The question of "how to formulate quantitative measurements of how well an estimator works" is entirely distinct from the simpler and more basic question of the distinction between a statistic and an estimator. Which is the question here.
Kenny LJ

2
Unfortunately, as I was trying to suggest, something essential seems to have been lost in the simplification, because your second definition does not distinguish an estimator from any other statistic at all.
whuber

@whuber: That's right. Formally, an estimator is simply a statistic. But we tend to use the word "estimator" to refer to a statistic if that statistic is used to estimate some parameter-of-interest. I have edited my answer to clarify this point.
Kenny LJ

-3

In hypothesis testing :

A test-statistic is about hypothesis testing. A test-statistic is a random variable given/under the null hypothesis. Now, some may call a statistic the value/measure of the test-statistic given the sample.

With these two you can get the p-value which is a measure that helps to reject or not reject the null hypothesis. All in all, a statistic is an estimation of how far/close to your hypothesis.

This link may be useful.


2
You seem to be addressing a different question, something related to hypothesis tests rather than estimation. Your definition of "statistic" is much more restricted in scope than standard definitions are: statistics apply to all forms of decision making, not just the very limited cases of hypothesis testing and null hypotheses. Moreover, hypothesis tests are not the same as estimators and most statistics are not used as estimators of nearness to some hypothesis.
whuber

I wouldn't say it's a different question. It gives a picture about what it is in the context of hypothesis testing at least!
dfhgfh

2
Because this answer focuses on a limited and specialized version of the question and uses the key terms "estimator" and "statistic" in unconventional ways, without alerting the reader to that fact, I worry that it may mislead or confuse people.
whuber

I thought Hypothesis testing was far to be a limited and specialized field of statistics.
dfhgfh
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.