आकलनकर्ता और अनुमान के बीच क्या संबंध है?


21

आकलनकर्ता और अनुमान के बीच क्या संबंध है?


5
"आंकड़ों में, एक अनुमानक प्रेक्षित डेटा के आधार पर किसी दिए गए मात्रा के अनुमान की गणना करने के लिए एक नियम है: इस प्रकार नियम और इसके परिणाम (अनुमान) को प्रतिष्ठित किया जाता है।" (विकिपीडिया लेख की पहली पंक्ति en.wikipedia.org/wiki/Estimator )।
whuber

+1 मैं इस प्रश्न को बढ़ा रहा हूं (स्पष्ट विकिपीडिया पृष्ठ पर एक अच्छी तरह से तैयार किए गए उत्तर की उपस्थिति के बावजूद) क्योंकि यहाँ इसका उत्तर देने के आरंभिक प्रयासों ने कुछ सूक्ष्मताओं की ओर संकेत किया है।
whuber

@whuber, क्या मैं कह सकता हूं कि मॉडल पैरामीटर अनुमान अनुमानक हैं?
एवोकैडो

2
@loganecolss एक अनुमानक एक गणितीय कार्य है। यह मूल्य (अनुमान) से अलग है जो इसे डेटा के किसी भी सेट के लिए प्राप्त हो सकता है। अंतर की सराहना करने का एक तरीका यह है कि डेटा के कुछ सेट एक ही अनुमान का उत्पादन करेंगे , कहते हैं, एक रेखीय प्रतिगमन में अलग-अलग अनुमानक (जैसे कि अधिकतम संभावना या Iteratively रिवाइस्टेड लिस्ट स्क्वायर) का उपयोग करके ढलान का उत्पादन करेंगे । अनुमान लगाने वालों के अनुमानों में अंतर किए बिना, हम उन अनुमानों का उत्पादन करते थे, हम यह समझने में असमर्थ होंगे कि वह कथन क्या कहता है।
whuber

@whuber, यहां तक ​​कि एक निश्चित डेटा सेट , अलग-अलग अनुमानक भी अलग-अलग अनुमान दे सकते हैं, क्या वे नहीं? D
एवोकैडो

जवाबों:


13

ईएल लेहमैन, अपने क्लासिक थ्योरी ऑफ़ पॉइंट एस्टिमेशन में , पीपी 1-2 पर इस सवाल का जवाब देते हैं।

टिप्पणियों को अब यादृच्छिक चर द्वारा लिए गए मानों के रूप में पोस्ट किया जाता है, जिन्हें संयुक्त संभावना वितरण, , कुछ ज्ञात वर्ग से संबंधित माना जाता है ...P

... आइए अब हम अनुमान लगाने के लिए विशेषज्ञ हैं ... मान लीजिए कि एक वास्तविक-मूल्यवान फ़ंक्शन है जिसे परिभाषित किया गया है [वितरण के निर्धारित वर्ग पर] और यह कि हम जी के मूल्य को जानना चाहेंगे [जो भी वास्तविक वितरण में है प्रभाव, θ ]। दुर्भाग्य से ,,, और इसलिए जी ( θ ) , अज्ञात है। हालांकि, डेटा के एक अनुमान प्राप्त करने के लिए इस्तेमाल किया जा सकता जी ( θ ) , एक मूल्य है कि एक उम्मीद के करीब होगा जी ( θ )ggθθg(θ)g(θ)g(θ)

शब्दों में: एक अनुमानक एक निश्चित गणितीय प्रक्रिया है जो डेटा के किसी भी संभावित सेट के लिए एक संख्या ( अनुमान ) के साथ आती है जो एक विशेष समस्या उत्पन्न कर सकती है। वह नंबर कुछ निश्चित संख्यात्मक संपत्ति (प्रतिनिधित्व करने का इरादा है ) डेटा पीढ़ी की प्रक्रिया के; हम इसे "अनुमान" कह सकते हैं।g(θ)

अनुमानक खुद एक यादृच्छिक चर नहीं है: यह सिर्फ एक गणितीय कार्य है। हालांकि, यह जो अनुमान लगाता है, वह डेटा पर आधारित होता है, जिसे खुद यादृच्छिक चर के रूप में चित्रित किया जाता है। यह एक यादृच्छिक चर में अनुमान (डेटा के आधार पर) के रूप में सोचा जाता है और डेटा के एक विशेष सेट के लिए एक विशेष अनुमान उस यादृच्छिक चर का एहसास हो जाता है।

एक (पारंपरिक) साधारण कम से कम वर्गों के निर्माण में, डेटा क्रमबद्ध जोड़े मिलकर बनता है । X मैं (वे उदाहरण के लिए, एक दवा प्रशासित की मात्रा हो सकता है) प्रयोगकर्ता द्वारा निर्धारित किया गया है। प्रत्येक y मैं (उदाहरण के लिए दवा के लिए एक प्रतिक्रिया,) एक प्रायिकता वितरण सामान्य है कि से लेकिन अज्ञात मतलब के साथ आने के लिए माना जाता है μ मैं और आम विचरण σ 2 । इसके अलावा, यह माना जाता है कि इसका मतलब है से जुड़े हुए हैं एक्स मैं के माध्यम से एक सूत्र μ मैं = β 0(xi,yi)xiyiμiσ2xi । इन तीन parameters-- σ , बीटा 0 , और β 1 --determine की अंतर्निहित वितरण y मैं के किसी भी मूल्य के लिए एक्स मैं । इसलिएकिसी भीहै कि वितरण की संपत्ति के के एक समारोह के रूप में सोचा जा सकता है ( σ , β 0 , β 1 ) । इस तरह के गुण के उदाहरण अवरोधन हैं β 0 , ढाल बीटा 1 , का मान क्योंकि ( σ + βμi=β0+β1xiσβ0β1yixi(σ,β0,β1)β0β1, या मूल्य पर भी मतलबएक्स=2है, जो (इस सूत्रीकरण के अनुसार) होना चाहिएβ0+2β1cos(σ+β02β1)x=2β0+2β1

इस OLS संदर्भ में, एक अनुमानक का एक गैर-उदाहरण के मूल्य पर अनुमान लगाने के लिए एक प्रक्रिया होगी यदि x 2 के बराबर सेट किया गया था। यह एक अनुमानक नहीं है क्योंकि y का यह मान यादृच्छिक है (एक तरह से पूरी तरह से अलग डेटा की यादृच्छिकता): यह वितरण का एक (निश्चित संख्यात्मक) गुण नहीं है, भले ही यह उस वितरण से संबंधित हो। (हम सिर्फ देखा है, हालांकि, के रूप में उम्मीद की y के लिए एक्स = 2 , के बराबर बीटा 0 + 2 β 1 , अनुमान लगाया जा सकता है।)yxyyx=2β0+2β1

लेहमैन के निर्माण में, लगभग कोई भी सूत्र लगभग किसी भी संपत्ति का अनुमानक हो सकता है। एक अनुमानक और एक अनुमान के बीच कोई अंतर्निहित गणितीय लिंक नहीं है। हालांकि, हम आकलन कर सकते हैं - अग्रिम रूप से - मौका है कि एक अनुमानक अनुमान लगाने के इरादे से मात्रा के करीब होगा। ऐसा करने के तरीके, और उनका शोषण कैसे करें, अनुमान सिद्धांत के विषय हैं।


1
(+1) बहुत सटीक और विस्तृत प्रतिक्रिया।
chl

2
क्या रैंडम वैरिएबल का फंक्शन खुद भी रैंडम वैरिएबल नहीं है?
jsk

@jsk मुझे लगता है कि मैं यहाँ भेद बनाने के लिए कोशिश कर रहा था कार्यों की संरचना पर विचार द्वारा स्पष्ट किया जा सकता है पहला फ़ंक्शन एक यादृच्छिक चर X है ; दूसरा एक (इसे कहते टी ) एक कहा जाता है आकलनकर्ता यहाँ, और की संरचना दो टी एक्स : Ω आर एक "अनुमान" या "आकलन प्रक्रिया," जो है - के रूप में आप सही ढंग से कहते हैं - एक यादृच्छिक चर।
ΩRnR.
Xt
tX:ΩR
whuber

1
@whuber अपनी पोस्ट में, आप कहते हैं "अनुमानक स्वयं एक यादृच्छिक चर नहीं है।" मैंने आपके पोस्ट को उस बिंदु को स्पष्ट करने के लिए संपादित करने का प्रयास किया, जिस पर आप और मैं सहमत हैं, लेकिन ऐसा लगता है कि किसी ने मेरा संपादन अस्वीकार कर दिया है। शायद वे आपके संपादन को पसंद करेंगे!
जेएसके


7

संक्षेप में: एक अनुमानक एक कार्य है और एक अनुमान एक मूल्य है जो एक देखे गए नमूने को सारांशित करता है।

एक अनुमानक एक फ़ंक्शन है जो पैरामीटर अनुमान के लिए एक यादृच्छिक नमूना मैप करता है:

ध्यान दें कि की एक आकलनकर्ताnयादृच्छिक परिवर्तनीयएक्स1,एक्स2,,एक्सएनएक यादृच्छिक चर रहा है Θ । उदाहरण के लिए, एक आकलनकर्ता नमूना मतलब है: ¯ एक्स =1

Θ^=t(X1,X2,...,Xn)
X1,X2,...,XnΘ^ एकअनुमान θ नमूना मनाया एक छोटे अक्षरों पर आकलनकर्ता समारोह को लागू करने का परिणाम हैएक्स1,x2,,xn:
X¯=1nn=1nXi
θ^x1,x2,...,xn

उदाहरण के लिए, मनाया नमूना के एक अनुमानएक्स1,एक्स2,,एक्सएननमूना मतलब है: μ = ¯ एक्स =1

θ^=t(x1,x2,...,xn)
x1,x2,...,xn
μ^=x¯=1nn=1nxi

अनुमानक एक आरवी है, जबकि अनुमान एक स्थिर है?
पार्थिबन राजेंद्रन

क्या आपका निष्कर्ष @ व्हिबर के साथ संघर्ष नहीं कर रहा है? यहां आप कहते हैं कि आकलनकर्ता आरवी है, लेकिन व्हीबर अन्यथा कहता है।
पार्थिबन राजेंद्रन

हां, मैं @ व्हिबर के बयान से असहमत हूं "अनुमानक खुद एक यादृच्छिक चर नहीं है: यह सिर्फ एक गणितीय कार्य है"। यादृच्छिक चर का एक कार्य भी एक यादृच्छिक चर है। onlinecourses.science.psu.edu/stat414/node/128
फ्रीमैन

3

एक रेखीय प्रतिगमन मॉडल के संदर्भ में व्हीबर के उत्तर को समझाने में मददगार हो सकता है। मान लें कि आपके पास कुछ बायवेरिएट डेटा हैं और आप निम्नलिखित मॉडल के साथ आने के लिए साधारण Least वर्ग का उपयोग करते हैं:

Y = 6X + 1

इस बिंदु पर, आप, एक्स के किसी भी मान ले मॉडल में प्लग और परिणाम, वाई भविष्यवाणी इस अर्थ में कर सकते हैं, तो आप मॉडल (के सामान्य रूप से अलग-अलग घटकों के बारे में सोच सकता है एमएक्स + बी ) के रूप में आकलनकर्ता । नमूना डेटा (जिसे आपने सामान्य रूप से मीटर और बी के लिए विशिष्ट मानों की गणना करने के लिए मॉडल में प्लग किया था ) एक आधार प्रदान किया था जिस पर आप एम और बी के लिए अनुमान लगा सकते हैं। क्रमशः ।

नीचे दिए गए हमारे सूत्र में @ व्हीबर के बिंदुओं के अनुरूप, जो भी वाई के मान हैं आकलनकर्ता के एक विशेष सेट आप उत्पन्न कर रहे हैं के लिए, रेखीय प्रतीपगमन के संदर्भ में, भविष्यवाणी मूल्यों के रूप में के बारे में सोचा।

(संपादित - कुछ समय - नीचे टिप्पणी को प्रतिबिंबित करने के लिए)


1
आपने अच्छी तरह से एक भविष्यवक्ता को परिभाषित किया है यह एक अनुमानक से अलग (लेकिन महत्वपूर्ण रूप से) अलग है। इस संदर्भ में अनुमानक डेटा से मापदंडों 1 और 6 की गणना करने के लिए उपयोग किया जाने वाला सबसे कम वर्ग सूत्र है।
whuber

हम्म, मेरा मतलब यह नहीं था कि इस तरह से, @ हावर्ड, लेकिन मुझे लगता है कि आपकी टिप्पणी मेरी भाषा में एक महत्वपूर्ण अस्पष्टता को दर्शाती है जिसे मैंने पहले नोटिस नहीं किया था। यहां मुख्य बिंदु यह है कि आप एक अनुमानक के रूप में समीकरण Y = mX + B (जैसा कि ऊपर इस्तेमाल किया गया है) के सामान्य रूप के बारे में सोच सकते हैं, जबकि उस सूत्र के विशिष्ट उदाहरणों द्वारा उत्पन्न विशेष अनुमानित मान हैं (उदाहरण, 1 + 6X) अनुमान। मुझे उस अंतर को पकड़ने के लिए ऊपर दिए गए पैराग्राफ को संपादित करने की कोशिश करें ...
21

btw, मैं इस "हैट" अंकन को प्रस्तुत किए बिना इसे समझाने की कोशिश कर रहा हूं जो मैंने इस अवधारणा के अधिकांश पाठ्यपुस्तक चर्चाओं में सामना किया है। शायद यही बेहतर रास्ता है?
21

2
मुझे लगता है कि आपने अपने मूल उत्तर में सटीकता और तकनीकी के बीच एक अच्छा माध्यम मारा है: इसे बनाए रखें! आपको टोपी की आवश्यकता नहीं है, लेकिन यदि आप यह दिखाने का प्रबंधन कर सकते हैं कि एक अनुमानक अन्य, समान दिखने वाली चीजों से कैसे अलग है, तो यह सबसे अधिक उपयोगी होगा। लेकिन कृपया मान Y की भविष्यवाणी करने और m या b जैसे किसी पैरामीटर का अनुमान लगाने के बीच अंतर पर ध्यान दें । वाई की व्याख्या एक यादृच्छिक चर के रूप में की जा सकती है; मी और बी (बायेसियन सेटिंग को छोड़कर) नहीं हैं।
whuber

वास्तव में, वहाँ एक बहुत अच्छा बिंदु मापदंडों बनाम मूल्यों के संदर्भ में। फिर से संपादन ...
२४'११ को २४:२४

0

मान लीजिए कि आपको कुछ डेटा प्राप्त हुआ है, और आपके पास थीटा नामक कुछ देखे गए चर हैं। अब आपका डेटा डेटा के वितरण से हो सकता है, इस वितरण के लिए, आपके द्वारा अनुमानित थेटा का संबंधित मान है जो एक यादृच्छिक चर है। जब भी आपके डेटा में परिवर्तन होता है, आप इस रैंडम वैरिएबल के अनुमान की गणना के लिए MAP या माध्य का उपयोग कर सकते हैं। इसलिए यादृच्छिक चर थीटा को एक अनुमान के रूप में जाना जाता है , जो एक विशेष प्रकार के डेटा के लिए अप्राप्त चर का एक मूल्य है।

जबकि अनुमानक आपका डेटा है, जो एक यादृच्छिक चर भी है। विभिन्न प्रकार के वितरणों के लिए आपके पास विभिन्न प्रकार के डेटा होते हैं और इस प्रकार आपके पास एक अलग अनुमान होता है और इस प्रकार इस संबंधित यादृच्छिक चर को अनुमानक कहा जाता है ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.