एक सुसंगत अनुमानक की परिभाषा यह क्यों है? संगति की वैकल्पिक परिभाषा के बारे में क्या?


14

विकिपीडिया के उद्धरण:

आंकड़ों में, एक सुसंगत अनुमानक या asymptotically संगत आकलनकर्ता एक आकलनकर्ता-एक कंप्यूटिंग एक पैरामीटर के अनुमानों के लिए नियम है θ संपत्ति -having कि डेटा बिंदुओं की संख्या का इस्तेमाल किया के रूप में बढ़ जाती है अनिश्चित काल के लिए, करने के लिए संभावना के अनुमान और converges के परिणामस्वरूप अनुक्रम θ

इस बयान सटीक देना सुनिश्चित करने के लिए θ सच पैरामीटर आप अनुमान और बताना चाहते हैं का मूल्य हो θ ( एस एन ) डेटा के एक समारोह के रूप में इस पैरामीटर आकलन करने के लिए हो सकता है नियम। तब एक अनुमानक की संगति की परिभाषा निम्न प्रकार से व्यक्त की जा सकती है:θ^(Sn)

limnPr[|θ(Sn^)θ|ϵ]=0

मेरा सवाल पहली नजर में सतही लगता है लेकिन यह है: "अनुमानक / सुसंगत" शब्द का इस्तेमाल एक अनुमानक के इस व्यवहार का वर्णन करने के लिए क्यों किया गया था?

इस कारण कि मैं इसकी परवाह करता हूं क्योंकि मेरे लिए, सहज रूप से, सुसंगत शब्द का अर्थ कुछ अलग है (या कम से कम यह मुझे अलग लगता है, शायद उन्हें बराबर दिखाया जा सकता है)। एक उदाहरण के माध्यम से इसका क्या अर्थ है, मैं आपको बताता हूं। कहें कि "आप" लगातार "अच्छे" हैं (कुछ की अच्छी परिभाषा के लिए), तो सुसंगत का अर्थ है कि हर बार जब आपके पास मुझे साबित करने / दिखाने का मौका होता है कि आप अच्छे हैं, तो आप वास्तव में मुझे साबित करते हैं कि आप अच्छे हैं, हर एक बार (या कम से कम अधिकांश समय)।

एक अनुमानक की स्थिरता को परिभाषित करने के लिए मेरे अंतर्ज्ञान को लागू करने देता है। चलो "आप" की गणना समारोह हो θ और जाने "अच्छा" मतलब कितनी दूर तुम सच अनुमान से हैं θ * (में, अच्छा एल 1 आदर्श भावना, क्यों नहीं)। तब संगति की एक बेहतर परिभाषा होगी:θ^θl1

n,Sn,Pr[|θ(Sn^)θ|ϵ]<δ

भले ही यह स्थिरता के एक कम उपयोगी परिभाषा हो सकता है, जिस तरह से मैं स्थिरता को परिभाषित करेगा में मुझे अधिक समझ में आता है, क्योंकि किसी भी प्रशिक्षण / नमूना सेट तुम मेरे आकलनकर्ता के लिए फेंक के लिए θ , मैं एक अच्छा काम करने में सक्षम हो जाएगा , यानी मैं लगातार अच्छा करूंगा। मुझे पता है, कि इसकी थोड़ी अवास्तविकता सभी n (शायद असंभव) के लिए है, लेकिन हम इस परिभाषा को यह कह कर ठीक कर सकते हैं:θ^

n0,nn0,Sn,Pr[|θ(Sn^)θ|ϵ]<δ

यानी पर्याप्त रूप से बड़े n के लिए, हमारे आकलनकर्ता से भी बदतर काम नहीं चलेगा (यानी अधिक नहीं ε "सच" से दूर) सच से θ * ( एन 0 अंतर्ज्ञान है कि आप कम से कम कुछ नंबर की आवश्यकता पर कब्जा करने की कोशिश कर रहा है किसी भी चीज़ को जानने / अनुमान करने के लिए उदाहरण, और एक बार जब आप उस नंबर पर पहुँच गए, तो आपका अनुमानक अधिकतर समय अच्छा करेगा यदि इसके अनुरूप जिस तरह से हम इसे परिभाषित करने की कोशिश कर रहे हैं)।ϵϵθn0

हालांकि, पिछले परिभाषा मजबूत करने के लिए है, शायद हम हम से दूर होने का एक कम संभावना है करने के लिए अनुमति दे सकता है आकार के प्रशिक्षण सेट के अधिकांश के लिए n एन 0 (यानी इस सब के लिए की आवश्यकता नहीं एस एन , लेकिन अधिक S n का वितरण या ऐसा कुछ)। इसलिए हमारे पास एक उच्च त्रुटि केवल बहुत ही कम नमूना / प्रशिक्षण सेट के लिए होगी जो हमारे पास है।θnn0SnSn

वैसे भी, मेरा प्रश्न यह है कि क्या "संगति" की ये प्रस्तावित परिभाषाएँ वास्तव में स्थिरता की "आधिकारिक" परिभाषा के समान हैं, लेकिन समता को सिद्ध करना कठिन है? यदि आप प्रमाण जानते हैं तो कृपया इसे साझा करें! या क्या मेरा अंतर्ज्ञान पूरी तरह से बंद है और क्या इस तरह परिभाषा परिभाषा को चुनने का एक गहरा कारण है कि इसे आमतौर पर परिभाषित किया गया है? क्यों ("आधिकारिक") स्थिरता को जिस तरह से परिभाषित किया गया है?

तुल्यता के कुछ प्रकार के लिए एक उम्मीदवार सबूत के मेरे विचार से कुछ, या शायद स्थिरता की मेरी धारणा और स्थिरता के स्वीकार किए जाते हैं धारणा के बीच समानता का उपयोग कर स्थिरता के सरकारी परिभाषा में एक सीमा की परिभाषा जानने की हो सकती है एक सीमा की परिभाषा। हालांकि, मुझे 100% यकीन नहीं था कि कैसे करना है और यहां तक ​​कि अगर मैंने कोशिश की, तो निरंतरता की आधिकारिक परिभाषा सभी संभावित प्रशिक्षण / नमूना सेटों के बारे में बात करने में नहीं लगती है। चूंकि मेरा मानना ​​है कि वे समान हैं, इसलिए मैंने जो आधिकारिक परिभाषा दी है वह अधूरी है (अर्थात यह उन डेटा सेटों के बारे में बात नहीं करता है जो हम कर सकते थे या सभी अलग-अलग डेटा सेट जो हमारे नमूना सेट उत्पन्न कर सकते थे)?(ϵ,δ)

मेरे अंतिम विचारों में से एक है, हम जो भी आपूर्ति करते हैं, उसकी सटीक परिभाषा भी होनी चाहिए जिसकी संभावना वितरण के बारे में हम बात करते हैं, क्या यह या यह P S n है । मुझे लगता है कि एक उम्मीदवार को भी सटीक होना चाहिए अगर यह जो भी गारंटी देता है, अगर यह गारंटी देता है कि यह कुछ निश्चित वितरण के लिए या प्रशिक्षण सेटों के सभी संभावित वितरणों के लिए राइट ... राइट?PxPSn


3
(+1) रचनात्मक सोच। हमसे यह साझा करने के लिए धन्यवाद। मुझे विश्वास है कि मैं यहां एक उत्तर के रूप में कुछ विचार प्रदान कर सकूंगा।
एलेकोस पापाडोपोलोस

2
पहली परिभाषा बहुत कम उपयोग की है क्योंकि इसके लिए सभी अनुमानकों को अत्यधिक सटीक होना आवश्यक है। दूसरा कोई मतलब नहीं है क्योंकि यह एक ही लॉजिकल चर को कई क्वांटिफायर के साथ नियंत्रित करने का प्रयास करता है । n
whuber

जवाबों:


9

ओपी द्वारा दूसरे अस्थायी बयान पर विचार करें, थोड़ा संशोधित,

(1)θΘ,ϵ>0,δ>0,Sn,n0(θ,ϵ,δ):nn0,Pn[|θ^(Sn)θ|ϵ]<δ

We are examining the bounded in [0,1] sequence of real numbers

{Pn[|θ^(Sn)θ|ϵ]}

indexed by n. If this sequence has a limit as n, call it simply p, we will have that

(2)θΘ,ϵ>0,δ>0,Sn,n0(θ,ϵ,δ):nn0,|Pn[|θ(Sn^)θ|ϵ]p|<δ

So if we assume (or require) (1), we essentially assume (or require) that the limit as n exists and is equal to zero, p=0.

So (1) reads "the limit of Pn[|θ(Sn^)θ|ϵ] as n is 0". Which is exactly the current definition of consistency (and yes, it covers "all possible samples")

So it appears that the OP essentially proposed an alternative expression for the exact same property, and not a different property, of the estimator.

ADDENDUM (forgot the history part)

In his "Foundations of the Theory of Probability" (1933), Kolmogorov mentions in a footnote that (the concept of convergence in probability)

"...is due to Bernoulli;its completely general treatment was introduced by E.E.Slutsky".

(in 1925). The work of Slutsky is in German -there may be even an issue of how the German word was translated in English (or the term used by Bernoulli). But don't try to read too much into a word.

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.