विकिपीडिया के उद्धरण:
आंकड़ों में, एक सुसंगत अनुमानक या asymptotically संगत आकलनकर्ता एक आकलनकर्ता-एक कंप्यूटिंग एक पैरामीटर के अनुमानों के लिए नियम है संपत्ति -having कि डेटा बिंदुओं की संख्या का इस्तेमाल किया के रूप में बढ़ जाती है अनिश्चित काल के लिए, करने के लिए संभावना के अनुमान और converges के परिणामस्वरूप अनुक्रम ।
इस बयान सटीक देना सुनिश्चित करने के लिए सच पैरामीटर आप अनुमान और बताना चाहते हैं का मूल्य हो θ ( एस एन ) डेटा के एक समारोह के रूप में इस पैरामीटर आकलन करने के लिए हो सकता है नियम। तब एक अनुमानक की संगति की परिभाषा निम्न प्रकार से व्यक्त की जा सकती है:
मेरा सवाल पहली नजर में सतही लगता है लेकिन यह है: "अनुमानक / सुसंगत" शब्द का इस्तेमाल एक अनुमानक के इस व्यवहार का वर्णन करने के लिए क्यों किया गया था?
इस कारण कि मैं इसकी परवाह करता हूं क्योंकि मेरे लिए, सहज रूप से, सुसंगत शब्द का अर्थ कुछ अलग है (या कम से कम यह मुझे अलग लगता है, शायद उन्हें बराबर दिखाया जा सकता है)। एक उदाहरण के माध्यम से इसका क्या अर्थ है, मैं आपको बताता हूं। कहें कि "आप" लगातार "अच्छे" हैं (कुछ की अच्छी परिभाषा के लिए), तो सुसंगत का अर्थ है कि हर बार जब आपके पास मुझे साबित करने / दिखाने का मौका होता है कि आप अच्छे हैं, तो आप वास्तव में मुझे साबित करते हैं कि आप अच्छे हैं, हर एक बार (या कम से कम अधिकांश समय)।
एक अनुमानक की स्थिरता को परिभाषित करने के लिए मेरे अंतर्ज्ञान को लागू करने देता है। चलो "आप" की गणना समारोह हो θ और जाने "अच्छा" मतलब कितनी दूर तुम सच अनुमान से हैं θ * (में, अच्छा एल 1 आदर्श भावना, क्यों नहीं)। तब संगति की एक बेहतर परिभाषा होगी:
भले ही यह स्थिरता के एक कम उपयोगी परिभाषा हो सकता है, जिस तरह से मैं स्थिरता को परिभाषित करेगा में मुझे अधिक समझ में आता है, क्योंकि किसी भी प्रशिक्षण / नमूना सेट तुम मेरे आकलनकर्ता के लिए फेंक के लिए θ , मैं एक अच्छा काम करने में सक्षम हो जाएगा , यानी मैं लगातार अच्छा करूंगा। मुझे पता है, कि इसकी थोड़ी अवास्तविकता सभी n (शायद असंभव) के लिए है, लेकिन हम इस परिभाषा को यह कह कर ठीक कर सकते हैं:
यानी पर्याप्त रूप से बड़े n के लिए, हमारे आकलनकर्ता से भी बदतर काम नहीं चलेगा (यानी अधिक नहीं ε "सच" से दूर) सच से θ * ( एन 0 अंतर्ज्ञान है कि आप कम से कम कुछ नंबर की आवश्यकता पर कब्जा करने की कोशिश कर रहा है किसी भी चीज़ को जानने / अनुमान करने के लिए उदाहरण, और एक बार जब आप उस नंबर पर पहुँच गए, तो आपका अनुमानक अधिकतर समय अच्छा करेगा यदि इसके अनुरूप जिस तरह से हम इसे परिभाषित करने की कोशिश कर रहे हैं)।
हालांकि, पिछले परिभाषा मजबूत करने के लिए है, शायद हम हम से दूर होने का एक कम संभावना है करने के लिए अनुमति दे सकता है आकार के प्रशिक्षण सेट के अधिकांश के लिए n ≥ एन 0 (यानी इस सब के लिए की आवश्यकता नहीं एस एन , लेकिन अधिक S n का वितरण या ऐसा कुछ)। इसलिए हमारे पास एक उच्च त्रुटि केवल बहुत ही कम नमूना / प्रशिक्षण सेट के लिए होगी जो हमारे पास है।
वैसे भी, मेरा प्रश्न यह है कि क्या "संगति" की ये प्रस्तावित परिभाषाएँ वास्तव में स्थिरता की "आधिकारिक" परिभाषा के समान हैं, लेकिन समता को सिद्ध करना कठिन है? यदि आप प्रमाण जानते हैं तो कृपया इसे साझा करें! या क्या मेरा अंतर्ज्ञान पूरी तरह से बंद है और क्या इस तरह परिभाषा परिभाषा को चुनने का एक गहरा कारण है कि इसे आमतौर पर परिभाषित किया गया है? क्यों ("आधिकारिक") स्थिरता को जिस तरह से परिभाषित किया गया है?
तुल्यता के कुछ प्रकार के लिए एक उम्मीदवार सबूत के मेरे विचार से कुछ, या शायद स्थिरता की मेरी धारणा और स्थिरता के स्वीकार किए जाते हैं धारणा के बीच समानता का उपयोग कर स्थिरता के सरकारी परिभाषा में एक सीमा की परिभाषा जानने की हो सकती है एक सीमा की परिभाषा। हालांकि, मुझे 100% यकीन नहीं था कि कैसे करना है और यहां तक कि अगर मैंने कोशिश की, तो निरंतरता की आधिकारिक परिभाषा सभी संभावित प्रशिक्षण / नमूना सेटों के बारे में बात करने में नहीं लगती है। चूंकि मेरा मानना है कि वे समान हैं, इसलिए मैंने जो आधिकारिक परिभाषा दी है वह अधूरी है (अर्थात यह उन डेटा सेटों के बारे में बात नहीं करता है जो हम कर सकते थे या सभी अलग-अलग डेटा सेट जो हमारे नमूना सेट उत्पन्न कर सकते थे)?
मेरे अंतिम विचारों में से एक है, हम जो भी आपूर्ति करते हैं, उसकी सटीक परिभाषा भी होनी चाहिए जिसकी संभावना वितरण के बारे में हम बात करते हैं, क्या यह या यह P S n है । मुझे लगता है कि एक उम्मीदवार को भी सटीक होना चाहिए अगर यह जो भी गारंटी देता है, अगर यह गारंटी देता है कि यह कुछ निश्चित वितरण के लिए या प्रशिक्षण सेटों के सभी संभावित वितरणों के लिए राइट ... राइट?