कैसे समझा जाता है कि एक निष्पक्ष अनुमान लगाने वाला एक झूठ बोलने वाले के लिए क्या है?


10

मान लीजिए के लिए एक निष्पक्ष आकलनकर्ता है । फिर, । θ[ θ |θ]=θθ^θE[θ^θ]=θ

एक व्यक्ति को यह कैसे समझाया जाता है? अतीत में, मैंने जो कहा है वह यह है कि यदि आप नमूने के आकार को बड़ा पाते हैं, तो के मूल्यों का एक गुच्छा औसत हो जाता है, आपको का बेहतर सन्निकटन मिल जाता है । θθ^θ

मेरे लिए, यह समस्याग्रस्त है। मुझे लगता है कि मैं वास्तव में यहाँ जो वर्णन कर रहा हूँ , वह पूरी तरह से निष्पक्ष होने के बजाय विषम रूप से निष्पक्ष होने की यह घटना है , अर्थात, जहां \ टोपी {\ थीटा} संभवत: n पर निर्भर है ।

limnE[θ^θ]=θ,
nθ^n

तो, कोई कैसे स्पष्ट करता है कि एक निष्पक्ष अनुमान लगाने वाला एक झूठ बोलने वाले के लिए क्या है?


2
यह अनुमान लगाने का एक तरीका है कि यह सिर्फ सही के बारे में है: यह आम तौर पर बिल्कुल सही नहीं है, लेकिन पूरे पर यह अंडरस्टीमेट्स की तुलना में अधिक बार overestimates का उत्पादन नहीं करता है। मुझे लगता है कि यह इसे और अधिक ध्वनि की तरह बनाता है \ _ थीटा मतलब की तुलना θमें θ^ का माध्य है, लेकिन मुझे लगता है कि यह आवश्यक बिंदु पर कब्जा करता है।
jwimberley

3
मुझे इसके लिए "तीन सांख्यिकीविदों का शिकार" मज़ाक (एक संस्करण यहाँ ) पसंद है ...
बेन बोल्कर

2
आपका स्पष्टीकरण बड़ी संख्या का कानून है, इसका निष्पक्षता से कोई लेना-देना नहीं है।
शीआन

@ शीआन: यदि अनुमानक पक्षपाती था, तो सीमा नहीं होगी । θ
user2357112

@ user2357112: मेरी समझ में (और अन्य ', जैसा कि अब तक के उत्तरों द्वारा दिखाया गया है), जैसा कि नमूना आकार बड़ा हो जाता है, इसलिए पर विचार करना बड़ा होता है क्योंकि अनन्तता तक बढ़ता है, यानी अवलोकनों के आधार पर एक अनुमानक । अब मैं देख रहा हूं कि वाक्य की व्याख्या अलग तरीके से की जा सकती है। एनएनθ^nnn
शीआन

जवाबों:


14

जब आप कहते हैं कि तकनीकी रूप से आप यह बता रहे हैं कि आपका अनुमानक सही मूल्य के करीब जाता है, जैसा कि नमूना आकार बढ़ता है (जैसा कि दूसरों ने उल्लेख किया है) स्थिरता या सांख्यिकीय अनुमानकों का अभिसरण। यह अभिसरण या तो प्रायिकता में अभिसरण हो सकता है, जो कहता है कि हर लिए , या लगभग। निश्चित अभिसरण जो कहता है कि | ध्यान दें कि सीमा वास्तव में अंदर कैसे हैε > 0 पी ( लिम n | θ एन - θ | > ε ) = 0limnP(|θ^nθ|>ϵ)=0ϵ>0P(limn|θ^nθ|>ϵ)=0दूसरे मामले में संभावना। यह बताता है कि अभिसरण का यह बाद वाला रूप दूसरे की तुलना में अधिक मजबूत है, लेकिन दोनों का अर्थ अनिवार्य रूप से एक ही बात है, जो अनुमान है कि हम जिस चीज का अनुमान लगा रहे हैं उसके करीब और करीब पहुंचते हैं क्योंकि हम अधिक नमूने एकत्र करते हैं।

यहाँ एक सूक्ष्म बात यह है कि जब भी प्रायिकता में या लगभग निश्चित रूप से होता है, तब भी, यह सामान्य रूप से सही नहीं होता है कि , इसलिए निष्पक्षता का अर्थ नहीं है जैसा कि आप सुझाव दे रहे हैं। अपेक्षाओं के अनुक्रम (जो अभिन्न हैं) के यादृच्छिक चर (जो कार्य हैं) के अनुक्रमों के बीच चलते समय आपको सावधान रहना होगा।लिमn( θ एन)=θθ^nθlimnE(θ^n)=θ

एक तरफ सभी तकनीकी सामान, निष्पक्ष का मतलब केवल यह है कि । इसलिए जब आप इसे किसी को समझाते हैं तो बस यह कहें कि यदि प्रयोग कई बार समान परिस्थितियों में दोहराया गया तो अनुमान का औसत मूल्य सही मूल्य के करीब होगा।E(θ^n)=θ


5
लेपर्सन की आपकी दृष्टि काफी सराहनीय है। वह जानता है कि "संभाव्यता में अभिसरण", "अभिसरण के रूप में", सीमा है ... यह भविष्य से आदमी है।
अक्कल

2
मुझे नहीं लगता कि किसी व्यक्ति को इनमें से कोई भी बात पता है, मैं मूल पोस्ट में कुछ गलतफहमी को ठीक करने की कोशिश कर रहा था। मेरा सुझाव है कि किसी लेपर्स को चीजों को कैसे समझा जाए, यह अंतिम पैराग्राफ में है।
dsaxton

वह आखिरी पैराग्राफ हालांकि पूर्वाग्रह की अवधारणा को एक अनुमानक की संगति से उलझाता है, जो शायद ओपी के भ्रमों में से एक था, जिसके साथ शुरू करना था।
अक्कल

3
ऐसा कैसे? समान परिस्थितियों में एक प्रयोग को दोहराने का मतलब होगा कि नमूना आकार तय हो गया है इसलिए हम स्पष्ट रूप से स्थिरता के बारे में बात नहीं कर रहे हैं।
dsaxton

1
ठीक है, आप इसके बारे में सही हैं, लेकिन फिर इसका मतलब है कि आप एक संभावना के लगातार दृश्य में ला रहे हैं
अक्कल

9

मुझे यकीन नहीं है कि आप स्थिरता और निष्पक्षता को भ्रमित करते हैं।

संगति: बड़ा नमूना आकार में अनुमानक के विचरण को छोटा करता है।

  • नमूना आकार पर निर्भर करता है

निष्पक्षता: अनुमानक का अपेक्षित मूल्य मापदंडों के सही मूल्य के बराबर होता है

  • नमूना आकार पर निर्भर नहीं करता है

तो आपका वाक्य

यदि आप के मूल्यों का एक समूह औसत , के रूप में नमूने का आकार बड़ा हो जाता है, तो आप के लिए एक बेहतर सन्निकटन प्राप्त ।θ^θ

सही नहीं है। यहां तक ​​कि अगर नमूना आकार अनंत हो जाता है तो एक निष्पक्ष अनुमानक निष्पक्ष अनुमानक बना रहेगा, उदाहरण के लिए यदि आप "मीन +1" के रूप में अनुमान लगाते हैं तो आप अपने नमूने में एक अरब अवलोकन जोड़ सकते हैं और आपका अनुमानक अभी भी आपको सही मूल्य नहीं देगा।

यहां आप स्थिरता और निष्पक्षता के बीच अंतर के बारे में अधिक गहन चर्चा पा सकते हैं।

एक सुसंगत अनुमानक और एक निष्पक्ष अनुमानक के बीच अंतर क्या है?


2
मैं वास्तव में स्थिरता के बारे में कुछ नहीं जानता, लेकिन फिर भी धन्यवाद।
शहनाई

1
@ कल्लिनेटिस्ट कंसिस्टेंसी शायद एक अनुमानक की सबसे महत्वपूर्ण संपत्ति है, कि पर्याप्त डेटा के साथ, आप मनमाने ढंग से सही उत्तर के करीब पहुंच जाएंगे।
मैथ्यू गन

7

@ फेर्डी ने पहले ही आपके प्रश्न का स्पष्ट उत्तर प्रदान कर दिया है, लेकिन आइए इसे थोड़ा और अधिक औपचारिक बनाएं।

चलो वितरण से स्वतंत्र और हूबहू वितरित यादृच्छिक चर के अपने नमूना होना । आप अंजान लेकिन निश्चित मात्रा का अनुमान लगाने में रुचि रखते हैं , अनुमानक का उपयोग कर रहे हैं का एक कार्य । चूंकि यादृच्छिक चर का एक फ़ंक्शन है, इसलिए अनुमान लगाएंX1,,XnFθजी एक्स 1 , ... , एक्स एन जी gX1,,Xng

θ^n=g(X1,,Xn)

एक यादृच्छिक चर भी है। हम पूर्वाग्रह को परिभाषित करते हैं

bias(θ^n)=Eθ(θ^n)θ

अनुमान वाला निष्पक्ष होता है जब ।Eθ(θ^n)=θ

इसे सादे अंग्रेजी में कहना: हम यादृच्छिक चर के साथ काम कर रहे हैं , इसलिए जब तक यह पतित नहीं होता , अगर हमने अलग-अलग नमूने लिए, तो हम अलग-अलग डेटा और इतने अलग-अलग अनुमानों का पालन करने की उम्मीद कर सकते हैं। फिर भी, हम उम्मीद कर सकते हैं कि अगर अनुमान लगाने वाला निष्पक्ष है तो विभिन्न नमूनों में "औसत" अनुमानित " " है। इसलिए यह हमेशा सही नहीं होगा, लेकिन "औसतन" यह सही होगा। यह केवल डेटा के साथ यादृच्छिकता के कारण हमेशा "सही" नहीं हो सकता है।θ^n

जैसा कि अन्य लोगों ने पहले ही उल्लेख किया है, तथ्य यह है कि आपका अनुमान अनुमानित मात्रा के "करीब" हो जाता है क्योंकि आपका नमूना बढ़ता है, अर्थात संभाव्यता में अभिसरण

θ^nPθ

अनुमानकर्ताओं की संगति के साथ करना है , निष्पक्षता से नहीं। निष्पक्षता अकेले हमें नमूना आकार और प्राप्त अनुमानों के संबंध के बारे में कुछ नहीं बताती है। इसके अलावा, निष्पक्ष अनुमानक हमेशा उपलब्ध नहीं होते हैं और हमेशा पक्षपाती लोगों पर बेहतर नहीं होते हैं। उदाहरण के लिए, पूर्वाग्रह-विचरण व्यापार पर विचार करने के बाद आप अधिक पूर्वाग्रह के साथ अनुमानक का उपयोग करने पर विचार करने के लिए तैयार हो सकते हैं, लेकिन छोटे विचरण - इसलिए "औसतन" यह सही मूल्य से दूर होगा, लेकिन अधिक बार (छोटे विचरण) अनुमान। सही मूल्य के करीब हो, तो निष्पक्ष अनुमानक के मामले में।


(+1): इस तथ्य को सामने लाने का बहुत अच्छा बिंदु कि शायद ही कभी निष्पक्ष अनुमानक उपलब्ध हों। और पक्षपात / विचरण विरोध का उल्लेख करना।
शीआन

2

पहले आपको गलत पूर्वाग्रह को सांख्यिकीय पूर्वाग्रह से अलग करना होगा, विशेष रूप से एक व्यक्ति के लिए।

औसत आबादी के लिए आपके अनुमानक के रूप में माध्य, माध्य या मोड का उपयोग करते हुए कहने का विकल्प अक्सर एक राजनीतिक, धार्मिक या विज्ञान सिद्धांत विश्वास पूर्वाग्रह होता है। अनुमान के अनुसार गणना करने वाला, औसत का सबसे अच्छा रूप है, अंकगणित का एक अलग प्रकार है जो सांख्यिकीय पूर्वाग्रह को प्रभावित करता है।

एक बार जब आप विधि चयन पूर्वाग्रह से परे हो जाते हैं, तो आप अनुमान विधि में संभावित पूर्वाग्रहों को संबोधित कर सकते हैं। पहले आपको एक ऐसी विधि चुननी होगी जिसमें पूर्वाग्रह हो सकते हैं, और एक तंत्र जो आसानी से उस पूर्वाग्रह की ओर ले जाता है।

यह एक विभाजित दृष्टिकोण का उपयोग करना आसान हो सकता है जहां यह स्पष्ट हो जाता है क्योंकि नमूना आकार छोटा हो जाता है, अनुमान स्पष्ट रूप से पक्षपाती हो जाता है। उदाहरण के लिए नमूना प्रसार अनुमानों में n-1 कारक (बनाम 'n' कारक) n के रूप में 3 से 2 से 1 तक स्पष्ट हो जाता है!

यह सब इस बात पर निर्भर करता है कि व्यक्ति कैसा है।


मुझे डर है कि आप विभिन्न प्रकार के पूर्वाग्रहों के बारे में बात कर रहे होंगे जो प्रश्न में एक है। क्या आप पूर्वाग्रह के बारे में अधिक विशिष्ट होने की कोशिश कर सकते हैं? आप "अनुमान विधि में संभावित पूर्वाग्रह" के बारे में लिखते हैं और यह पूर्वाग्रह की परिभाषा के अनुरूप नहीं लगता है (ऊपर दिए गए प्रश्न और उत्तर में दिया गया है)। अंत में, यह आपके उत्तर को भ्रमित कर देता है ...
टिम

@ टिम, पहला कदम सिर्फ यह सुनिश्चित करना था कि मानव पूर्वाग्रह को कवर किया गया था। दूसरा चरण था (और आंशिक रूप से चरण 1 के मुद्दों का अनुसरण करता है) यह सुनिश्चित करने के लिए कि बिछाने वाले व्यक्ति का शिक्षण पहले से ही उस विधि एक्स (निष्पक्ष एक) को चुना नहीं गया था। उदा। मानक विचलन 1 / n * योग ((x- माध्य) ^ 2) है, लेकिन यह (ध्यान से) जनसंख्या और नमूने के बीच अंतर नहीं करता है। अधिकांश 'लेटे हुए लोगों' को नमूने के लिए 1 / (एन -1) संस्करण को पढ़ाया जाता है। यदि आपके पास सिर्फ एक तरीका है, तो आपके पास (व्यक्ति को) बनाने के लिए कोई विकल्प नहीं है, इसलिए अनुमानक पूर्वाग्रह एक मुद्दा नहीं हो सकता ... यह क्रूगर-डायनिंग चरण है।
फिलिप ओकले
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.