हमें सामान्य त्रुटियों के बजाय टी त्रुटियों का उपयोग क्यों करना चाहिए?


30

में इस एंड्रयू गेल्मैन द्वारा ब्लॉग पोस्ट, वहाँ निम्नलिखित मार्ग है:

50 साल पहले के बायेसियन मॉडल निराशाजनक रूप से सरल लगते हैं (सिवाय, निश्चित रूप से, सरल समस्याओं के लिए), और मुझे उम्मीद है कि आज के बायेसियन मॉडल 50 साल बाद निराशाजनक रूप से सरल लगेंगे। (बस एक सरल उदाहरण के लिए: हमें शायद हमेशा की तरह सामान्य त्रुटियों के बजाय टी का उपयोग करना चाहिए, लेकिन हम अभी तक ऐसा नहीं करते हैं, परिचित, आदत और गणितीय सुविधा से बाहर हैं। ये अच्छे कारण हो सकते हैं - जैसा कि विज्ञान में है। राजनीति में, रूढ़िवाद के पक्ष में कई अच्छे तर्क हैं - लेकिन मुझे लगता है कि आखिरकार जब हम अधिक जटिल मॉडल के साथ सहज हो जाते हैं, हम उस दिशा में आगे बढ़ेंगे।)

हमें "सामान्य रूप से हर जगह के बारे में सामान्य त्रुटियों के बजाय टी का उपयोग क्यों करना चाहिए"?

जवाबों:


40

क्योंकि, सामान्य त्रुटियों को प्रभावी रूप से मानने के समान है कि बड़ी त्रुटियां नहीं होती हैं! सामान्य वितरण में इतनी हल्की पूंछ होती है, कि बाहर की त्रुटियां मानक विचलन की संभावनाएं बहुत कम होती हैं, मानक विचलन के बाहर की त्रुटियां प्रभावी रूप से असंभव हैं। व्यवहार में, यह धारणा शायद ही कभी सच होती है। जब हम अच्छी तरह से डिज़ाइन किए गए प्रयोगों से छोटे, छोटे डेटासेट का विश्लेषण करते हैं, तो यह ज्यादा मायने नहीं रखता, अगर हम अवशिष्ट का अच्छा विश्लेषण करते हैं। कम गुणवत्ता के डेटा के साथ, यह बहुत अधिक मायने रख सकता है।±3±6

संभावना-आधारित (या बायेसियन) तरीकों का उपयोग करते समय, इस सामान्यता का प्रभाव (जैसा कि ऊपर कहा गया है, प्रभावी रूप से यह "कोई बड़ी त्रुटि नहीं है" -सुमिशन!) अनुमान को बहुत कम मजबूत करना है। विश्लेषण के परिणाम बड़ी त्रुटियों से बहुत अधिक प्रभावित होते हैं! ऐसा होना चाहिए, क्योंकि "कोई बड़ी त्रुटि नहीं" मानती है कि बड़ी त्रुटियों को छोटी त्रुटियों के रूप में व्याख्या करने के लिए हमारे तरीके हैं, और यह केवल सभी त्रुटियों को छोटा करने के लिए औसत मान पैरामीटर को स्थानांतरित करके हो सकता है। इससे बचने का एक तरीका तथाकथित "मजबूत तरीकों" का उपयोग करना है, http://web.archive.org/web/20160611192739/http://www.stats.ox.ac.uk/pub/StatMeth-Robust देखें .pdf

लेकिन एंड्रयू जेलमैन इसके लिए नहीं जाएंगे, क्योंकि आमतौर पर मजबूत तरीकों को अत्यधिक गैर-बायेसियन तरीके से प्रस्तुत किया जाता है। संभावना / बायेसियन मॉडल में टी-डिस्ट्रीब्यूटेड त्रुटियों का उपयोग करना मजबूत तरीकों को प्राप्त करने का एक अलग तरीका है, क्योंकि डिडिएशन में सामान्य से अधिक भारी पूंछ होती है, इसलिए बड़ी त्रुटियों के बड़े अनुपात के लिए अनुमति देता है। स्वतंत्रता पैरामीटर की डिग्री की संख्या पहले से तय की जानी चाहिए, डेटा से अनुमानित नहीं, क्योंकि इस तरह के अनुमान विधि (*) की मजबूती गुणों को नष्ट कर देंगे (यह भी एक बहुत ही कठिन समस्या है, लिए संभावना फ़ंक्शन ,) स्वतंत्रता की संख्या डिग्री, अबाधित हो सकती है, जो बहुत ही अक्षम (यहां तक ​​कि असंगत) आकलनकर्ताओं के लिए अग्रणी है।tν

यदि, उदाहरण के लिए, आप सोचते हैं (डरते हैं) कि दस में से 1 अवलोकनों में "बड़ी त्रुटियां" (3 sd से ऊपर) हो सकती हैं, तो आप स्वतंत्रता के 2 डिग्री के साथ -distribution का उपयोग कर सकते हैं , यदि वह संख्या बढ़ रही हो तो बड़ी त्रुटियों का अनुपात छोटा माना जाता है।t

मुझे ध्यान देना चाहिए कि मैंने जो ऊपर कहा है वह स्वतंत्र distributed त्रुटियों वाले मॉडल के लिए है । त्रुटि वितरण के रूप में बहुभिन्नरूपी -distribution (जो स्वतंत्र नहीं है) के प्रस्ताव भी आए हैं । टीएस ब्रेउश, जेसी रॉबर्टसन और एएच वेल्श द्वारा स्टेटिस्टिका केरलैंडिका (1997) वॉल्यूम में, पेपर में "प्रपोजल ऑफ द मल्टीपैरिएट रिग्रेशन मॉडल" के एक समालोचनात्मक लेख में उस प्रॉप्सल की भारी आलोचना की गई है । 51, एनआर। 3, पीपी 269-286, जहां वे बताते हैं कि बहुभिन्नरूपी त्रुटि वितरण सामान्य से आनुभविक रूप से अप्रभेद्य है। लेकिन वह आलोचना स्वतंत्र मॉडल को प्रभावित नहीं करती है । ttttt

(*) यह बताते हुए एक संदर्भ है कि वेनबेल्स एंड रिप्ले की एमएएस --- एस के साथ आधुनिक एप्लाइड सांख्यिकी (4 जी में पेज 110 पर)।


3
उत्कृष्ट उत्तर (+1)। नोट है कि जब भी तय हो गई है, का आकलन समीकरणों बीमार अगर परिभाषित कर रहे हैं तो मेरा मतलब है कि Gelman का मतलब लेने के के साथ वितरण पैरामीटर तय । जैसा कि इस संबंधित प्रश्न के उत्तर में स्पष्ट किया गया है, यह इस दृष्टिकोण की अपेक्षा की जा सकने वाली मजबूती पर अधिक सीमित है। νν2tνν>2
user603

2
शानदार जवाब और टिप्पणी। लेकिन: 1. जेलमैन एक मानक प्रक्रिया का बचाव कर रहा है जो सामान्य त्रुटियों को मानने से बेहतर होगा। इसलिए, हमें त्रुटियों के लिए टी वितरण के साथ सरल (सामान्य त्रुटियों) की तुलना करनी चाहिए। 2. user603 द्वारा जुड़े संबंधित प्रश्न में, हमें ध्यान देना चाहिए कि यदि qe के पास पूर्व सूचना है, तो हमें इसका उपयोग करना चाहिए। पूर्व सूचनाओं के साथ बेयल्स। और निर्वासन में, हमारे पास पूर्व सूचना होती है जिसका उपयोग नहीं किया जाता है। 3. पूर्ववर्ती भविष्यवाणियों की जाँच के साथ हम d know that the model proposed isnकाफी अच्छे हैं।
मनोएल गाल्डिनो

1
@Neil जी: हाँ, पर कॉची है ! निश्चित रूप से उपयोग करने के लिए भारी-पूंछ वाले वितरण को संबोधित करते हुए बहुत अधिक विश्लेषण की आवश्यकता है। t1
kjetil b halvorsen

1
नहीं, टी-वितरण एकमात्र विकल्प है क्योंकि टी-वितरण गाऊसी मॉडल का उत्तरवर्ती पूर्वानुमान है। गेलमैन सिर्फ टी-वितरण को यादृच्छिक पर नहीं उठा रहा था।
नील जी

1
देखें: मर्फी, केविन पी। "गाऊसी वितरण का संयुग्मी बायेसियन विश्लेषण।" def 1.2 def2 (2007): 16. वह गौसियन मॉडल के उत्तरवर्ती पूर्वानुमान के रूप में टी-वितरण को प्राप्त करता है। यह केवल मॉडलर के मनमाने ढंग से भारी पूंछ वाले वितरण को चुनने का मामला नहीं है।
नील जी

10

यह केवल "भारी पूंछ" की बात नहीं है - बहुत सारे वितरण हैं जो घंटी के आकार के हैं और भारी पूंछ हैं।

टी वितरण गाऊसी मॉडल का उत्तरवर्ती पूर्वानुमान है। यदि आप एक गाऊसी धारणा बनाते हैं, लेकिन इसके पास पर्याप्त सबूत हैं, तो परिणामस्वरूप मॉडल गैर-केंद्रीय स्केल किए गए टी-वितरित भविष्यवाणियों को जरूरी बना रहा है। सीमा में, जितने सबूत आपके पास हैं अनंत तक जाते हैं, आप गौसियन भविष्यवाणियों के साथ समाप्त होते हैं क्योंकि टी वितरण की सीमा गाऊसी है।

क्यों होता है ऐसा? क्योंकि साक्ष्य की एक सीमित मात्रा के साथ, आपके मॉडल के मापदंडों में अनिश्चितता है। गॉसियन मॉडल के मामले में, इस बीच अनिश्चितता केवल विचरण को बढ़ाएगी (यानी, ज्ञात विचरण के साथ गॉसियन की पूर्ववर्ती भविष्यवाणी अभी भी गॉसियन है)। लेकिन विचरण के बारे में अनिश्चितता भारी पूंछ का कारण बनती है। यदि मॉडल को असीमित सबूतों के साथ प्रशिक्षित किया जाता है, तो अब विचरण (या माध्य) में कोई अनिश्चितता नहीं है और आप अपने मॉडल का उपयोग गौसियन भविष्यवाणियां करने के लिए कर सकते हैं।

यह तर्क गाऊसी मॉडल के लिए लागू होता है। यह एक ऐसे पैरामीटर पर भी लागू होता है जो अनुमान लगाया जाता है कि जिसकी संभावना गौसियन है। परिमित डेटा को देखते हुए, पैरामीटर के बारे में अनिश्चितता टी-वितरित है। जहां भी सामान्य धारणाएं हैं (अज्ञात माध्य और विचरण के साथ), और परिमित डेटा, टी-वितरित पश्चवर्ती भविष्यवाणियां हैं।

बायेसियन मॉडल के सभी के लिए समान पश्चवर्ती भविष्यवाणियां वितरण हैं। जेलमैन सुझाव दे रहे हैं कि हमें उनका उपयोग करना चाहिए। उसकी चिंताओं को पर्याप्त साक्ष्य द्वारा कम किया जाएगा।


क्या आप इसे कुछ संदर्भों के साथ वापस कर सकते हैं?
kjetil b halvorsen

2
@kjetilbhalvorsen: मर्फी, केविन पी। "गाऊसी वितरण के संगीता बेयसियन विश्लेषण।" def 1.2 def2 (2007): 16.
नील जी

दिलचस्प परिप्रेक्ष्य, मैंने ऐसा पहले कभी नहीं सुना। तो क्या टी-वितरित त्रुटियां भी टी-वितरित भविष्यवाणियों का कारण बनती हैं? यह मेरे लिए यह गॉसियन त्रुटियों का उपयोग जारी रखने के पक्ष में एक तर्क है । जब तक आप सशर्त आउटलायर्स की अपेक्षा करते हैं , सशर्त त्रुटि मॉडल को उनके लिए अनुमति देने की आवश्यकता नहीं है। यह इस धारणा पर निर्भर करता है कि सभी आउटिंग-नेस भविष्यवक्ताओं के बाहरी मूल्यों से आते हैं। मुझे नहीं लगता कि बहुत सारे मामलों में धारणा इतनी खराब है। और विशुद्ध रूप से सौंदर्य के आधार पर, मैं यह नहीं देखता कि सशर्त और सीमांत वितरण का मिलान क्यों होना है
छायाकार

@ssdecontrol "क्या टी-वितरित त्रुटियां भी टी-वितरित भविष्यवाणियों का कारण बनती हैं?" मुझे नहीं पता, लेकिन मुझे ऐसा नहीं लगता। मेरे लिए, यह परिप्रेक्ष्य एक सहज समझ के लिए बहुत उपयोगी है कि टी-टेस्ट क्यों काम करता है।
नील जी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.