क्या छात्र-टी त्रुटियों के साथ प्रतिगमन बेकार हैं?


10

कृपया देखें संपादित करें।

जब आपके पास भारी पूंछ के साथ डेटा होता है, तो छात्र-टी त्रुटियों के साथ एक प्रतिगमन करना एक सहज ज्ञान युक्त चीज़ की तरह लगता है। इस संभावना की खोज करते हुए, मैं इस पत्र में भाग गया:

ब्रेश, टीएस, रॉबर्टसन, जेसी, और वेल्श, एएच (01 नवंबर, 1997)। सम्राट के नए कपड़े: बहुभिन्नरूपी टी प्रतिगमन मॉडल की एक आलोचना। स्टेटिस्टिका नीरलैंडिका, 51, 3.) ( लिंक , पीडीएफ )

जो तर्क देता है कि स्केल पैरामीटर और स्वतंत्रता पैरामीटर की डिग्री कुछ अर्थों में एक-दूसरे के संबंध में पहचाने जाने योग्य नहीं हैं और इस वजह से कि टी त्रुटियों के साथ एक प्रतिगमन कर रहा है जो एक मानक रैखिक प्रतिगमन से परे कुछ भी नहीं करता है।

ज़ेलनर (1976) ने एक प्रतिगमन मॉडल प्रस्तावित किया जिसमें डेटा वेक्टर (या त्रुटि वेक्टर) को मल्टीवीरेट छात्र टी वितरण से एक प्राप्ति के रूप में दर्शाया गया है। इस मॉडल ने काफी ध्यान आकर्षित किया है क्योंकि यह भारी-पूंछ वाले त्रुटि वितरण की अनुमति देने के लिए सामान्य गॉसियन धारणा को व्यापक बनाता है। साहित्य के कई परिणामों से संकेत मिलता है कि गॉसियन मॉडल के लिए मानक अनुमान प्रक्रियाएं व्यापक वितरण संबंधी धारणा के तहत उपयुक्त रहती हैं, जिससे मानक तरीकों की मजबूती का दावा किया जाता है। हम बताते हैं कि, हालांकि गणितीय रूप से दोनों मॉडल अलग-अलग हैं, सांख्यिकीय अनुमान के प्रयोजनों के लिए वे अप्रभेद्य हैं। बहुभिन्नरूपी टी मॉडल के अनुभवजन्य निहितार्थ गॉसियन मॉडल के समान हैं। इसलिए डेटा के एक व्यापक वितरणात्मक प्रतिनिधित्व का सुझाव विरल है, और मजबूती के दावे भ्रामक हैं। ये निष्कर्ष लगातार और बायेसियन दोनों दृष्टिकोणों से पहुंचे हैं।

इसने मुझे चौंका दिया।

मेरे पास उनके तर्कों का अच्छी तरह से मूल्यांकन करने के लिए गणितीय परिष्कार नहीं है, इसलिए मेरे पास कुछ सवाल हैं: क्या यह सच है कि टी-त्रुटियों के साथ पंजीकरण करना आम तौर पर उपयोगी नहीं है? यदि वे कभी-कभी उपयोगी होते हैं, तो क्या मुझे पेपर याद आ गया है या यह भ्रामक है? यदि वे उपयोगी नहीं हैं, तो क्या यह एक प्रसिद्ध तथ्य है? क्या भारी पूंछ वाले डेटा के लिए अन्य तरीके हैं?

संपादित करें : पैराग्राफ 3 और सेक्शन 4 के करीब पढ़ने पर, ऐसा लगता है कि नीचे का पेपर इस बारे में बात नहीं कर रहा है कि मैं एक छात्र-टी प्रतिगमन के रूप में क्या सोच रहा था (त्रुटियों को स्वतंत्र अविभाज्य टी डिस्ट्रिब्यूशन हैं)। त्रुटियों को इसके बजाय एक वितरण से तैयार किया गया है और स्वतंत्र नहीं हैं। अगर मैं सही ढंग से समझूं, तो स्वतंत्रता की यह कमी ठीक-ठीक बताती है कि आप स्वतंत्रता के पैमाने और डिग्री का अनुमान क्यों नहीं लगा सकते।

मुझे लगता है कि यह पेपर पढ़ने से बचने के लिए कागजात की एक सूची प्रदान करता है।


क्या आपको लगता है कि आपको ड्रॉपबॉक्स के माध्यम से कागज वितरित करने की अनुमति है। बेहतर दोहरी जांच।
टॉबी एल तेजेदोर

मुझे लगता है कि लैप्लस वितरण आपको कुछ हद तक भारी पूंछ का इलाज करने का अवसर देता है।
टॉबी एल तेजेदर

जवाबों:


5

आपका संपादन सही है। कागज में प्रस्तुत परिणाम केवल बहुभिन्नरूपी-टी त्रुटियों पर लागू होते हैं। यदि आप स्वतंत्र टी त्रुटियों का उपयोग कर रहे हैं, तो आप सुरक्षित हैं।

मुझे नहीं लगता कि कागज अच्छी तरह से जाना जाता है, लेकिन मुझे लगता है कि यह सही है।

सांख्यिकीय साहित्य "सामान्यीकरण" से भरा है, जो कई मामलों में या तो पुनर्संरचना, एक-से-एक परिवर्तन या कभी-कभी बेकार हैं क्योंकि वे प्रश्न में मॉडल के कुछ गुणों को सामान्य करने में महत्वपूर्ण योगदान नहीं देते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.