कृपया देखें संपादित करें।
जब आपके पास भारी पूंछ के साथ डेटा होता है, तो छात्र-टी त्रुटियों के साथ एक प्रतिगमन करना एक सहज ज्ञान युक्त चीज़ की तरह लगता है। इस संभावना की खोज करते हुए, मैं इस पत्र में भाग गया:
ब्रेश, टीएस, रॉबर्टसन, जेसी, और वेल्श, एएच (01 नवंबर, 1997)। सम्राट के नए कपड़े: बहुभिन्नरूपी टी प्रतिगमन मॉडल की एक आलोचना। स्टेटिस्टिका नीरलैंडिका, 51, 3.) ( लिंक , पीडीएफ )
जो तर्क देता है कि स्केल पैरामीटर और स्वतंत्रता पैरामीटर की डिग्री कुछ अर्थों में एक-दूसरे के संबंध में पहचाने जाने योग्य नहीं हैं और इस वजह से कि टी त्रुटियों के साथ एक प्रतिगमन कर रहा है जो एक मानक रैखिक प्रतिगमन से परे कुछ भी नहीं करता है।
ज़ेलनर (1976) ने एक प्रतिगमन मॉडल प्रस्तावित किया जिसमें डेटा वेक्टर (या त्रुटि वेक्टर) को मल्टीवीरेट छात्र टी वितरण से एक प्राप्ति के रूप में दर्शाया गया है। इस मॉडल ने काफी ध्यान आकर्षित किया है क्योंकि यह भारी-पूंछ वाले त्रुटि वितरण की अनुमति देने के लिए सामान्य गॉसियन धारणा को व्यापक बनाता है। साहित्य के कई परिणामों से संकेत मिलता है कि गॉसियन मॉडल के लिए मानक अनुमान प्रक्रियाएं व्यापक वितरण संबंधी धारणा के तहत उपयुक्त रहती हैं, जिससे मानक तरीकों की मजबूती का दावा किया जाता है। हम बताते हैं कि, हालांकि गणितीय रूप से दोनों मॉडल अलग-अलग हैं, सांख्यिकीय अनुमान के प्रयोजनों के लिए वे अप्रभेद्य हैं। बहुभिन्नरूपी टी मॉडल के अनुभवजन्य निहितार्थ गॉसियन मॉडल के समान हैं। इसलिए डेटा के एक व्यापक वितरणात्मक प्रतिनिधित्व का सुझाव विरल है, और मजबूती के दावे भ्रामक हैं। ये निष्कर्ष लगातार और बायेसियन दोनों दृष्टिकोणों से पहुंचे हैं।
इसने मुझे चौंका दिया।
मेरे पास उनके तर्कों का अच्छी तरह से मूल्यांकन करने के लिए गणितीय परिष्कार नहीं है, इसलिए मेरे पास कुछ सवाल हैं: क्या यह सच है कि टी-त्रुटियों के साथ पंजीकरण करना आम तौर पर उपयोगी नहीं है? यदि वे कभी-कभी उपयोगी होते हैं, तो क्या मुझे पेपर याद आ गया है या यह भ्रामक है? यदि वे उपयोगी नहीं हैं, तो क्या यह एक प्रसिद्ध तथ्य है? क्या भारी पूंछ वाले डेटा के लिए अन्य तरीके हैं?
संपादित करें : पैराग्राफ 3 और सेक्शन 4 के करीब पढ़ने पर, ऐसा लगता है कि नीचे का पेपर इस बारे में बात नहीं कर रहा है कि मैं एक छात्र-टी प्रतिगमन के रूप में क्या सोच रहा था (त्रुटियों को स्वतंत्र अविभाज्य टी डिस्ट्रिब्यूशन हैं)। त्रुटियों को इसके बजाय एक वितरण से तैयार किया गया है और स्वतंत्र नहीं हैं। अगर मैं सही ढंग से समझूं, तो स्वतंत्रता की यह कमी ठीक-ठीक बताती है कि आप स्वतंत्रता के पैमाने और डिग्री का अनुमान क्यों नहीं लगा सकते।
मुझे लगता है कि यह पेपर पढ़ने से बचने के लिए कागजात की एक सूची प्रदान करता है।