छात्र के टी-वितरण के मापदंडों का अनुमान लगाना


23

छात्र के वितरण के मापदंडों के लिए अधिकतम संभावना अनुमानक क्या हैं? क्या वे बंद रूप में मौजूद हैं? एक त्वरित Google खोज ने मुझे कोई परिणाम नहीं दिया।

आज मुझे यूनीवेट मामले में दिलचस्पी है, लेकिन शायद मुझे मॉडल को कई आयामों तक विस्तारित करना होगा।

संपादित करें: मैं वास्तव में ज्यादातर स्थान और पैमाने के मापदंडों में दिलचस्पी रखता हूं। अभी के लिए मैं मान सकता हूं कि स्वतंत्रता पैरामीटर की डिग्री तय हो गई है, और संभवतः बाद में इष्टतम मूल्य खोजने के लिए कुछ संख्यात्मक योजना का उपयोग करें।


मेरे ज्ञान के लिए वे बंद रूप में मौजूद नहीं हैं। एक क्रमिक एसेंट प्रकार के दृष्टिकोण की आवश्यकता हो सकती है।
पैट

यद्यपि छात्र t वितरण में एक एकल पैरामीटर है, आप बहुवचन में "पैरामीटर" का उल्लेख करते हैं। क्या आप शायद स्थान और / या स्केल पैरामीटर सहित हैं?
whuber

@whuber, टिप्पणी के लिए धन्यवाद, मुझे वास्तव में स्थान और पैमाने के मापदंडों में दिलचस्पी है, स्वतंत्रता की डिग्री से अधिक।
ग्रेजेनियो

डेटा के साथ , स्थान पैरामीटर के लिए संभावना समीकरण बीजगणितीय डिग्री बहुपद के बराबर है । क्या आप इस तरह के बहुपद के एक शून्य को "बंद रूप" में देने पर विचार करते हैं? 2 एन - 1n2n1
whuber

@ क्या, छोटे n के लिए कोई विशेष मामले हैं, जैसे n = 3?
ग्रेजेनियो

जवाबों:


27

बंद फॉर्म टी के लिए मौजूद नहीं है, लेकिन ईएम एल्गोरिथ्म के माध्यम से एक बहुत ही सहज और स्थिर दृष्टिकोण है। अब क्योंकि छात्र मानदंडों का एक बड़ा मिश्रण है, आप अपने मॉडल को इस प्रकार लिख सकते हैं

yi=μ+ei

जहाँ और । इसका मतलब है कि सशर्त रूप से पर केवल भारित माध्य और मानक विचलन है। यह "एम" कदम हैडब्ल्यू मैं ~ जी एक ( νei|σ,wiN(0,σ2wi1)wiwiGa(ν2,ν2)wi

σ 2=Σमैंडब्ल्यूमैं(yमैं - μ )2

μ^=iwiyiiwi
σ^2=iwi(yiμ^)2n

अब "ई" स्टेप को बदल देता है , इसकी अपेक्षा के साथ सभी डेटा दिए गए हैं। यह इस प्रकार दिया गया है:wi

w^i=(ν+1)σ2νσ2+(yiμ)2

इसलिए आप बस ऊपर दिए गए दो चरणों को पुनरावृत्त करते हैं, वर्तमान समीकरण के अनुमानों के साथ प्रत्येक समीकरण के "दाहिने हाथ की ओर" की जगह।

यह बहुत आसानी से टी वितरण की मजबूती गुणों को दर्शाता है क्योंकि बड़े अवशेषों के साथ टिप्पणियों को स्थान लिए गणना में कम वजन प्राप्त होता है , और की गणना में प्रभावित प्रभाव होता है । "बंधे हुए प्रभाव" से मेरा मतलब है कि ith अवलोकन से लिए अनुमान का योगदान किसी दिए गए सीमा से अधिक नहीं हो सकता (यह EM एल्गोरिथ्म में है। इसके अलावा एक "मजबूती" पैरामीटर है जिसमें वृद्धि (घटती) होती है। परिणामस्वरूप को अधिक (कम) एक समान भार और इसलिए अधिक (कम) संवेदनशीलता प्राप्त होगी।σ 2 σ 2μσ2σ2 ν ν(ν+1)σold2νν

ध्यान देने वाली बात यह है कि लॉग लाइबिलिटी फ़ंक्शन में एक से अधिक स्थिर बिंदु हो सकते हैं, इसलिए EM एल्गोरिथ्म एक वैश्विक मोड के बजाय एक स्थानीय मोड में परिवर्तित हो सकता है। लोकल मोड्स तब मिलने की संभावना है, जब लोकेशन पैरामीटर एक आउटलाइन के बहुत करीब शुरू हो। इसलिए इससे बचने के लिए माध्यिका शुरू करना एक अच्छा तरीका है।


1
वह तो कमाल है। मैं स्टूडेंट टी की ईएम का उपयोग करने के विचार के साथ कुछ समय के लिए ठीक रहा, इस कारण से कि यह गौसियों के मिश्रण जैसा दिखता है। क्या आपके पास अपडेट समीकरणों के लिए एक उद्धरण / संदर्भ है? ऐसा होने से इस पद की ललक और भी बढ़ जाएगी।
पैट

वास्तव में, मुझे लगता है कि मैंने खुद को एक छात्र टी के मिश्रण मॉडल के लिए पाया है (जो कि मैं सामान के लिए उपयोग करने जा रहा हूं): कठोर पंजीकरण के लिए एक मजबूत ढांचे के रूप में छात्र के टी-वितरण का मिश्रण। डेमेट्रियोस गेरोगियानिस, क्रिस्टोफोरोस निको, अरिस्टिडिस लिकास। इमेज एंड विजन कम्प्यूटिंग 27 (2009) 1285–1294।
पैट

इस प्रश्न के मेरे उत्तर की लिंक में लोड और लाइबिलिटी फ़ंक्शंस के भार के लिए एक बहुत ही सामान्य EM फ्रेमवर्क है - क्वांटाइल, स्टूडेंट, लॉजिस्टिक, और सामान्य प्रतिगमन करता है। आप विशिष्ट मामले कोविरेट्स के बिना "प्रतिगमन" हैं - केवल अवरोधन - इस रूपरेखा में अच्छी तरह से फिट बैठता है। इसके अलावा, जुर्माना की एक बड़ी संख्या है जिसे आप इस ढांचे में शामिल कर सकते हैं।
प्रोबेबिलिसलॉजिक

@probabilityislogic वास्तव में साफ! और क्या होगा अगर भी अज्ञात है? क्या आप कृपया कुछ संदर्भ भी दे सकते हैं? शायद यहाँ सबसे अच्छा: आंकड़े . stackexchange.com/questions/87405/…ν
क्वार्ट्ज

मुझे लगता है कि यह संदर्भ @ पैट की तुलना में बेहतर है। 'टीएम वितरण का उपयोग करने वाले एमएम और ईएमटी विस्तार, ईसीएम और ईसीएमई का एमएल उत्थान।' स्थानीय-इष्टतम समस्या के कारण EM एल्गोरिथ्म को चलाते समय आपको प्रारंभिक पैरामीटर मान के चयन पर बहुत सावधान रहना होगा। दूसरे शब्दों में, आपको अपने डेटा के बारे में कुछ जानना होगा। आमतौर पर, मैं अपने शोध में टी वितरण के उपयोग से बचता हूं।

4

निम्नलिखित पेपर आपके द्वारा पोस्ट की गई समस्या को ठीक से संबोधित करता है।

लियू सी और रूबिन डीबी 1995। "ईएम और उसके एक्सटेंशन, ईसीएम और ईसीएमई का उपयोग करते हुए टी वितरण का एमएल अनुमान।" स्टेटिस्टिका सिनिका 5: 19–39।

यह स्वतंत्रता की डिग्री के ज्ञान के साथ या उसके बिना एक सामान्य बहुभिन्नरूपी वितरण वितरण अनुमान प्रदान करता है। प्रक्रिया धारा 4 में पाई जा सकती है, और यह 1-आयाम के लिए प्रायिकताओलॉजिक के समान है।


7
ऐसा लगता है कि आप जिस पेपर का उल्लेख करते हैं, उसमें प्रश्न का एक उपयोगी उत्तर होता है, लेकिन उत्तर तब बेहतर होते हैं जब वे स्टैंडअलोन होते हैं और बाहरी संसाधनों की आवश्यकता नहीं होती है (उदाहरण के लिए, यह संभव है कि ओपी या पाठकों के पास इस पेपर तक पहुंच न हो )। आप इसे और अधिक स्टैंडअलोन बनाने के लिए अपना जवाब थोड़ा दे सकते थे?
पैट्रिक कूलोमेबे

3

मुझे संदेह है कि यह बंद रूप में मौजूद है: यदि आप संभावना के किसी एक कारक को और उस का ln ले, आप में एक nonlinear समीकरण मिल जाएगा । यहां तक ​​कि अगर आप एक समाधान प्राप्त करने का प्रबंधन करते हैं, तो कारकों की संख्या (नियम) आधार पर , एमएलई समीकरण इस पर एक nontrivial तरीके से निर्भर करने वाला है। यह सब नाटकीय रूप से सरल है, निश्चित रूप से, जबνएनएनν

Γ(ν+12)νπΓ(ν2)(1+t2ν)ν+12=Γ(ν+12)νπΓ(ν2)exp{[ln(1+t2ν)][ν+12]}
νnnν, जब शक्ति एक घातीय (गॉसियन पीडीएफ) के पास पहुंचती है।

1
यहां तक ​​कि गाऊसी में लॉग संभावना की स्थापना अपने मापदंडों में अशुभ है :-)।
whuber

मुझे वास्तव में स्थान और पैमाने के मापदंडों में दिलचस्पी है, स्वतंत्रता की डिग्री से अधिक। कृपया प्रश्न को संपादित करें देखें, और सटीक नहीं होने के लिए क्षमा करें।
ग्रेजेनियो

2

मैंने हाल ही में छात्र के वितरण के पैमाने के लिए एक बंद-रूप अनुमानक की खोज की है। मेरी जानकारी के अनुसार, यह एक नया योगदान है, लेकिन मैं किसी भी संबंधित परिणाम का सुझाव देने वाली टिप्पणियों का स्वागत करूंगा। कागज "युग्मित घातीय" वितरण के एक परिवार के संदर्भ में विधि का वर्णन करता है। छात्र के टी को युग्मित गौसियन के रूप में जाना जाता है, जहां युग्मन शब्द स्वतंत्रता की डिग्री का पारस्परिक है। क्लोज-फॉर्म स्टेटिस्टिक नमूनों का ज्यामितीय माध्य है। युग्मन या स्वतंत्रता की डिग्री के मूल्य को मानते हुए, पैमाने का एक अनुमान युग्मन और एक हार्मोनिक संख्या को शामिल करने वाले फ़ंक्शन द्वारा नमूनों के ज्यामितीय माध्य को गुणा करके निर्धारित किया जाता है।

https://arxiv.org/abs/1804.03989 युग्मित गौसियन वितरणों के पैमाने के लिए ज्यामितीय माध्य के रूप में ज्यामितीय माध्य का उपयोग, केनिक पी। नेल्सन, मार्क ए। कोन, साबिर आर.उमारोव

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.