रॉब मल्टीवेरेट गौसियन फिट आर में


11

मुझे 7-मंद बादल के लिए एक सामान्यीकृत गाऊसी वितरण को फिट करने की आवश्यकता है जिसमें उच्च उत्तोलन के साथ महत्वपूर्ण संख्या में आउटलेर हैं। क्या आप इस नौकरी के लिए कोई अच्छा आर पैकेज जानते हैं?


3
आपको उत्तरों में बहुभिन्नरूपी आउटलेयर की पहचान करने के लिए कम से कम चार आर संकुल के लिंक मिलेंगे । यह एक अच्छी शुरुआत हो सकती है।
whuber

हो सकता है कि यह सवाल मुझे परेशान कर रहा हो, लेकिन जहाँ तक एक बहुभिन्नरूपी गौसियन वितरण की बात है, तो केवल अनुभवजन्य माध्य का उपयोग क्यों करें और SD MLE के रूप में? आप तब नैदानिक ​​आंकड़ों पर ध्यान केंद्रित कर सकते हैं यदि उच्च प्रभाव / उत्तोलन बिंदु हैं।
एडम 22

मुझे लगता है कि सवाल मापदंडों का अनुमान लगाने के लिए ह्यूबराइज्ड लॉस फ़ंक्शन जैसी किसी चीज़ का उपयोग करने के बारे में है। मैं एक विशेषज्ञ नहीं हूं, लेकिन संभवत: फिट होने के लिए ह्यूबर नुकसान का उपयोग करना एक शुरुआत होगी।
टॉम डिटेरिच

जवाबों:


1

वहाँ भी अस्पष्ट है: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html

एक सावधानी, हालांकि: उच्च आयामी अंतरिक्ष में मिश्रण मॉडलिंग सुंदर सीपीयू और स्मृति को गहन प्राप्त कर सकता है यदि आपके अंकों का बादल बड़ा है। लगभग चार साल पहले मैं 11-आयामी, 50-200K बिंदु डेटा का एक बैच कर रहा था, और यह प्रत्येक मामले के लिए गणना करने के लिए (और मेरे पास 400 था) एक सप्ताह तक लगने के लिए 4-7GB रैम में चल रहा था। यह निश्चित रूप से संभव है, लेकिन अगर आप साझा कंप्यूट क्लस्टर का उपयोग कर रहे हैं या आपके पास सीमित संसाधन उपलब्ध हैं तो सिरदर्द हो सकता है।


1

यह एक क्लासिक बहुभिन्नरूपी गाऊसी मिश्रण मॉडल की तरह लगता है। मुझे लगता है कि BayesM पैकेज काम कर सकता है।

यहाँ कुछ बहुभिन्नरूपी गाऊसी मिश्रण पैकेज हैं

  • बायसेम: क्र.र.प्रो.प्रो ..org/web/packages/bayesm/index.html
  • मिक्सटूल: www.jstatsoft.org/v32/i06/paper
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.