गाऊसी मिश्रण मॉडल का उपयोग कब करें?


9

मैं GMM का उपयोग करने के लिए नया हूं। मुझे ऑनलाइन कोई उचित मदद नहीं मिल रही थी। किसी ने भी मुझे सही संसाधन प्रदान कर सकता है "जीएमएम का उपयोग करके मेरी समस्या का समाधान कैसे करें?" या वर्गीकरण समस्याओं के मामले में "मुझे कैसे तय करना है कि मुझे एसवीएम वर्गीकरण या जीएमएम वर्गीकरण का उपयोग करना है?"


उर डेटा सेट क्या है और आपकी सटीक समस्या क्या है? इसका उपयोग तब किया जाता है जब डेटा 1 से अधिक सामान्य वितरण (निम्न का मिश्रण होता है)। एक और प्रश्न देखें - आंकड़े.स्टैकएक्सचेंज.com
अर्पित सिसोदिया

आप इसे क्लस्टरिंग के एक रूप के रूप में सोच सकते हैं जहां आपके पास डेटा लेबल नहीं है और विश्वास करें कि अव्यक्त समूह पूरी तरह से बहुभिन्नरूपी सामान्य हैं।
गंग - मोनिका

@ arpit-sisodia, हम एक हार्डवेयर कीबोर्ड सेटअप की व्यवहार्यता पर काम कर रहे हैं, जिसमें विशिष्ट विशेषताएं हैं और हम GMM का उपयोग करके इसे मॉडल करने की योजना बना रहे हैं। हम अंतर्निहित प्रक्रिया को स्पष्ट रूप से नहीं जानते हैं और इसलिए हम मशीन सीखने के तरीकों का उपयोग करके मॉडल बनाने की कोशिश कर रहे हैं। इसलिए, हमें यकीन नहीं है कि अंतर्निहित प्रक्रिया में वास्तव में गॉसियों का मिश्रण है। इसके अलावा, यह बहुआयामी है और हम यह देखने के लिए कल्पना नहीं कर सकते हैं कि क्या यह गौसियों का मिश्रण है
विनय

@ arpit-sisodia, आपके द्वारा प्रदान किया गया लिंक यह देखने के लिए अधिक परीक्षण और त्रुटि विधि का सुझाव देता है कि क्या GMM मेरे डेटा पर फिट बैठता है। क्या उपयोग करने के लिए मॉडल पर निर्णय लेने के लिए एक निर्णायक तरीका / अंगूठा नियम है। अधिक मिश्रण के साथ खेलने की ट्रायल-एंड-एरर विधि मेरे डेटा को फिट कर सकती है। लेकिन क्या इस पर निर्णय लेने का एक निश्चित तरीका है? जैसे हमें SVM वर्गीकरण के लिए रैखिक पृथक्करण की आवश्यकता है
विनय

जवाबों:


4

मेरी राय में, आप जीएमएम का प्रदर्शन कर सकते हैं जब आप जानते हैं कि डेटा बिंदु एक गाऊसी वितरण के मिश्रण हैं। मूल रूप से अलग-अलग माध्य और मानक विचलन के साथ क्लस्टर बनाते हैं। स्किटिट-लर्न वेबसाइट पर एक अच्छा आरेख है। एल

GMM वर्गीकरण

एक दृष्टिकोण नरम क्लस्टरिंग विधियों का उपयोग करके क्लस्टर ढूंढना है और फिर देखें कि क्या वे गॉसियन हैं। यदि वे हैं तो आप GMM मॉडल लागू कर सकते हैं जो संपूर्ण डेटासेट का प्रतिनिधित्व करता है।


1
अक्सर हम यह नहीं जानते कि डेटा पॉइंट गौसियंस का मिक्सचर हैं या नहीं। तो, यह गाऊसी और MoG के साथ खेलने के आसपास अधिक है और देखें कि क्या यह फिट बैठता है। लेकिन GMM के सही उपयोग के बारे में जाने के लिए कोई निर्देश / अंगूठा नियम नहीं हैं
विनय

2
मेरे अनुभव के अनुसार आपको डेटा में उस पैटर्न को खोजने की आवश्यकता है जो उसका मिक्सचर मॉडल है। पढ़ने के लिए एक अच्छा पेपर यह होगा: stat.cmu.edu/~cshalizi/uADA/12/lectures/ch20.pdf
स्लेयर

0

GMM आमतौर पर शुरू करने के लिए एक अच्छी जगह है यदि आपका लक्ष्य या तो (1) क्लस्टर टिप्पणियों का है, (2) एक जेनरेटर मॉडल निर्दिष्ट करें, या (3) अनुमान घनत्व। वास्तव में, क्लस्टरिंग के लिए, जीएमएम k- साधनों का एक सुपरसेट हैं ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.