मैं एचएमएम को वर्गीकरण के लिए कैसे प्रशिक्षित करूं?


12

इसलिए मैं समझता हूं कि जब आप एचएमएम को प्रशिक्षित करते हैं तो मानक दृष्टिकोण का वर्गीकरण होता है:

  1. प्रत्येक वर्ग के लिए अपने डेटा सेट को डेटा सेट में अलग करें
  2. प्रति वर्ग एक एचएमएम को प्रशिक्षित करें
  3. परीक्षण सेट पर प्रत्येक विंडो को वर्गीकृत करने के लिए प्रत्येक मॉडल की संभावना की तुलना करें

लेकिन मैं प्रत्येक वर्ग पर एचएमएम को कैसे प्रशिक्षित करूं? क्या मैं सिर्फ एक वर्ग से संबंधित डेटा को एक साथ मिलाता हूं? लेकिन क्या टाइम सीरीज़ डेटा का मतलब अनुक्रमिक नहीं है - और अगर मैं ऐसा करता हूँ तो मैं कह रहा हूँ कि कुछ डेटा पॉइंट्स लगातार हैं जब वे नहीं हैं?

अधिक ठोस होने के लिए मेरे पास कुछ ईईजी डेटा है जो एक 96xT मैट्रिक्स है जहां मेरे पास 96 फ़ीचर वैक्टर हैं जो विभिन्न चैनलों से विभिन्न आवृत्तियों की शक्ति वर्णक्रमीय घनत्व हैं और टी सिग्नल के समय की लंबाई है (कुछ नमूना दर पर)

इसे उन खिड़कियों में विभाजित किया जा सकता है जिन्हें मैं प्रायोगिक प्रोटोकॉल से जानता हूं (डेटा लेबल है) और इसलिए मैं प्रत्येक वर्ग के लिए 96 * टी मैट्रिसेस के सेट को एक साथ इकट्ठा कर सकता हूं। जहाँ t, T से कम है और प्रत्येक विंडो के आकार को दर्शाता है।

फिर मैं इस डेटा पर HMM को कैसे प्रशिक्षित करूं? यदि यह मदद करता है कि मैं pmtk3 टूलकिट का उपयोग करने की कोशिश कर रहा हूं, लेकिन मैं वास्तव में कुछ भी उपयोग करने के लिए खुला हूं - यह सिर्फ वास्तविक-मूल्यवान टिप्पणियों से निपटने में सक्षम होना है क्योंकि पावर वर्णक्रमीय घनत्व निरंतर असतत नहीं हैं (डिफ़ॉल्ट MATLL टूलबॉक्स केवल सौदा कर सकते हैं असतत टिप्पणियों के साथ)।

इसका उद्देश्य लेबल डेटा पर प्रशिक्षित मानसिक अवस्था में ईईजी डेटा विंडो को वर्गीकृत करने में सक्षम होना है। यह बर्लिन बीसीआई प्रतियोगिता डेटा का उपयोग करते हुए एक मस्तिष्क-कंप्यूटर इंटरफ़ेस समस्या है ।


1
क्या यह पृष्ठ आपके लिए आवश्यक है?
विलय

ऐसा लगता है - मैं इसे सुनिश्चित करने की कोशिश करूँगा। यह निश्चित रूप से गौसियन और गाऊसी मॉडल के मिश्रण के बजाय सिर्फ बहुराष्ट्रीय कंपनियों के लिए अनुमति देता है। और यह प्रतीत होता है कि आप विश्व स्तर पर एक मॉडल को कई टिप्पणियों पर प्रशिक्षित कर सकते हैं इसलिए यह अच्छा दिखता है। मैं वैसे भी अजगर को ठीक से सीखने का अर्थ रखता हूं क्योंकि इसका अधिक व्यापक उपयोग है। धन्यवाद :)
एलेक्स मैकमरे

जवाबों:


9

टी

आपने Reddit पर उल्लेख किया है कि आप प्रत्येक वर्ग के लिए एक ही राज्य निर्दिष्ट करने में संकोच कर रहे थे। क्या आपने यह कोशिश की है? यह उतना खराब काम नहीं हो सकता जितना आप सोचते हैं। इस मामले में अनुमान की समस्या भी काफी आसान है। संक्रमण संभावनाओं का अनुमान लगाना आसान है, आप बस आवश्यक रूप से गणना करते हैं। इसके अलावा आप बस अस्थायी पहलुओं की अनदेखी कर डेटा और इसी वर्ग के आधार पर प्रत्येक राज्य के लिए उत्सर्जन संभावनाओं को फिट कर सकते हैं।

एनएन×रोंमैं=1,...,मैं=1,...एनटीटी

अंत में, आप एक सशर्त यादृच्छिक क्षेत्र की तरह एक भेदभावपूर्ण मॉडल पर जा सकते हैं। एक भेदभावपूर्ण मॉडल आपको आसानी से अधिक जटिल विशेषताओं को शामिल करने की अनुमति देगा और अधिक सीधे हाथ में समस्या को संबोधित करेगा (सशर्त घनत्व का आकलन)। यह शायद वही है जो मैं पहले कोशिश करूँगा।


देखे गए मूल्य निरंतर हैं इसलिए मैं एक गौसियन या जीएमएम फिट करूंगा। Reddit पर चर्चा के रूप में यह मॉडल की क्षमता को सीमित करता है। मैं इस मॉडल का उपयोग यह देखने के लिए कर रहा हूं कि स्थैतिक पहलू, स्थैतिक मॉडल की तुलना में वर्गीकरण सटीकता को कैसे प्रभावित करता है। मुझे पता है कि भेदभावपूर्ण मॉडल वर्गीकरण के लिए बेहतर हो सकते हैं और मर्फी की थीसिस के बिट्स पढ़ सकते हैं। यह दिलचस्प लगता है लेकिन एचएमएम की सिफारिश मेरे प्रोफेसर ने की थी (यह एक ओपन-एंडेड प्रोजेक्ट है) इसलिए मैं कोशिश करूंगा। मैं भविष्य में ईईजी / एमईजी संकेतों के साथ अधिक काम करना चाहता हूं, हालांकि मैं कुछ बिंदुओं पर अन्य तरीकों की कोशिश करूंगा। :)
एलेक्स मैकमरे

1
अंत में मैंने कई टिप्पणियों के लिए स्केलेर और इसके समर्थन का उपयोग किया। यह सही ढंग से काम करने के लिए लग रहा था। मुझे कोड में खुदाई करनी चाहिए और देखना चाहिए कि यह वास्तव में इससे कैसे निपटता है।
एलेक्स मैकमरे

1
एलेक्स, क्या आप एक लिंक या उदाहरण प्रदान कर सकते हैं जिसे आप "स्केलेर और इसके कई टिप्पणियों के लिए समर्थन" के रूप में संदर्भित करते हैं? मैं कई वर्षों से इस समस्या (और एचएमएम को "बताने" के संबंधित समस्या से जूझ रहा हूं कि कई अवलोकन एकल वर्ग लेबल के हैं) और यह जानना अच्छा लगेगा कि आपने उन्हें कैसे संबोधित किया।
रुबेनुलिस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.