इसलिए मैं समझता हूं कि जब आप एचएमएम को प्रशिक्षित करते हैं तो मानक दृष्टिकोण का वर्गीकरण होता है:
- प्रत्येक वर्ग के लिए अपने डेटा सेट को डेटा सेट में अलग करें
- प्रति वर्ग एक एचएमएम को प्रशिक्षित करें
- परीक्षण सेट पर प्रत्येक विंडो को वर्गीकृत करने के लिए प्रत्येक मॉडल की संभावना की तुलना करें
लेकिन मैं प्रत्येक वर्ग पर एचएमएम को कैसे प्रशिक्षित करूं? क्या मैं सिर्फ एक वर्ग से संबंधित डेटा को एक साथ मिलाता हूं? लेकिन क्या टाइम सीरीज़ डेटा का मतलब अनुक्रमिक नहीं है - और अगर मैं ऐसा करता हूँ तो मैं कह रहा हूँ कि कुछ डेटा पॉइंट्स लगातार हैं जब वे नहीं हैं?
अधिक ठोस होने के लिए मेरे पास कुछ ईईजी डेटा है जो एक 96xT मैट्रिक्स है जहां मेरे पास 96 फ़ीचर वैक्टर हैं जो विभिन्न चैनलों से विभिन्न आवृत्तियों की शक्ति वर्णक्रमीय घनत्व हैं और टी सिग्नल के समय की लंबाई है (कुछ नमूना दर पर)
इसे उन खिड़कियों में विभाजित किया जा सकता है जिन्हें मैं प्रायोगिक प्रोटोकॉल से जानता हूं (डेटा लेबल है) और इसलिए मैं प्रत्येक वर्ग के लिए 96 * टी मैट्रिसेस के सेट को एक साथ इकट्ठा कर सकता हूं। जहाँ t, T से कम है और प्रत्येक विंडो के आकार को दर्शाता है।
फिर मैं इस डेटा पर HMM को कैसे प्रशिक्षित करूं? यदि यह मदद करता है कि मैं pmtk3 टूलकिट का उपयोग करने की कोशिश कर रहा हूं, लेकिन मैं वास्तव में कुछ भी उपयोग करने के लिए खुला हूं - यह सिर्फ वास्तविक-मूल्यवान टिप्पणियों से निपटने में सक्षम होना है क्योंकि पावर वर्णक्रमीय घनत्व निरंतर असतत नहीं हैं (डिफ़ॉल्ट MATLL टूलबॉक्स केवल सौदा कर सकते हैं असतत टिप्पणियों के साथ)।
इसका उद्देश्य लेबल डेटा पर प्रशिक्षित मानसिक अवस्था में ईईजी डेटा विंडो को वर्गीकृत करने में सक्षम होना है। यह बर्लिन बीसीआई प्रतियोगिता डेटा का उपयोग करते हुए एक मस्तिष्क-कंप्यूटर इंटरफ़ेस समस्या है ।