सारांश
छिपे हुए मार्कोव मॉडल (एचएमएम) आवर्तक तंत्रिका नेटवर्क (आरएनएन) की तुलना में बहुत सरल हैं, और मजबूत मान्यताओं पर भरोसा करते हैं जो हमेशा सच नहीं हो सकते हैं। मान्यताओं तो कर रहे हैं सच है तो आप एक HMM से बेहतर प्रदर्शन देख सकते, क्योंकि यह काम कर पाने के लिए कम नख़रेबाज़ है।
यदि आपके पास एक बहुत बड़ा डेटासेट है, तो RNN बेहतर प्रदर्शन कर सकता है, क्योंकि अतिरिक्त जटिलता आपके डेटा में जानकारी का बेहतर लाभ उठा सकती है। यह तब भी सच हो सकता है जब आपके मामले में HMM की धारणा सही हो।
अंत में, अपने अनुक्रम कार्य के लिए केवल इन दो मॉडलों तक ही सीमित न रहें, कभी-कभी सरल रेजगारी (जैसे एआरआईएमए) जीत सकते हैं, और कभी-कभी अन्य जटिल दृष्टिकोण जैसे कि संवादी तंत्रिका नेटवर्क सबसे अच्छा हो सकता है। (हां, सीएनएन को आरएनएन की तरह ही कुछ प्रकार के अनुक्रम डेटा पर लागू किया जा सकता है।)
हमेशा की तरह, यह जानने का सबसे अच्छा तरीका है कि कौन सा मॉडल सबसे अच्छा है, एक आयोजित परीक्षण सेट पर मॉडल बनाने और प्रदर्शन को मापने के लिए।
एचएमएम के मजबूत अनुमान
राज्य के संक्रमण केवल वर्तमान स्थिति पर निर्भर करते हैं, अतीत में किसी भी चीज पर नहीं।
यह धारणा बहुत सारे क्षेत्रों में नहीं है जिनसे मैं परिचित हूं। उदाहरण के लिए, दिखावा करें कि आप दिन के हर मिनट के लिए भविष्यवाणी करने की कोशिश कर रहे हैं कि क्या कोई व्यक्ति आंदोलन डेटा से जाग रहा था या सो रहा था । से किसी को संक्रमण की संभावना को सो करने के लिए जाग बढ़ जाती है लंबे समय तक व्यक्ति में किया गया है सो राज्य। एक आरएनएन सैद्धांतिक रूप से इस रिश्ते को सीख सकता है और उच्च भविष्य कहनेवाला सटीकता के लिए इसका फायदा उठा सकता है।
आप इसके आस-पास प्राप्त करने का प्रयास कर सकते हैं, उदाहरण के लिए पिछले राज्य को एक सुविधा के रूप में शामिल करके, या समग्र अवस्थाओं को परिभाषित करने के लिए, लेकिन जोड़ा गया जटिलता हमेशा एक HMM की पूर्वानुमान सटीकता में वृद्धि नहीं करता है, और यह निश्चित रूप से गणना समय की मदद नहीं करता है।
आपको राज्यों की कुल संख्या को पूर्व-निर्धारित करना चाहिए।
नींद के उदाहरण पर लौटना, ऐसा प्रतीत हो सकता है जैसे कि केवल दो राज्य हैं जिनकी हम परवाह करते हैं। हालांकि, यहां तक कि अगर हम केवल भविष्यवाणी के बारे में परवाह जाग बनाम सो , हमारे मॉडल इस तरह, ड्राइविंग वर्षा, आदि के रूप में अतिरिक्त राज्यों पता लगाना से लाभ हो सकता है (जैसे स्नान आमतौर पर सही सोने से पहले आता है)। फिर, एक आरएनएन सैद्धांतिक रूप से इस तरह के रिश्ते को सीख सकता है यदि इसके पर्याप्त उदाहरण दिखाए जाएं।
RNN के साथ कठिनाइयाँ
यह ऊपर से लग सकता है कि आरएनएन हमेशा श्रेष्ठ होते हैं। मुझे ध्यान देना चाहिए, हालांकि, आरएनएन को काम करना मुश्किल हो सकता है, खासकर जब आपका डेटासेट छोटा हो या आपका क्रम बहुत लंबा हो। मुझे व्यक्तिगत रूप से अपने कुछ डेटा पर प्रशिक्षित करने के लिए RNN प्राप्त करने में परेशानी हुई है, और मुझे संदेह है कि अधिकांश प्रकाशित RNN विधियों / दिशानिर्देशों को पाठ डेटा के लिए तैयार किया गया है । गैर-पाठ डेटा पर RNN का उपयोग करने की कोशिश करते समय मुझे अपने विशेष डेटासेट पर अच्छे परिणाम प्राप्त करने के लिए मेरी देखभाल की तुलना में एक व्यापक हाइपरपैरेट खोज की आवश्यकता होती है।
कुछ मामलों में, मैंने पाया है कि अनुक्रमिक डेटा के लिए सबसे अच्छा मॉडल वास्तव में एक यूनेट शैली है ( https://arxiv.org/pdf/1505.04597.pdf ) संवेदी तंत्रिका नेटवर्क मॉडल चूंकि यह ट्रेन करना आसान और तेज़ है, और सक्षम है सिग्नल के पूर्ण संदर्भ को ध्यान में रखना।