इनपुट के अनुक्रम को देखते हुए, मुझे यह निर्धारित करने की आवश्यकता है कि क्या इस अनुक्रम में एक निश्चित वांछित संपत्ति है। संपत्ति केवल सही या गलत हो सकती है, अर्थात्, केवल दो संभावित वर्ग हैं जो एक अनुक्रम से संबंधित हो सकते हैं।
अनुक्रम और संपत्ति के बीच सटीक संबंध स्पष्ट नहीं है, लेकिन मेरा मानना है कि यह बहुत सुसंगत है और खुद को सांख्यिकीय वर्गीकरण के लिए उधार देना चाहिए। मेरे पास क्लासिफायर को प्रशिक्षित करने के लिए बड़ी संख्या में मामले हैं, हालांकि यह थोड़ा शोर हो सकता है, इस अर्थ में कि थोड़ी संभावना है कि इस प्रशिक्षण सेट में एक अनुक्रम गलत वर्ग को सौंपा गया है।
उदाहरण प्रशिक्षण डेटा:
Sequence 1: (7 5 21 3 3) -> true
Sequence 2: (21 7 5 1) -> true
Sequence 3: (12 21 7 5 11 1) -> false
Sequence 4: (21 5 7 1) -> false
...
मोटे शब्दों में, संपत्ति अनुक्रम में मूल्यों के सेट द्वारा निर्धारित की जाती है (उदाहरण के लिए "11 की उपस्थिति" का अर्थ है कि संपत्ति लगभग निश्चित रूप से झूठी होगी), साथ ही मूल्यों का क्रम भी (जैसे "21 7 5) "काफी संभावना बढ़ जाती है कि संपत्ति सच है)।
प्रशिक्षण के बाद, मुझे क्लासिफायर को पहले से अनदेखा अनुक्रम देने में सक्षम होना चाहिए, जैसे (1 21 7 5 3)
, और यह अपने आत्मविश्वास का उत्पादन करना चाहिए कि संपत्ति सच है। क्या इस तरह के इनपुट / आउटपुट के साथ एक क्लासिफायरियर प्रशिक्षण के लिए एक प्रसिद्ध एल्गोरिथ्म है?
मैंने भोले बायेसियन क्लासिफायर पर विचार किया है (जो वास्तव में इस तथ्य के अनुकूल नहीं है कि ऑर्डर मायने रखता है, कम से कम इस धारणा को गंभीर रूप से तोड़े बिना कि इनपुट स्वतंत्र हैं)। मैंने छिपे हुए मार्कोव मॉडल दृष्टिकोण की भी जांच की है, जो अनुचित प्रतीत होता है क्योंकि प्रति इनपुट एक आउटपुट के बजाय केवल एक ही आउटपुट उपलब्ध है। मुझसे क्या छूट गया?