मेरे पास इस सेमेस्टर में मशीन लर्निंग कोर्स है और प्रोफेसर ने हमें वास्तविक दुनिया की समस्या का पता लगाने और कक्षा में पेश किए गए मशीन सीखने के तरीकों में से एक के द्वारा हल करने के लिए कहा , जैसे:
- निर्णय के पेड़
- कृत्रिम तंत्रिका प्रसार
- समर्थन वेक्टर मशीन
- उदाहरण आधारित लर्निंग ( kNN , LWL )
- बायेसियन नेटवर्क
- सुदृढीकरण सीखना
मैं के प्रशंसकों में से एक हूँ stackoverflow और stackexchange और पता डेटाबेस उदासीनता के इन वेबसाइटों जनता के लिए प्रदान की जाती हैं, क्योंकि वे भयानक हैं! मुझे आशा है कि मुझे इन डेटाबेस के बारे में एक अच्छी मशीन सीखने की चुनौती मिल सकती है और इसे हल कर सकते हैं।
मेरा विचार
एक विचार मेरे दिमाग में आया कि प्रश्न शरीर में दर्ज शब्दों के आधार पर प्रश्नों के लिए टैग की भविष्यवाणी कर रहा है। मुझे लगता है कि बायेसियन नेटवर्क एक प्रश्न के लिए टैग सीखने का सही उपकरण है, लेकिन अधिक शोध की आवश्यकता है। वैसे भी, सीखने के चरण के बाद जब उपयोगकर्ता प्रश्न दर्ज करना समाप्त करता है तो कुछ टैग उसे सुझाए जाने चाहिए।
कृपया मुझे बताओ :
मैं एमएल दो प्रश्नों के बारे में अनुभवी लोगों के रूप में सांख्यिकी समुदाय से पूछना चाहता हूं:
क्या आपको लगता है कि टैग सुझाव कम से कम एक समस्या है जिसे हल करने का कोई मौका है? क्या आपके पास इसके बारे में कोई सलाह है? मैं थोड़ा चिंतित हूं क्योंकि स्टैटेक्सचेंज इस तरह की सुविधा को अभी तक लागू नहीं करता है।
क्या आपके पास एमएल प्रोजेक्ट के लिए कोई अन्य / बेहतर विचार है जो स्टैकटेक्चेंज डेटाबेस पर आधारित है? मुझे स्टैटेक्सचेंज डेटाबेस से कुछ सीखना बहुत मुश्किल है ।
डेटाबेस त्रुटियों के बारे में विचार: मैं यह बताना चाहूंगा कि यद्यपि डेटाबेस विशाल हैं और कई उदाहरण हैं, वे सही नहीं हैं और त्रुटि के लिए प्रवण हैं। स्पष्ट एक उपयोगकर्ताओं की उम्र है जो अविश्वसनीय है। यहां तक कि प्रश्न के लिए चयनित टैग भी 100% सही नहीं हैं। वैसे भी, हमें समस्या का चयन करने में डेटा की शुद्धता के प्रतिशत पर विचार करना चाहिए।
समस्या के बारे में विचार: मेरी परियोजना के बारे में data-mining
या ऐसा कुछ नहीं होना चाहिए । यह सिर्फ वास्तविक दुनिया में एमएल तरीकों का एक आवेदन होना चाहिए।