डेटा माइनिंग के तरीकों का अध्ययन करते समय मुझे समझ में आया है कि दो मुख्य श्रेणियां हैं:
भविष्य कहनेवाला तरीके:
- वर्गीकरण
- वापसी
वर्णनात्मक तरीके:
- क्लस्टरिंग
- एसोसिएशन के नियम
चूंकि मैं स्थान, गतिविधि, बैटरी स्तर (प्रशिक्षण मॉडल के लिए इनपुट) के आधार पर उपयोगकर्ता की उपलब्धता (आउटपुट) की भविष्यवाणी करना चाहता हूं, मुझे लगता है कि यह स्पष्ट है कि मैं "भविष्य कहनेवाला तरीके" चुनूंगा, लेकिन अब मैं बीच का चयन नहीं कर सकता वर्गीकरण और प्रतिगमन। जो मैं इसे दूर से समझता हूं, वर्गीकरण मेरी समस्या को हल कर सकता है, क्योंकि आउटपुट "उपलब्ध" या "उपलब्ध नहीं" है।
क्या वर्गीकरण मुझे उपयोगकर्ता की संभावना (या संभावना) उपलब्ध करा सकता है या उपलब्ध नहीं है?
जैसा कि आउटपुट में केवल 0 (उपलब्ध नहीं) या 1 (उपलब्ध के लिए) नहीं होगा, लेकिन यह कुछ इस तरह होगा:
- उपलब्ध
- उपलब्ध नहीं है
क्या प्रतिगमन का उपयोग करके भी इस समस्या को हल किया जा सकता है?
मुझे लगता है कि प्रतिगमन का उपयोग निरंतर आउटपुट के लिए किया जाता है (न केवल 0 या 1 आउटपुट पर), लेकिन आउटपुट उपयोगकर्ता की उपलब्धता का निरंतर मूल्य नहीं हो सकता (जैसे आउटपुट होना अर्थ उपयोगकर्ता है उपलब्ध है, स्पष्ट रूप से उपयोगकर्ता है उपलब्ध नहीं)।