वर्गीकरण के लिए अर्ध-पर्यवेक्षित शिक्षण, सक्रिय शिक्षण और गहन शिक्षा


19

अपडेट किए गए सभी संसाधनों के साथ अंतिम संपादन:

एक परियोजना के लिए, मैं वर्गीकरण के लिए मशीन लर्निंग एल्गोरिदम लागू कर रहा हूं।

चुनौती: सीमित लेबल डेटा और बहुत अधिक अनलिस्टेड डेटा।

लक्ष्य:

  1. अर्ध-पर्यवेक्षित वर्गीकरण लागू करें
  2. किसी तरह अर्ध-पर्यवेक्षित लेबलिंग प्रक्रिया लागू करें (सक्रिय शिक्षण के रूप में जाना जाता है)

मैंने शोध पत्रों से बहुत सारी जानकारी प्राप्त की है, जैसे EM, Transductive SVM या S3VM (Semi Supervised SVM), या किसी तरह LDA का उपयोग करना, आदि। यहाँ तक कि इस विषय पर कुछ पुस्तकें भी हैं।

प्रश्न: कार्यान्वयन और व्यावहारिक स्रोत कहां हैं?


अंतिम अद्यतन (mpiktas, बायर और डिक्रान मार्सुपियल द्वारा प्रदान की गई सहायता पर आधारित)

अर्ध-पर्यवेक्षित शिक्षा:

सक्रिय अध्ययन:

  • द्वैतवादी : पाठ वर्गीकरण पर स्रोत कोड के साथ सक्रिय शिक्षण का कार्यान्वयन
  • यह वेबपेज सक्रिय शिक्षण का एक अद्भुत अवलोकन प्रदान करता है।
  • एक प्रयोगात्मक डिजाइन कार्यशाला: यहाँ

ध्यान लगा के पढ़ना या सीखना:


एक आर पैकेज है RTextTools । अगर मैं गलत नहीं हूँ तो यह आपके द्वारा बताए गए कई तरीकों को लागू करता है।
एमपिकेटस

हाय mpiktas, अपनी तरह की मदद के लिए धन्यवाद। यह एक दिलचस्प टूलकिट है। हालाँकि, ऐसा लगता है कि यह केवल पर्यवेक्षित शिक्षण से संबंधित है, जैसा कि मैंने पढ़ा "टेक्स्टटूल स्वचालित पाठ वर्गीकरण के लिए एक स्वतंत्र, ओपन सोर्स मशीन लर्निंग पैकेज है जो नौसिखिया और उन्नत उपयोगकर्ताओं दोनों के लिए सरल है कि वे पर्यवेक्षित शिक्षण के साथ शुरुआत करें। पैकेज में शामिल हैं। पहनावा वर्गीकरण के लिए नौ एल्गोरिदम (svm, slda, बूस्टिंग, बैगिंग, यादृच्छिक वन, glmnet, निर्णय पेड़, तंत्रिका नेटवर्क, अधिकतम एन्ट्रॉपी) "
परत

ठीक है, यहाँ एक और कोशिश है: वीका । लेखकों ने एक पुस्तक लिखी है, और इसकी सामग्री की तालिका में अर्ध-पर्यवेक्षणीय सीखने का उल्लेख है। मुझे पूरी उम्मीद है कि अध्याय "के साथ समाप्त नहीं होता है ... दुर्भाग्य से इन एल्गोरिदम में से कोई भी Weka में लागू नहीं होता है" :)
mpiktas

Drat, मुझे पुस्तक का पुराना संस्करण मिला! इस स्रोत को इंगित करने के लिए बहुत बहुत धन्यवाद!
फ्लाइट

जवाबों:


8

ऐसा लगता है जैसे गहरी शिक्षा आपके लिए बहुत दिलचस्प हो सकती है। यह गहरे संबंधवादी मॉडल का एक बहुत हालिया क्षेत्र है, जो एक अनपेक्षित तरीके से ढाला जाता है और पर्यवेक्षण के बाद ठीक से ट्यून किया जाता है। ठीक ट्यूनिंग के लिए प्रीट्रेनिंग की तुलना में बहुत कम नमूनों की आवश्यकता होती है।

अपनी जीभ को गीला करने के लिए, मैं सलाह देता हूं [सेण्टिग हशिंग सलाखुद्दीनोव , हिंटन । रायटर कॉर्पस के अलग-अलग दस्तावेजों के लिए पाए जाने वाले कोडों पर एक नज़र डालें: (अप्रकाशित!)

यहाँ छवि विवरण दर्ज करें

यदि आपको कुछ कोड लागू करने की आवश्यकता है, तो deeplearning.net को देखें । मुझे विश्वास नहीं है कि बॉक्स समाधान से बाहर हैं, हालांकि।


यह मेरे लिए काफी रोचक और नई जानकारी है। बेशक आउट ऑफ बॉक्स इम्प्लीमेंटेशन बेहतर होगा, लेकिन इससे मुझे वास्तव में कुछ जानने में मदद मिलती है कि मैं क्या चाहता हूं। धन्यवाद।
परत

5

इसाबेल गेलोन (और सहकर्मियों) ने थोड़ी देर पहले सक्रिय सीखने पर एक चुनौती का आयोजन किया, कार्यवाही यहां (खुली पहुंच) प्रकाशित की जाती है । यह काफी व्यावहारिक होने का लाभ है और आप एक निष्पक्ष (बोलचाल की समझ में) प्रोटोकॉल के तहत विभिन्न तरीकों के प्रदर्शन की सीधे तुलना कर सकते हैं (पैटर्न का यादृच्छिक चयन आश्चर्यजनक रूप से हरा करने के लिए कठिन है)।


हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.