आप अनलिस्टेड डेटा के बारे में सही हैं। आरबीएम जनरेटेड मॉडल हैं और आमतौर पर इसका उपयोग अप्रशिक्षित शिक्षार्थियों के रूप में किया जाता है।
जब एक डीप विश्वास नेटवर्क के निर्माण के लिए उपयोग किया जाता है, तो सबसे सामान्य प्रक्रिया यह है कि प्रत्येक नए RBM को एक समय में एक-दूसरे के शीर्ष पर स्टैक करने के लिए बस एक ही ट्रेन दी जाए। इसलिए विपरीत विचलन, इस अर्थ में ऊपर और नीचे नहीं जा रहा है कि मुझे लगता है कि आपका मतलब है। यह एक समय में केवल एक आरबीएम के साथ काम कर रहा है, पिछले शीर्षतम आरबीएम की छिपी हुई परत का उपयोग करके नए सबसे ऊपरी बीएमबी के लिए इनपुट के रूप में। इस सब के बाद आप या तो आरबीएम वेट के स्टैक को एक मानक फ़ीड फॉरवर्ड न्यूरल नेटवर्क के लिए शुरुआती वेट के रूप में मान सकते हैं और अपने लेबल किए गए डेटा और बैकप्रॉपैगैशन का उपयोग करके ट्रेन कर सकते हैं या कुछ अधिक विदेशी कर सकते हैं जैसे वेक-स्लीप एल्गोरिथ्म का उपयोग करें। ध्यान दें कि हमने इस अंतिम चरण तक किसी भी लेबल किए गए डेटा का उपयोग नहीं किया है, जो इन प्रकार के मॉडल के लाभों में से एक है।
दूसरी ओर, वर्गीकरण के लिए आरबीएम का उपयोग करने के कई तरीके हैं।
- एक RBM या कई RBM के ढेर को प्रशिक्षित करें। कुछ अन्य पर्यवेक्षित शिक्षार्थी के इनपुट के रूप में सबसे ऊपरी छिपी परत का उपयोग करें।
- प्रत्येक वर्ग के लिए एक RBM को प्रशिक्षित करें और एक विभेदक वर्गीकरणकर्ता के इनपुट के रूप में अप्राकृतिक ऊर्जा का उपयोग करें।
- RBM को P (X, Y) का संयुक्त घनत्व वाला मॉडल बनाते हैं। फिर कुछ इनपुट x दिए गए, बस क्लास y चुनें जो ऊर्जा फ़ंक्शन को कम करता है (सामान्यीकरण यहां कोई समस्या नहीं है जैसे ऊपर में स्थिर Z सभी वर्गों के लिए समान है)।
- एक भेदभावपूर्ण आरबीएम को प्रशिक्षित करें
मैं आपको अत्यधिक तकनीकी रिपोर्ट ए प्रैक्टिकल गाइड टू ट्रेनिंग रिस्ट्रिक्टेड बोल्ट्जमैन मशीनों द्वारा ज्योफ हिंटन के माध्यम से पढ़ने का सुझाव दूंगा। यह इन मुद्दों में से कई पर अधिक विस्तार से चर्चा करता है, अमूल्य सुझाव प्रदान करता है, बहुत सारे प्रासंगिक कागजात का हवाला देता है, और आपके पास किसी भी अन्य भ्रम को दूर करने में मदद कर सकता है।