प्रतिबंधित बोल्ट्जमान मशीनों की समीक्षा
एक प्रतिबंधित बोल्ट्ज़मन मशीन (आरबीएम) एक जेनेरेटिव मॉडल है, जो इनपुट पर संभाव्यता वितरण सीखता है। इसका मतलब है, प्रशिक्षित होने के बाद, आरबीएम सीखे गए संभाव्यता वितरण से नए नमूने उत्पन्न कर सकता है। दृश्य इकाइयों पर संभाव्यता वितरण द्वारा दिया गया है।
जहां
और फ़ंक्शन है, है दिखाई नोड के लिए पूर्वाग्रह , और से वजन है कोv
p(v∣h)=∏i=0Vp(vi∣h),
p(vi∣h)=σ(ai+∑j=0Hwjihj)
σaiiwjihjvi। इन दो समीकरणों से, यह इस प्रकार है कि केवल छिपे हुए राज्य पर निर्भर करता है । इसका अर्थ है कि एक दृश्य नमूना कैसे उत्पन्न होता है, इसकी जानकारी को छिपी इकाइयों, भार और पूर्वाग्रहों में संग्रहीत किया जाना है।
p(v∣h)hv
वर्गीकरण के लिए आरबीएम का उपयोग करना
वर्गीकरण कार्यों के लिए RBMs का उपयोग करते समय, आप निम्नलिखित विचार का उपयोग करते हैं: आपके प्रशिक्षण या परीक्षण डेटा को कैसे जनरेट किया जाता है, इस जानकारी के रूप में छिपी इकाइयों में सहेजा गया है , आप इन अंतर्निहित कारकों को एक प्रशिक्षण नमूना खिलाकर निकाल सकते हैं। RBM की दृश्य इकाइयाँ, इसे छिपी हुई इकाइयों के आगे प्रचारित करती हैं, और छिपी हुई इकाइयों के इस वेक्टर को फीचर वेक्टर के रूप में उपयोग करती हैं। अब आप किसी भी पीछे की ओर दृश्य इकाइयों को पास नहीं करते हैं।h
यह छिपा हुआ वेक्टर इनपुट डेटा का सिर्फ एक परिवर्तित संस्करण है - यह अपने आप से कुछ भी वर्गीकृत नहीं कर सकता है। एक वर्गीकरण करने के लिए, आप इनपुट के रूप में "कच्चे" प्रशिक्षण डेटा के बजाय छिपे हुए वेक्टर के साथ किसी भी क्लासिफायर (रैखिक क्लासिफायर, एसवीएम, एक फीडफ़ॉर्म न्यूरल नेटवर्क, या कुछ और) को प्रशिक्षित करेंगे।
यदि आप एक गहरी विश्वास नेटवर्क (डीबीएन) का निर्माण कर रहे हैं - जिसका उपयोग एक अनचाहे अंदाज में गहरे फीड-फॉरवर्ड न्यूरल नेटवर्क को प्रशिक्षित करने के लिए किया गया था - आप इस छिपे हुए वेक्टर को ले लेंगे और इसे एक नए आरबीएम के इनपुट के रूप में उपयोग करेंगे, जिसे आप स्टैक करते हैं। उसके ऊपर। इस तरह, आप नेटवर्क लेबल-दर-परत को वांछित आकार तक पहुंचने तक प्रशिक्षित कर सकते हैं, बिना किसी लेबल वाले डेटा की आवश्यकता के। अंत में, आप शीर्ष पर सॉफ्टमैक्स परत जोड़ देंगे, और अपने वर्गीकरण कार्य पर बैकप्रोपैजेशन के साथ पूरे नेटवर्क को प्रशिक्षित करेंगे।