मैं हिंटन के नए पेपर, "डायनेमिक रूटिंग बिटवीन कैप्सूल्स" को पढ़ रहा था और सार में "एक्टिविटी वेक्टर" शब्द को नहीं समझता था।
एक कैप्सूल न्यूरॉन्स का एक समूह है, जिसकी गतिविधि वेक्टर एक विशिष्ट प्रकार की इकाई जैसे ऑब्जेक्ट या ऑब्जेक्ट भाग के तात्कालिकता मापदंडों का प्रतिनिधित्व करती है। हम गतिविधि वेक्टर की लंबाई का उपयोग उस संभावना का प्रतिनिधित्व करने के लिए करते हैं जो इकाई मौजूद है और तात्कालिक पैरामीटर्स का प्रतिनिधित्व करने के लिए इसकी अभिविन्यास। एक स्तर पर सक्रिय कैप्सूल उच्च स्तर के कैप्सूल के तात्कालिकता मापदंडों के लिए, परिवर्तन मैट्रिक्स के माध्यम से भविष्यवाणियां करते हैं। जब कई भविष्यवाणियां सहमत होती हैं, तो उच्च स्तर का कैप्सूल सक्रिय हो जाता है। हम दिखाते हैं कि भेदभावपूर्ण रूप से प्रशिक्षित, बहु-परत कैप्सूल प्रणाली MNIST पर अत्याधुनिक प्रदर्शन प्राप्त करती है और अत्यधिक ओवरलैपिंग अंकों को पहचानने में एक जटिल जाल से काफी बेहतर है। इन परिणामों को प्राप्त करने के लिए हम एक पुनरावृत्ति मार्ग-दर-समझौते तंत्र का उपयोग करते हैं:
https://arxiv.org/pdf/1710.09829.pdf
मुझे लगा कि एक वेक्टर डेटा की एक सरणी की तरह है जिसे आप नेटवर्क के माध्यम से चला रहे हैं।
मैंने एंड्रयू एनजी के गहन शिक्षण पाठ्यक्रम के माध्यम से काम करना शुरू किया, लेकिन यह सब नया है और मेरे सिर के ऊपर से शब्द चलते हैं।