सांख्यिकीय और मशीन लर्निंग मॉडल के लिए, व्याख्या करने के कई स्तर हैं: 1) एल्गोरिथ्म पूरे के रूप में, 2) सामान्य रूप में एल्गोरिथम के 3 भाग) विशेष एल्गोरिथ्म पर एल्गोरिथ्म के कुछ भाग, और ये तीन स्तर प्रत्येक दो भागों में विभाजित होते हैं, एक प्रशिक्षण के लिए और दूसरा समारोह के लिए। पिछले दो भाग पहले की तुलना में बहुत करीब हैं। मैं # 2 के बारे में पूछ रहा हूं, जो आमतौर पर # 3 की बेहतर समझ की ओर जाता है)। (यदि वे नहीं हैं जो 'व्याख्या' का मतलब है तो मुझे क्या सोचना चाहिए? '
जहाँ तक व्याख्या की बात है, लॉजिस्टिक रिग्रेशन व्याख्या करने में सबसे आसान है। इस उदाहरण ने दहलीज को क्यों पारित किया? क्योंकि उस उदाहरण में यह विशेष सकारात्मक विशेषता थी और यह मॉडल में एक बड़ा गुणांक है। यह इतना स्पष्ट है!
एक तंत्रिका नेटवर्क एक मॉडल का क्लासिक उदाहरण है जिसे व्याख्या करना मुश्किल है। उन सभी गुणांक का क्या अर्थ है ? वे सभी ऐसे जटिल पागल तरीकों से जोड़ते हैं कि यह कहना मुश्किल है कि वास्तव में कोई विशेष गुणांक क्या कर रहा है।
लेकिन सभी गहरे तंत्रिका जाल बाहर आने के साथ, ऐसा महसूस होता है कि चीजें स्पष्ट हो रही हैं। डीएल मॉडल (कहने के लिए दृष्टि) शुरुआती परतों में किनारों या अभिविन्यास जैसी चीजों को पकड़ने के लिए लगते हैं, और बाद की परतों में ऐसा लगता है कि कुछ नोड्स वास्तव में अर्थ हैं (लौकिक 'दादी कोशिका' की तरह )। उदाहरण के लिए:
( 'लर्निंग अबाउट डीप लर्निंग' से )
यह एक ग्राफिक है ( प्रस्तुति के लिए हाथ से बनाया गया वहाँ से बाहर है ) इसलिए मैं बहुत उलझन में हूं। लेकिन यह सबूत है कि कोई सोचता है कि यह कैसे काम करता है।
हो सकता है कि अतीत में हमें पहचानने योग्य विशेषताओं को खोजने के लिए पर्याप्त परतें नहीं थीं; मॉडल सफल थे, बस विशेष रूप से लोगों का विश्लेषण करने के लिए आसान नहीं था।
लेकिन शायद ग्राफिक सिर्फ इच्छाधारी सोच है। हो सकता है कि एनएन वास्तव में अयोग्य हैं।
लेकिन तस्वीरों के साथ लेबल किए गए उनके नोड्स के साथ कई ग्राफिक्स भी वास्तव में सम्मोहक हैं।
क्या डीएल नोड्स वास्तव में सुविधाओं के अनुरूप हैं?