क्या एक यादृच्छिक वन मॉडल से एक भविष्यवाणी की व्याख्या करने का एक तरीका है?


11

मान लें कि मुझे एक यादृच्छिक वन (आर में यादृच्छिकफोरस्ट पैकेज का उपयोग करके) के आधार पर एक भविष्य कहनेवाला वर्गीकरण मॉडल मिला है। मैं इसे सेट करना चाहता हूं ताकि एंड-यूज़र्स के लिए एक भविष्यवाणी उत्पन्न करने के लिए एक आइटम निर्दिष्ट कर सकें, और यह एक वर्गीकरण संभावना का उत्पादन करेगा। अब तक, कोई समस्या नहीं।

लेकिन यह एक चर महत्व ग्राफ की तरह कुछ उत्पादन करने में सक्षम होने के लिए उपयोगी / शांत होगा, लेकिन विशिष्ट आइटम के लिए भविष्यवाणी की जा रही है, प्रशिक्षण सेट के लिए नहीं। कुछ इस तरह:

आइटम X को एक कुत्ता (73% संभावना) होने की भविष्यवाणी की जाती है
क्योंकि:
पैर = 4
सांस = बुरा
फर = लघु
भोजन = गंदा

तुम समझ गए। क्या एक प्रशिक्षित यादृच्छिक वन से इस जानकारी को निकालने का कोई मानक या कम से कम औचित्य है? यदि हां, तो क्या किसी के पास कोड है जो यादृच्छिक यादृच्छिक पैकेज के लिए ऐसा करेगा?


कुछ जटिलता ... आप कल्पना कर सकते हैं कि पैर की चर संख्या कितनी बार निर्णय पथ का हिस्सा थी। लेकिन क्या आप सिर्फ उन पेड़ों के लिए करेंगे जो बहुसंख्यक उत्तर की भविष्यवाणी करते हैं, या उन सभी को? या अंतर?
हरलन

और सभी mभविष्यवक्ताओं को एक-एक करके बदलना और यह देखना कि जंगल कैसे अलग-अलग भविष्यवाणी करते हैं, सॉर्टा महंगा लगता है। वहाँ एक बेहतर तरीका होगा।
हरलन

मेरा पहला विचार यह था कि आप प्रशिक्षण डेटा के चर महत्व से अलग क्या करना चाहते हैं? क्या आप यह कहना चाह रहे हैं कि अन्य मूल्यों को देखते हुए वे क्या थे, पैरों पर भविष्यवाणी की संवेदनशीलता क्या थी = 4 बनाम पैर = 2 या पैर = 0? क्या आपने यादृच्छिक प्लॉट पैकेज में आंशिक प्लॉट फ़ंक्शन को देखा है?
B_Miner

परिवर्तनीय महत्व को आमतौर पर पूरे प्रशिक्षण सेट (या ग्रहण की गई जनसंख्या, या कुछ) पर सशर्त परिभाषित किया जाता है। लेकिन जो मैं चाहता हूं वह एकल अनुमानित आइटम के लिए परिवर्तनीय महत्व है । एक ऐसे मामले की कल्पना करें, जहां जंगल में बहुत ही ऊँचे फैसले वाले पेड़ हों। टेस्ट इंस्टेंस 1 को 1 या बहुत कम निर्णय नोड्स द्वारा समझाया जा सकता है, जबकि टेस्ट इंस्टेंस 2 को निर्णय नोड्स के बहुत बड़े सेट द्वारा समझाया जा सकता है। मुझे उस का एक बहुत ही सरल मानव-व्याख्यात्मक संस्करण चाहिए, जैसे निर्णयों का एक रैंक सेट, शीर्ष 5 जिसमें से मैं प्रदान कर सकता हूं। एक निर्णय वृक्ष के लिए, मैं अभी उन्हें पढ़ता हूँ।
हरलान १

जवाबों:


3

पहला विचार सिर्फ चर महत्व की नॉक-आउट रणनीति की नकल करना है और सिर्फ यह परीक्षण करना है कि कैसे प्रत्येक विशेषता को मिलाकर वस्तु वर्गीकरण (ओओबी पर और स्पष्ट रूप से कुछ दोहराव के साथ) में वन विश्वास को कम किया जाएगा। इसके लिए कुछ कोडिंग की आवश्यकता होती है, लेकिन यह निश्चित रूप से प्राप्त करने योग्य है।

हालांकि, मुझे लगता है कि यह सिर्फ एक बुरा विचार है - इसका परिणाम संभवत: नर्क जैसा परिवर्तनशील होगा (वस्तुओं पर औसत के प्रभाव को स्थिर किए बिना), शोरगुल (इतने विश्वास नहीं करने वाले ऑब्जेक्ट्स के लिए बकवास विशेषताओं के बड़े प्रभाव हो सकते हैं) और कठिन व्याख्या (दो या अधिक विशेषता सहकारी नियम संभवतः प्रत्येक योगदान विशेषताओं के यादृच्छिक प्रभावों के परिणामस्वरूप होंगे)।

आपको नकारात्मक उत्तर के साथ नहीं छोड़ने के लिए, मैं निकटता मैट्रिक्स को देखने की कोशिश करूंगा और संभव है कि यह प्रकट हो सकता है - यह बहुत अधिक स्थिर और सीधा लगता है।


सहकारी नियम / सहसंबद्ध भविष्यवक्ता बिंदु एक उत्कृष्ट आलोचना है। इस काम को करने के लिए, यह आवश्यक हो सकता है कि आरएफ को चर के किसी प्रकार के पूर्व-कम सेट पर प्रशिक्षित किया जाए, या कुछ प्रकार के दंड रणनीति को शामिल किया जाए जिससे आरएफ भविष्यवाणियों के सबसेट पर ध्यान केंद्रित कर सके।
हरलान

0

मैं लाइम फ्रेमवर्क के साथ कोशिश करूंगा ।

यह कई मॉडलों (यादृच्छिक वन सहित) के साथ काम करता है। इसका उपयोग स्थानीय व्याख्या के लिए किया जा सकता है (यानी, एक ही भविष्यवाणी को समझाते हुए) या वैश्विक व्याख्या के लिए (यानी, एक पूरे मॉडल को समझाते हुए)।

असभ्य से उद्धरण

इस काम में, हम एक नए स्पष्टीकरण तकनीक की व्याख्या करते हैं, जो स्थानीय स्तर पर भविष्यवाणी के आसपास एक व्याख्यात्मक मॉडल सीखकर, किसी भी क्लासिफायर की व्याख्या को व्याख्यात्मक और वफादार तरीके से प्रस्तावित करता है। हम एक गैर-निरर्थक तरीके से प्रतिनिधि व्यक्तिगत भविष्यवाणियों और उनके स्पष्टीकरण पेश करके मॉडल को समझाने के लिए एक विधि का प्रस्ताव करते हैं, कार्य को एक सबमॉडुलर अनुकूलन समस्या के रूप में तैयार करते हैं।

यह आर और अजगर दोनों के लिए पैकेज है , और कई उदाहरण यदि आप इसे Google करते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.