GBM में इंटरेक्शन डेप्थ का क्या मतलब है?


30

R में gbm में इंटरेक्शन डेप्थ पैरामीटर पर मेरा एक सवाल था। यह एक नॉब सवाल हो सकता है, जिसके लिए मैं माफी माँगता हूँ, लेकिन पैरामीटर, जो मैं मानता हूं कि एक पेड़ में टर्मिनल नोड्स की संख्या को दर्शाता है, मूल रूप से एक्स-वे का संकेत देता है। भविष्यवक्ताओं के बीच बातचीत? बस समझने की कोशिश कर रहा है कि यह कैसे काम करता है। इसके अतिरिक्त, मुझे बहुत भिन्न मॉडल मिलते हैं, अगर मेरे पास दो अलग-अलग कारक चर के साथ एक डेटासेट के साथ एक डेटासेट है, तो उन दो कारक चर को छोड़कर एक एकल कारक में संयुक्त हैं (उदाहरण के लिए X 1 कारक में स्तर, कारक 2 में Y स्तर, संयुक्त चर है) X * Y कारक)। उत्तरार्द्ध पूर्व की तुलना में काफी अधिक पूर्वानुमान है। मैंने सोचा था कि बातचीत की गहराई बढ़ाने से यह रिश्ता आगे बढ़ेगा।

जवाबों:


22

पिछले दोनों उत्तर गलत हैं। पैकेज GBM interaction.depthपैरामीटर का उपयोग कई विभाजन के रूप में करता है जो एक पेड़ पर प्रदर्शन करना है (एक नोड से शुरू)। प्रत्येक विभाजन 2 (नोड द्वारा 3 और टर्मिनल नोड्स की संख्या से नोड्स की कुल संख्या बढ़ जाती है के रूप में {छोड़ दिया नोड, सही नोड, एनए नोड}) पेड़ में नोड्स की कुल संख्या होगी 3 * एन + 1 और नंबर टर्मिनल नोड्स के 2 * एन + 1 । यह फ़ंक्शन के आउटपुट पर एक नज़र डालकर सत्यापित किया जा सकता है ।3*एन+12*एन+1pretty.gbm.tree

व्यवहार बल्कि भ्रामक है, क्योंकि उपयोगकर्ता वास्तव में गहराई से परिणामी पेड़ की गहराई की अपेक्षा करता है। यह नहीं।


यहाँ क्या है N: नोड्स का न्यूमेर, इंटरएक्शन। डीडी या कुछ और?
जूलियन

यह एक एकल नोड (भी, बातचीत की गहराई) से शुरू होने वाली विभाजन की एक संख्या है।
रैंडम

1
मुझे लगता है कि प्रत्येक विभाजन केवल टर्मिनल नोड्स की कुल संख्या को 1 से बढ़ाता है। तो मान लीजिए कि एक पेड़ में सिर्फ एक विभाजन है, तो इसमें 2 टर्मिनल नोड हैं, अब आप पिछले टर्मिनल नोड्स में से एक पर एक विभाजन करते हैं, और फिर 3 टर्मिनल हैं अब नोड्स। इसलिए वेतन वृद्धि सिर्फ 1. क्या मुझे यह अधिकार मिलता है या मुझे कुछ गलत समझा जाता है?
लिली लॉन्ग

1
@ लिलिगॉन्ग यह तुरंत स्पष्ट नहीं हो सकता है, लेकिन gbm वास्तव में तीन में नोड्स को विभाजित करता है, तीसरा बच्चा एनए मानों को समूहीकृत करता है (अर्थात जो सीधे दिए गए मूल्य की तुलना में नहीं हो सकता है)। इसका मतलब है कि प्रत्येक विभाजन दो से नोड्स की संख्या बढ़ाता है। पैकेज विकसित हो सकता है क्योंकि मैंने आखिरी बार इस तीसरे बच्चे को बनाने से बचने के लिए इसका इस्तेमाल किया है, इसलिए कृपया pretty.gbm.tree फ़ंक्शन चलाकर इसे दोबारा जांचें।
यादृच्छिक

2

R में gbm में इंटरेक्शन डेप्थ पैरामीटर पर मेरा एक सवाल था। यह एक नॉब सवाल हो सकता है, जिसके लिए मैं माफी माँगता हूँ, लेकिन पैरामीटर, जो मैं मानता हूं कि एक पेड़ में टर्मिनल नोड्स की संख्या को दर्शाता है, मूल रूप से एक्स-वे का संकेत देता है। भविष्यवक्ताओं के बीच बातचीत?

इंटरैक्शन.डेप और टर्मिनल नोड्स की संख्या के बीच लिंक

interaction.depthविभाजन नोड्स की संख्या के रूप में देखने के लिए एक । interaction.depthK पर निश्चित एक परिणाम होगा k + 1 टर्मिनल नोड्स (NA नोड्स को छोड़ना), इसलिए हमारे पास है:

मैंnटीआरसीटीमैंnपीटी=#{टीआरमीटरमैंnएलएनरों}+1

इंटरैक्शन.डेप और इंटरेक्शन ऑर्डर के बीच लिंक

के बीच की कड़ी interaction.depthऔर बातचीत के क्रम में अधिक कठिन है।

इंटरएक्टिवटेप के साथ तर्क करने के बजाय, चलो टर्मिनल नोड्स की संख्या के साथ तर्क करते हैं, जिसे हम जे कहते हैं ।

उदाहरण: मान लें कि आपके पास J = 4 टर्मिनल नोड्स हैं (इंटरैक्शन .epth = 3) आप या तो:

  1. पहले विभाजन को रूट पर करें, फिर दूसरे विभाजन को रूट के बाएं नोड पर और तीसरे विभाजन को रूट के दाएं नोड पर विभाजित करें। इस पेड़ के लिए इंटरैक्शन ऑर्डर 2 होगा।
  2. रूट पर पहला स्प्लिट करें, फिर रूट के लेफ्ट (क्रमशः राईट) नोड पर दूसरा स्प्लिट और इस पर लेफ्ट (क्रमशः राईट) नोड पर तीसरा स्प्लिट होगा। इस पेड़ के लिए इंटरैक्शन ऑर्डर 3 होगा।

पीमीटरमैंn(जम्मू-1,n)

1

पिछला उत्तर सही नहीं है।

स्टंप में 1 का एक इंटरैक्शन होगा। (और दो पत्ते होंगे)। लेकिन इंटरैक्शन.डिप्थ = 2 तीन पत्ते देता है।

तो: NumberOfLeaves = इंटरैक्शन .epth + 1


0

दरअसल, पिछले उत्तर गलत हैं।

एन=2(कश्मीर+1)-1एल=2कश्मीर

2कश्मीर

एन=Σकश्मीर=0कश्मीर2कश्मीर)

जो इसके बराबर है:

एन=2(कश्मीर+1)-1

0

तुम कोशिश कर सकते हो

तालिका (पूर्वानुमान (gbm (y ~।, डेटा = ट्रेनिंगडाउन), वितरण = "गॉसियन", क्रिया = FALSE, n.trees = 1, संकोचन = 0.01, bag.fraction = 1, इंटरैक्शन .epep = 1), n.trees = 1))

और देखते हैं कि केवल 2 अद्वितीय अनुमानित मूल्य हैं। इंटरैक्शन.डिप = 2 से आपको 3 अलग-अलग अनुमानित मूल्य मिलेंगे। और खुद को मनाओ।


स्पष्ट नहीं है कि यह प्रश्न का उत्तर कैसे देता है।
माइकल आर। चेरिक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.