चर महत्व यादृच्छिक सबसे नकारात्मक मान


10

मैं खुद से पूछ रहा हूं कि क्या प्रतिगमन संदर्भ में नकारात्मक चर महत्व मूल्य ("% IncMSE") के साथ उन चर को निकालना एक अच्छा विचार है। और अगर यह मुझे एक बेहतर भविष्यवाणी देता है? तुम क्या सोचते हो?

जवाबों:


5

रैंडम वन में परिवर्तनीय महत्व की गणना निम्नानुसार की जाती है:

  1. प्रारंभ में, मॉडल के MSE की गणना मूल चर के साथ की जाती है
  2. फिर, एक एकल स्तंभ के मानों की अनुमति है और MSE की गणना फिर से की जाती है। उदाहरण के लिए, यदि कोई स्तंभ (Col1) मान 1,2,3,4 लेता है, और मानों का यादृच्छिक क्रमांकन 4,3,1,2 में परिणाम करता है। यह एक MSE1 में परिणाम है। फिर MSE यानी MSE1 - MSE में वृद्धि, चर के महत्व को दर्शाती है।

  3. हम अंतर के सकारात्मक होने की उम्मीद करते हैं, लेकिन एक नकारात्मक संख्या के मामलों में, यह दर्शाता है कि यादृच्छिक क्रमपरिवर्तन ने बेहतर काम किया। यह अनुमान लगाया जा सकता है कि चर की भविष्यवाणी में भूमिका नहीं है, अर्थात, महत्वपूर्ण नहीं है।

उम्मीद है की यह मदद करेगा!

विस्तृत विवरण के लिए कृपया निम्न लिंक देखें!

/programming/27918320/what-does-negative-incmse-in-randomforest-package-mean


3

यह सिर्फ एक यादृच्छिक उतार-चढ़ाव हो सकता है (उदाहरण के लिए यदि आपके पास छोटा ntree है)।

यदि नहीं, तो यह दिखा सकता है कि आपके डेटा में कुछ गंभीर मात्रा में विरोधाभास हैं, अर्थात लगभग समान भविष्यवक्ताओं के साथ वस्तुओं के जोड़े और बहुत अलग परिणाम। इस मामले में, मैं दो बार जांच करूंगा कि क्या मॉडल वास्तव में कोई मतलब रखता है और यह सोचना शुरू कर देता है कि मुझे उन्हें हल करने के लिए और अधिक विशेषताएं कैसे मिल सकती हैं।


2
क्या आप "डेटा में विरोधाभास" पर थोड़ा और विस्तृत कर सकते हैं? मैंने काफी अनुसरण नहीं किया और आप जो समझा रहे हैं उसे समझना चाहेंगे।
जेकेविहुआ
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.