कई-स्तरीय कारक वाले मॉडल को फिट करने के लिए आर को एक लंबा समय क्यों लगता है?


12

मैं एक मॉडल को कई स्तरों के साथ फिट करता हूं और उस मॉडल को फिट करने के लिए आर को वास्तव में लंबा समय लगता है। ऐसा क्यों है?

उदाहरण के लिए, यदि मैं खिलाड़ियों के वेतन की भविष्यवाणी करने के लिए एक प्रतिगमन फिट बैठता हूं, और सभी खिलाड़ियों के संबंधित राष्ट्रीयताओं के लिए एक कारक पूर्वसूचक शामिल करता हूं, तो खिलाड़ियों के वेतन के लिए एक निरंतर भविष्यवक्ता के साथ एक मॉडल फिट करने की तुलना में अधिक समय लगेगा, जैसे खिलाड़ी ' ऊंचाइयों।


5
यह महसूस करने में मददगार हो सकता है कि जब कारक एक चर की तरह दिखता है (यह डेटा फ्रेम में एक कॉलम है, मॉडल विनिर्देश में एक आइटम, आदि), पर्दे के पीछे यह वास्तव में अलग-अलग भविष्यवाणियों के एक समूह के रूप में माना जाएगा। मॉडल इसलिए एकल (निरंतर) पूर्वसूचक के साथ एक मॉडल की तुलना में बहुत अधिक जटिल है।
गाला

जवाबों:


13

आर विशिष्ट है - अधिकांश आँकड़ों के पैकेज की तरह, यह प्रतिगमन के लिए क्यूआर अपघटन का उपयोग करता है।

नियत , जहाँ , बस अपघटन की गणना करना स्वयं में प्रभावी रूप से द्विघात है - भविष्यवाणियों की संख्या दोगुनी करने से गणना समय लगभग 4 से गुणा हो जाएगा।np<<np

इसलिए यदि आप (रैखिक प्रतिगमन) से कहते हैं , तो आप यह अपेक्षा करेंगे कि यह 600 गुना लंबे क्षेत्र में हो (वास्तविक रूप में शायद कुछ कम हो, कई कारणों से)।p=2p=50

इसलिए बहुत सारे भविष्यवक्ताओं को जोड़ने का अर्थ होगा कि अब और अधिक प्रतीक्षा करना।


7

ऐसा इसलिए है क्योंकि स्तरों वाले एक कारक के साथ , R संकेतक चर बनाता है । तो, मान लीजिए कि राष्ट्रीयताएं हैं, आप रेखीयों के साथ एक बहु प्रतिगमन मॉडल को फिट कर रहे हैं , इसकी तुलना एक साधारण रेखीय प्रतिगमन से की जाती है यदि आप इसे निरंतर मानते हैं (जो आपको नहीं करना चाहिए)। शायद आप एक नया कारक बना सकते हैं जो कि महाद्वीप या कुछ अन्य राष्ट्रीय समूहों का समूह है, ताकि चीजों को गति प्रदान की जा सके और एक अधिक आदर्शवादी मॉडल प्राप्त किया जा सके।k - k = ५० ४ ९kk1k=5049

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.