भविष्यवाणियों के रूप में प्रतिशतक का उपयोग करना - अच्छा विचार है?


9

मैं एक ऐसी समस्या के बारे में सोच रहा हूं जो रैखिक प्रतिगमन का उपयोग करके ग्राहक के लॉग (खर्च) की भविष्यवाणी करना है।

मैं इस बात पर विचार कर रहा हूं कि इनपुट के रूप में किन विशेषताओं का उपयोग करना चाहिए और यदि चर के प्रतिशतक को इनपुट के रूप में उपयोग करना ठीक होगा तो क्या होगा।

उदाहरण के लिए, मैं एक इनपुट के रूप में कंपनियों के राजस्व का उपयोग कर सकता था। मैं सोच रहा था कि क्या मैं इसके बजाय कंपनी के राजस्व प्रतिशत का उपयोग कर सकता हूं।

एक अन्य उदाहरण एक श्रेणीगत उद्योग क्लासिफायर (NAICS) होगा - अगर मैं प्रति NAICS कोड पर माध्य खर्च को देखूं और फिर प्रत्येक NAICS कोड को 'NAICS प्रतिशत' के रूप में निर्दिष्ट करूं, तो क्या मैं एक स्पष्ट व्याख्यात्मक चर का उपयोग कर सकता हूं?

अगर प्रतिशत का उपयोग करते समय जागरूक होने के लिए कोई समस्या है तो बस सोच रहा था? क्या यह कुछ प्रकार के फ़ीचर स्केलिंग के बराबर है?


2
यदि आपके पास मूल डेटा है, तो आप प्रतिशत का उपयोग क्यों करना चाहेंगे? शायद यह एक अच्छा विचार नहीं है, क्योंकि प्रतिशत केवल क्रमिक हैं, मीट्रिक उपाय नहीं। लेकिन मैं पूर्वाग्रह / दक्षता के बारे में अनिश्चित हूं।
hplieninger

9
s का प्रतिशत असंगत है जिस तरह से s का प्रभाव है। स्वास्थ्य परिणाम की भविष्यवाणी करते समय एक सामान्य त्रुटि प्रतिशत वजन या बीएमआई है। वजन का भौतिकी यह निर्धारित करता है कि यह किसी व्यक्ति के शारीरिक आयाम हैं जो उनके शरीर के कार्यों से संबंधित हैं, न कि नमूने में कितने व्यक्ति जो किसी एक विषय के वजन या बीएमआई से कम हैं। एक्सएक्स
फ्रैंक हरेल

1
यदि आप समूहों में अपने उद्योग चर को यथोचित रूप से क्लस्टर कर सकते हैं, जैसे 4, डमी कोडिंग (या किसी अन्य उपयुक्त कोडिंग योजना) का उपयोग करें और आप कर रहे हैं। मैं यही करूंगा।
hplieninger

3
मैं ऐसे कारण के बारे में नहीं सोच सकता कि क्यों प्रतिशतक निर्भर चर से रैखिक रूप से संबंधित होगा। यदि आप एक के बारे में सोच सकते हैं, तो यह ठीक हो सकता है (और कृपया अपने प्रश्न को अपने कारण से अपडेट करें)
पीटर फ्लोम

1
यदि आप NAICS कोड का उपयोग किसी कंपनी के खर्च के लिए प्रॉक्सी के रूप में करना चाहते हैं, तो आप इसके NAICS कोड में औसत खर्च का उपयोग करके ऐसा कर सकते हैं - प्रतिशत का उपयोग करने की आवश्यकता नहीं है।
Scortchi - को पुनः स्थापित मोनिका

जवाबों:


1

यदि आपका मॉडल फर्म के राजस्व में किसी प्रकार की प्रतियोगिता में प्रवेश करता है, तो आप प्रतिशतक का उपयोग कर सकते हैं। लॉग प्रतिशत अधिक सार्थक लगता है, मात्रात्मक मूल्य में रैखिक नहीं होने जा रहे हैं, या इसलिए मैं कल्पना करता हूं।

इस कहानी में, आप अवलोकन फर्म के तहत राजस्व के साथ फर्मों के ln (%) को शामिल करते हैं। कहानी यह है कि उच्च राजस्व के साथ प्रतिष्ठा है जो कम राजस्व वाली फर्मों से बेहतर है, और "प्रतिस्पर्धा से अधिक होने" का यह संबंध प्रासंगिक है, न कि राजस्व का स्तर। मैं इसे फर्म की मान्यता और ब्रांडिंग के एक महत्वपूर्ण हिस्से के रूप में देख सकता था।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.