लॉग चर का उपयोग क्यों करें?


12

शायद, यह एक बहुत ही बुनियादी सवाल है, लेकिन मुझे इसके लिए कोई ठोस जवाब नहीं मिल रहा है। मैं यहाँ आशा करता हूँ, मैं कर सकता हूँ।

मैं वर्तमान में अपने गुरु की थीसिस के लिए तैयारी के रूप में पेपर पढ़ रहा हूं। वर्तमान में, मैं एक पेपर पढ़ रहा हूं जो ट्वीट्स और स्टॉक मार्केट सुविधाओं के बीच संबंधों पर शोध करता है।

उनकी एक परिकल्पना में, उन्होंने प्रस्ताव दिया कि "बढ़ी हुई ट्वीट मात्रा ट्रेडिंग वॉल्यूम में वृद्धि के साथ जुड़ी हुई है"।

मैं उन्हें सहसंबंधी की उम्मीद करेंगे, जोड़ो में सह-संबंध में, tweetVolumeके साथ tradingVolume, लेकिन इसके बजाय वे उपयोग कर रिपोर्ट का लॉग संस्करणों: LN(tweetVolume)और LN(tradingVolume)

अपनी थीसिस के लिए, मैंने उनके पेपर के इस बिट को दोहराया है। मैंने 6 महीने ( tweetVolume) और उसी समय सीमा के लिए स्टॉक ट्रेडिंग वॉल्यूम के लिए लगभग 100 कंपनियों के ट्वीट एकत्र किए हैं । यदि मैं पूर्ण चर को सहसंबंधित करता हूं, तो मुझे पता चलता है, r=.282, p.000लेकिन जब मैं लॉग किए गए क्रियाओं का उपयोग करता हूं, तो मुझे पता चलता है r=.488, p=.000

मुझे समझ में नहीं आता है कि शोधकर्ता कभी-कभी अपने चर के लॉग किए गए संस्करणों का उपयोग क्यों करते हैं और यदि आप ऐसा करते हैं तो सहसंबंध इतना अधिक क्यों लगता है। यहाँ तर्क क्या है, और लॉग चर का उपयोग करना क्यों ठीक है?

आपकी मदद बहुत ही सराहनिय है :-)


1
यदि आप पृष्ठ के निचले दाईं ओर संबंधित थ्रेड्स देखते हैं, तो लघुगणक का उपयोग कुछ समय पहले कवर किया गया है। विशेष रूप से देखें, रैखिक प्रतिगमन में, वास्तविक मूल्यों के बजाय एक स्वतंत्र चर के लॉग का उपयोग करना कब उचित है?
एंडी डब्ल्यू

जवाबों:


24

लॉग किए गए चर का उपयोग करने के कारण दो श्रेणियों में आते हैं: सांख्यिकीय और मूल।

सांख्यिकीय रूप से, यदि आपके चर दाहिने-तिरछे हैं (यानी, उनके उच्च सिरे पर एक लंबी पूंछ है) तो सहसंबंध या प्रतिगमन जैसे उपाय एक या दोनों पर उच्च अंत में एक या कुछ मामलों से बहुत प्रभावित हो सकते हैं। चर (outliers, उत्तोलन बिंदु, प्रभावशाली अंक)। लॉग को लेना तिरछा को कम करने या समाप्त करने में मदद कर सकता है।

भिन्नता की तुलना में अनुपात के संदर्भ में कुछ अवधारणाएं बेहतर हैं। आप जिन दो खंडों पर चर्चा करते हैं, उन्हें लें। अब, दो कंपनियों की तुलना करें: NASDAQ पर व्यापार करने वाली एक छोटी कंपनी, जिसे बहुत कम लोगों ने सुना है, अन्य एक मेगा-निगम। पूर्व में प्रति दिन बहुत कम ट्वीट्स मिलेंगे। बाद वाले को कई मिलेंगे; इसी तरह ट्रेडिंग वॉल्यूम के लिए। मान लीजिए (सिर्फ नंबर लेने के लिए) उस कंपनी ए को आम तौर पर एक दिन में 100 ट्वीट मिलते हैं और बाद में 100,000 मिलते हैं।

यदि कंपनी ए के ट्वीट 100 से 500 (400 के अंतर, 5 के अनुपात) से ऊपर जाते हैं, तो यह बहुत बड़ी खबर है - कुछ तो होना ही चाहिए। लेकिन अगर कंपनी बी का 100,000 से 100,400 (400 का अंतर, 1 के करीब का अनुपात) कोई भी नहीं बढ़ता है। यदि यह १,००,००० से ५००,००० तक चला गया तो समतुल्य समकक्ष होगा।


आपके तेज जवाब के लिए शुक्रिया। आपके उत्तर से दो और प्रश्न आते हैं। सबसे पहले, अगर मेरे पास एक वस्तु (स्टॉक ट्रेडिंगवोल्यूम, रिटर्न, और अस्थिरता) के लिए 3 गुण हैं और उनमें से किसी एक के लिए लॉग किया गया संस्करण लें? आप कंपनी ए और बी के ट्वीट के लिए क्या कहते हैं, उनके रिटर्न के लिए भी गणना कर सकते हैं: यदि कंपनी का स्टॉक 1 टोटल 1,50 से बढ़ता है तो रिटर्न (50%) 0.50 होता है। कंपनी B को समान% -return के लिए 400 से 600 (200) की वृद्धि की आवश्यकता है। और उस से उपजी: यदि रिटर्न नकारात्मक है, तो एलएन (-0.50) स्पष्ट रूप से काम नहीं करता है। क्या तब -LN (0.50) लेने की अनुमति है?
प्राग्नो

इसके अलावा, अगर मैं सही ढंग से समझता हूं, तो लॉग किए गए वेरिएबल को लेना एक स्वतंत्र विकल्प नहीं है - यह स्क्वैसी-चार्ट्स (स्टेटिस्टिक्स) द्वारा बहस किया जाना है? और निश्चित रूप से लॉग इन करने के लिए सिर्फ एक तार्किक तर्क है जो वास्तव में ऐसा करने के लिए मुनाफा प्रदान करता है? दूसरे शब्दों में, क्या यहाँ अंगूठे के नियम हैं, जो कि ऊपर दिए गए थ्रेड को परिभाषित करते हैं, जिसे आपको लॉग इन संस्करण लेना चाहिए या यह व्याख्या का विषय है?
11

1
आप इस मामले में प्रतिशत का लॉग नहीं लेना चाहते हैं: प्रतिशत लेने से लॉग क्या करता है। यही है, यह चीजों को अनुपात बनाता है। निश्चित रूप से आप कुछ चरों की लॉग ले सकते हैं और दूसरों की नहीं। लॉग लेने के लिए तिरछा चार्ट की आवश्यकता नहीं होती है, लेकिन आमतौर पर जो वेरिएबल लॉग होना चाहिए वह राइट-स्क्यू है। लेकिन मुख्य चीज पदार्थ है । यदि यह लॉग लेने के लिए कोई ठोस अर्थ नहीं रखता है, तो ऐसा न करें। इसके बजाय, सांख्यिकीय तरीकों का उपयोग करें जो तिरछे चर के साथ काम करते हैं। सबसे पहले आता है।
पीटर Flom - को पुनः स्थापित मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.