अब, मैं समझता हूं कि यह भविष्यवाणियों में वितरण और सामान्यता पर निर्भर करता है
लॉग ट्रांसफ़ॉर्मेशन डेटा को अधिक समान बनाता है
एक सामान्य दावे के रूप में, यह झूठा है --- लेकिन अगर यह मामला था, तो भी एकरूपता महत्वपूर्ण क्यों होगी ?
उदाहरण के लिए विचार करें,
i) एक बाइनरी भविष्यवक्ता केवल 1 और 2 का मान लेता है। लॉग ले रहा है यह केवल मान 0 और लॉग 2 लेने वाले बाइनरी भविष्यवक्ता के रूप में छोड़ देगा। यह वास्तव में इस भविष्यवक्ता को शामिल करने वाले शब्दों के अवरोधन और स्केलिंग के अलावा कुछ भी प्रभावित नहीं करता है। यहां तक कि भविष्यवक्ता का पी-मूल्य भी अपरिवर्तित होगा, जैसा कि फिट किए गए मूल्य।
ii) बाएं-तिरछा भविष्यवक्ता पर विचार करें। अब लॉग लेते हैं। यह आमतौर पर अधिक बाएं तिरछा हो जाता है।
iii) एकसमान डेटा बाएं तिरछा हो जाता है
(यह अक्सर इतना चरम परिवर्तन नहीं होता है, हालांकि)
आउटलेर्स से कम प्रभावित
एक सामान्य दावे के रूप में, यह गलत है। एक भविष्यवक्ता में कम आउटलेर्स पर विचार करें।
मैंने अपने सभी निरंतर चरों को बदलने के बारे में सोचा जो मुख्य रुचि के नहीं हैं
किस हद तक? यदि मूल रूप से रिश्ते रैखिक थे, तो वे लंबे समय तक नहीं रहेंगे।
और अगर वे पहले से ही घुमावदार थे, तो ऐसा करना स्वचालित रूप से उन्हें बदतर (अधिक घुमावदार) बना सकता है, बेहतर नहीं।
-
एक भविष्यवक्ता (चाहे प्राथमिक रुचि हो या न हो) का लॉग लेना कभी-कभी उपयुक्त हो सकता है, लेकिन ऐसा हमेशा नहीं होता है।