कर रहे हैं वें जड़ परिवर्तनों की सिफारिश की?


12

मेरे सहयोगी प्रतिक्रिया चर को (यानी, ) की शक्ति तक बढ़ाकर कुछ डेटा का विश्लेषण करना चाहते हैं । y0.12518y0.125

मैं इसके साथ असहज हूं, लेकिन क्यों स्पष्ट करने के लिए संघर्ष कर रहा हूं। मैं इस परिवर्तन के लिए किसी भी यंत्रवत तर्क के बारे में नहीं सोच सकता। न ही मैंने इसे पहले कभी देखा है, और मुझे चिंता है कि शायद यह टाइप I त्रुटि दरों या कुछ और को फुलाता है - लेकिन मेरे पास इन चिंताओं का समर्थन करने के लिए कुछ भी नहीं है!

इसके अतिरिक्त, मेरे सहकर्मी ने पाया कि ये तब्दील मॉडल एआईसी तुलना में अप्रतिष्ठित मॉडल से बेहतर प्रदर्शन करते हैं। क्या यह अपने आप में, इसके उपयोग को सही ठहराता है?


9
बस FYI करें, एक लग रहा है बहुत कुछ तरह के कई श्रेणियों के लिए । लॉग परिवर्तन अक्सर कई मामलों में उचित होता है (लेकिन अक्सर अनुचित मामलों में भी इसका उपयोग किया जाता है)। लॉग ( y ) yy1/8log(y)y
क्लिफ एबी


5
आप परिवर्तनशील आश्रित चर वाले मॉडलों के बीच AIC की सार्थक रूप से तुलना नहीं कर सकते। (स्वतंत्र चर को बदलना ठीक है।)
स्टीफन कोलासा

5
@CliffAB सही है। छोटी सकारात्मक शक्तियों और लघुगणक के बीच मुख्य व्यावहारिक अंतर यह है कि आप शून्य की शक्तियां ले सकते हैं। जब डेटा में कुछ शून्य होते हैं (शायद संख्याओं को दर्ज करने में गड़बड़ी के कारण), कभी-कभी एक छोटी शक्ति (0.1 या 0.01) भी लघुगणक के विकल्प के रूप में काम करती है। (बेहतर अभी तक: छोटे लिए बॉक्स-कॉक्स ट्रांसफ़ॉर्मेशन ।) चूंकि बहुत कम प्राकृतिक कानूनों में 1/8 शक्ति शामिल होती है, हालांकि, और कई लोग घातांक घटनाओं को शामिल कर सकते हैं, लॉग का उपयोग कर सकते हैं। कभी-कभी एक छोटी शक्ति की तुलना में बेहतर अंतर्दृष्टि और व्याख्या प्रदान करते हैं। पीy=(xp1)/pp
whuber

3
यह इस विचार पर एक छोटी सी दरार है कि शून्य होने पर यह परिवर्तन लघुगणक का विकल्प हो सकता है। सामान्यीकृत रैखिक मॉडल के लिए एक लघुगणक लिंक का कहना है कि प्रतिक्रियाओं का अर्थ तेजी से भिन्न होता है लेकिन यह नहीं मानता है कि उनके सभी मूल्य सकारात्मक हैं। तो यह डेटा में कुछ शून्य को सहन करता है। मोटे तौर पर निहितार्थ यह है कि यदि वे कर सकते हैं तो उन्हें सकारात्मक होना चाहिए: उदाहरण के लिए रिपोर्ट किए गए शून्य (नमूना में शून्य नमूने, मशीन के अनुसार शून्य सांद्रता) कभी-कभी इसका मतलब नहीं पता चलता है। अपने अद्भुत नाम के बावजूद बॉक्स-कॉक्स ओवरसॉल्ड लगता है जब भी जीएलएम में एक प्राकृतिक लिंक होता है।
निक कॉक्स

जवाबों:


10

प्रतिक्रिया पर मनमाने मूल्यों के साथ बिजली परिवर्तन (टके, बॉक्स-कॉक्स) को लागू करना आम बात है। उस दृष्टिकोण से, मुझे आपके 1/8 के मूल्य के बारे में कोई विशेष चिंता नहीं है - यदि वह परिवर्तन आपको अच्छे अवशिष्ट देता है, तो इसके लिए जाएं।

बेशक, कोई भी परिवर्तन कार्यात्मक संबंध को बदल देता है जिसे आप फिट करते हैं, और यह हो सकता है कि 1/8 यंत्रवत् रूप से समझ में न आए, लेकिन यह मेरे लिए चिंता का विषय नहीं होगा जब उद्देश्य भौतिक के मापदंडों को अतिरिक्त या फिट नहीं करना है। कानून, लेकिन प्रभाव के संकेत पर एक उचित पी-मूल्य प्राप्त करने के लिए (मैं तर्क देता हूं कि एक प्रतिगमन में सामान्य उपयोग मामला है)। उस उद्देश्य के लिए, आपकी एकमात्र चिंता यह है कि फ़ंक्शन आपके पूर्वसूचक मान (wrt माध्य और अवशिष्ट भिन्नता) के डोमेन में डेटा के लिए फिट बैठता है, और यह जांचना आसान है।

यदि आप बिजली परिवर्तन के सर्वोत्तम मूल्य के बारे में अनिश्चित हैं, और विभिन्न विकल्पों के बीच तुलना करना चाहते हैं, तो आपको सीधे एआईसी / संभावना मूल्यों की तुलना नहीं करनी चाहिए क्योंकि बिजली परिवर्तन प्रतिक्रिया के पैमाने को बदल देता है। सौभाग्य से, यह पता चला है कि यह परिवर्तन के लिए एक सुधार की गणना करने के, इस तरह है कि विभिन्न परिवर्तनों उनके (सही) संभावना के माध्यम से तुलना की जा सकती अपेक्षाकृत सीधा है (देखें, जैसे यहाँ )।

R में, इसे MASS :: boxcox में लागू किया गया है - यह पावर के लिए सही मान चुनने का एक सुविधाजनक तरीका है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.