सामान्य तौर पर वर्गमूल, लॉग, इत्यादि जैसे सामान्य से परे क्या सामान्यीकरण परिवर्तन किए जाते हैं?


10

परीक्षण स्कोर (जैसे, शिक्षा या मनोविज्ञान में) के विश्लेषण में, आम विश्लेषण तकनीक अक्सर मानती है कि डेटा सामान्य रूप से वितरित किए जाते हैं। हालांकि, शायद अधिक बार नहीं, स्कोर कभी-कभी सामान्य से बेतहाशा विचलन करते हैं।

मैं कुछ बुनियादी सामान्यीकरण परिवर्तनों से परिचित हूं, जैसे: चौकोर जड़ें, लघुगणक, सकारात्मक तिरछा कम करने के लिए पारस्परिक परिवर्तन, नकारात्मक तिरछा को कम करने के लिए ऊपर के परिलक्षित संस्करण, लेप्टोकर्टिक वितरण के लिए वर्ग। मैंने आर्किसिन परिवर्तनों और बिजली परिवर्तनों के बारे में सुना है, हालांकि मैं वास्तव में उनके बारे में जानकार नहीं हूं।

इसलिए, मैं उत्सुक हूं कि विश्लेषकों द्वारा आमतौर पर अन्य परिवर्तनों का क्या उपयोग किया जाता है?

जवाबों:


5

बॉक्स कॉक्स परिवर्तन हैं जिन्हें आप उद्धृत के कई शामिल हैं। कुछ विवरणों के लिए यह उत्तर देखें:

अद्यतन: ये स्लाइड बॉक्स-कॉक्स परिवर्तनों का एक बहुत अच्छा अवलोकन प्रदान करते हैं।


यदि हम बॉक्स-कॉक्स रूपांतरित डेटा के लिए टी-टूल लागू करते हैं तो हमें रूपांतरित डेटा के साधनों में अंतर के बारे में निष्कर्ष मिलेंगे। हम माप के मूल पैमाने पर उन लोगों की व्याख्या कैसे कर सकते हैं? (रूपांतरित मूल्यों का अर्थ रूपांतरित रूप नहीं है)। दूसरे शब्दों में (यदि मैं सही हूं), बदले हुए पैमाने पर, मतलब के अनुमान का उलटा रूप लेना, मूल पैमाने पर मतलब का अनुमान नहीं देता है।
जॉर्ज डोंटास

@ gd047, कुछ परीक्षण माध्य के वितरण की सामान्यता को मानते हैं, डेटा को नहीं। टी-टेस्ट अंतर्निहित डेटा के लिए बहुत मजबूत wrt हो जाता है। हालांकि आप सही हैं - परिवर्तन के बाद के परीक्षणों के साथ, परिणाम उलटा-रूपांतरण के बाद रिपोर्ट किए जाते हैं, और व्याख्या बहुत समस्याग्रस्त हो सकती है। यह नीचे आता है कि आपका डेटा "अन-नॉर्मल" कैसे है, क्या आप ट्रांसफॉर्म या अपॉइंटमेंट के बिना दूर हो सकते हैं, कह सकते हैं, एक लॉग ट्रांसफॉर्मेशन जिसकी व्याख्या करना आसान है। अन्यथा, यह वास्तविक परिवर्तन और डोमेन पर प्रासंगिक है और मेरे पास वास्तव में एक अच्छा जवाब नहीं है। यह देखने के लिए कहने लायक हो सकता है कि दूसरे क्या कहते हैं?
ars

10

पहला कदम होना चाहिए पूछना क्यों अपने चर गैर सामान्य रूप से वितरित कर रहे हैं। यह रोशन कर सकता है। मेरे अनुभव से आम निष्कर्ष:

  • क्षमता परीक्षण (जैसे, परीक्षा, खुफिया परीक्षण, प्रवेश परीक्षण) छत के प्रभाव और फर्श के प्रभाव होने पर सकारात्मक रूप से तिरछे होने पर नकारात्मक रूप से तिरछे हो जाते हैं। दोनों निष्कर्षों से पता चलता है कि परीक्षण का कठिनाई स्तर नमूना के लिए अनुकूलित नहीं है, या तो बहुत आसान है या क्षमता को अलग-अलग करने के लिए बहुत मुश्किल है। इसका तात्पर्य यह भी है कि ब्याज के अव्यक्त चर को अभी भी सामान्य रूप से वितरित किया जा सकता है, लेकिन यह कि परीक्षण की संरचना मापा चर में तिरछा उत्प्रेरण है।
  • क्षमता परीक्षण अक्सर कम स्कोरर के मामले में आउटलेयर होते हैं। संक्षेप में, एक परीक्षण पर खराब प्रदर्शन करने के कई तरीके हैं। विशेष रूप से यह कभी-कभी उन परीक्षाओं पर देखा जा सकता है जहां छात्रों का एक छोटा प्रतिशत होता है जहां कुछ योग्यता और प्रयास की कमी के संयोजन ने बहुत कम परीक्षा स्कोर बनाने के लिए संयुक्त किया है। इसका तात्पर्य यह है कि ब्याज के अव्यक्त चर में संभवतः कुछ आउटलेयर हैं।
  • स्व-रिपोर्ट परीक्षणों (जैसे, व्यक्तित्व, दृष्टिकोण परीक्षण, आदि) के संबंध में तिरछा अक्सर तब होता है जब नमूना स्वाभाविक रूप से उच्च स्तर पर होता है (उदाहरण के लिए, जीवन संतुष्टि के वितरण नकारात्मक रूप से तिरछे होते हैं क्योंकि अधिकांश लोग संतुष्ट होते हैं) या जब पैमाने एक नमूना जिसे परीक्षण में लागू किया जा रहा है (जैसे कि गैर-नैदानिक ​​नमूने में अवसाद के नैदानिक ​​उपाय को लागू किया जा रहा है) के लिए अनुकूलित किया गया है।

यह पहला कदम परीक्षण के लिए डिजाइन संशोधनों का सुझाव दे सकता है। यदि आप समय से पहले इन मुद्दों के बारे में जानते हैं, तो आप उन्हें बचने के लिए अपना परीक्षण भी डिजाइन कर सकते हैं, यदि आप उन्हें समस्याग्रस्त के रूप में देखते हैं।

दूसरे चरण के लिए है कि क्या करना है तय स्थिति है जहाँ आप गैर सामान्य डेटा है में। नोट परिवर्तन एक संभावित रणनीति है। मैं गैर-सामान्यता के बारे में पिछले उत्तर से सामान्य सलाह को दोहराऊंगा :

  • कई प्रक्रियाएं जो अवशिष्ट की सामान्यता मानती हैं, अवशिष्ट की सामान्यता के मामूली उल्लंघन के लिए मजबूत हैं
  • आमतौर पर बूटस्ट्रैपिंग एक अच्छी रणनीति है
  • रूपांतरण एक और अच्छी रणनीति है। ध्यान दें कि मेरे अनुभव से आमतौर पर क्षमता और स्वयं-रिपोर्ट मनोवैज्ञानिक परीक्षणों के साथ होने वाले हल्के तिरछा के प्रकार आमतौर पर एक लॉग, sqrt, या उलटा परिवर्तन (या उलटा समकक्ष) का उपयोग करके सामान्यता को वितरित करने वाले वितरण में आसानी से बदल सकते हैं।

9

जॉन Tukey व्यवस्थित रूप से EDA पर अपनी पुस्तक में परिवर्तनों पर चर्चा करता है। बॉक्स-कॉक्स परिवार (बहुत कम बिजली परिवर्तन) के अलावा, वह अनुपातों के लिए "मुड़ा हुआ" परिवर्तनों के एक परिवार को परिभाषित करता है (आवश्यक रूप से x / (1-x) की शक्तियां) और "प्रारंभ" मायने रखता है (गिने हुए डेटा में एक सकारात्मक ऑफसेट जोड़कर) उन्हें बदलने से पहले)। तह परिवर्तन, जो अनिवार्य रूप से लॉगिट को सामान्य करते हैं, विशेष रूप से परीक्षण स्कोर के लिए उपयोगी होते हैं।

वितरण पर अपनी पुस्तकों में एक पूरी तरह से अलग नस, जॉनसन एंड कोटज़ में, परीक्षण के आंकड़ों को अनुमानित सामान्यता (या कुछ अन्य लक्ष्य वितरण के लिए) में बदलने के लिए कई परिवर्तन प्रदान किए जाते हैं, जैसे ची-वर्ग के लिए क्यूब-रूट परिवर्तन। यह सामग्री उपयोगी परिवर्तनों के लिए विचारों का एक बड़ा स्रोत है जब आप अनुमान लगाते हैं कि आपका डेटा कुछ विशिष्ट वितरण का पालन करेगा।


2

एक सरल विकल्प यह है कि स्कोर के बजाय स्कोर का उपयोग करें। वितरण का योग सामान्यता को दर्शाता है। उदाहरण के लिए, शिक्षा में आप परीक्षणों की एक श्रृंखला में एक छात्र के अंकों को जोड़ सकते हैं।

एक अन्य विकल्प, निश्चित रूप से, उन तकनीकों का उपयोग करना है जो सामान्यता को नहीं मानते हैं, जिन्हें कम करके आंका जाता है।


1
मेरा मानना ​​है कि वितरण को सामान्यता की ओर ले जाने के लिए रकम को सामान्यीकृत किया जाना चाहिए (जैसे, माध्य स्कोर का उपयोग करना)।

1
हां यह सही है। मेरे उदाहरण में मैंने माना कि कक्षाओं में छात्रों की संख्या समान होगी, जो यथार्थवादी नहीं है। धन्यवाद।
कार्लोस एक्सीली

1

एक्स~एफY एलआरटीडब्ल्यू×एफ

एक्स~एन(μ,σ2)θ=(μएक्स,σएक्स,δ,α)α1

अब डेटा ट्रांसफ़ॉर्मेशन के रूप में यह दिलचस्प हो जाता है क्योंकि ट्रांसफ़ॉर्मेशन बायजेक्टिव (तिरछे केस के लिए लगभग विशेषण) है और इसे लैम्बर्ट के डब्ल्यू फ़ंक्शन (इसलिए नाम लैम्बर्ट डब्ल्यू एक्स एफ) का उपयोग करके स्पष्ट रूप से प्राप्त किया जा सकता है । इसका मतलब है कि हम डेटा से तिरछापन को दूर कर सकते हैं और भारी पूंछों को हटा सकते हैं (विशेष रूप से!)।

आप इसे LambertW R पैकेज का उपयोग करके आज़मा सकते हैं , मैनुअल के साथ इसका उपयोग करने के कई उदाहरण दिखाते हैं।

आवेदन के लिए ये पोस्ट देखें

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.