तिरछापन का एक उपाय माध्य-मध्य पर आधारित है - पियर्सन का दूसरा तिरछा गुणांक ।
तिरछापन का एक अन्य माप सापेक्ष चतुर्थक अंतर (Q3-Q2) बनाम (Q2-Q1) अनुपात के रूप में व्यक्त पर आधारित है
जब (Q3-Q2) बनाम (Q2-Q1) इसके बजाय एक अंतर (या समतुल्य midhinge-मंझला) के रूप में व्यक्त किया जाता है, तो इसे आयामहीन बनाने के लिए स्केल किया जाना चाहिए (जैसा कि आमतौर पर तिरछी माप के लिए आवश्यक होता है), IQR द्वारा कहा गया है, जैसा कि। यहाँ ( डालकर )।u = 0.25
सबसे आम उपाय निश्चित रूप से तीसरे-क्षण तिरछा है ।
कोई कारण नहीं है कि ये तीन उपाय अनिवार्य रूप से सुसंगत होंगे। उनमें से कोई भी अन्य दो से अलग हो सकता है।
जिसे हम "तिरछापन" के रूप में मानते हैं, वह कुछ हद तक फिसलन और गैर-परिभाषित अवधारणा है। अधिक चर्चा के लिए यहां देखें ।
यदि हम आपके डेटा को सामान्य qqplot के साथ देखते हैं:
[वहां चिह्नित लाइन केवल पहले 6 बिंदुओं पर आधारित है, क्योंकि मैं वहां के पैटर्न से अंतिम दो के विचलन पर चर्चा करना चाहता हूं।]
हम देखते हैं कि सबसे छोटे 6 बिंदु लाइन पर लगभग पूरी तरह से झूठ बोलते हैं।
फिर 7 वां बिंदु रेखा के नीचे है (बाएं छोर से संबंधित दूसरे बिंदु की तुलना में मध्य के करीब), जबकि आठवां बिंदु ऊपर बैठता है।
7 वां बिंदु हल्के बाएं तिरछा, अंतिम, मजबूत दाहिने तिरछा दर्शाता है। यदि आप किसी भी बिंदु को अनदेखा करते हैं, तो तिरछापन की छाप पूरी तरह से दूसरे द्वारा निर्धारित की जाती है।
अगर मैं था कहने के लिए यह था एक या दूसरे, मैं फोन करता हूँ कि "सही तिरछा" लेकिन मैं यह भी कहना था कि ऐसा लगता है कि एक बहुत बड़ी बात के प्रभाव के कारण पूरी तरह से किया गया था। इसके बिना यह कहना सही है कि यह सही तिरछा है। (दूसरी ओर, इसके बजाय 7 वें बिंदु के बिना, यह स्पष्ट रूप से तिरछा नहीं बचा है।)
हमें बहुत सावधान रहना चाहिए जब हमारी धारणा पूरी तरह से एकल बिंदुओं द्वारा निर्धारित की जाती है, और एक बिंदु को हटाकर चारों ओर फ़्लिप किया जा सकता है। यह एक आधार पर ज्यादा नहीं है!
मैं इस आधार के साथ शुरू करता हूं कि एक बाहरी 'आउटलाइंग' क्या मॉडल है (एक मॉडल पर सम्मान के साथ एक बाहरी चीज दूसरे मॉडल के तहत काफी विशिष्ट हो सकती है)।
मुझे लगता है कि सामान्य के 0.01 ऊपरी प्रतिशतक (1/10000) पर एक अवलोकन (मतलब से ऊपर 3.72 सेंट) समान रूप से सामान्य मॉडल के लिए एक अवगुण है। एक्सपोनेंशियल डिस्ट्रीब्यूशन मॉडल के 0.01 ऊपरी प्रतिशत पर अवलोकन के समान है। (यदि हम वितरण को अपनी संभाव्य अभिन्न परिवर्तन द्वारा परिवर्तित करते हैं, तो प्रत्येक एक ही वर्दी में जाएगा)
बॉक्सप्लॉट नियम को एक समान रूप से सही तिरछा वितरण के साथ समस्या को देखने के लिए, एक घातीय वितरण से बड़े नमूनों का अनुकरण करें।
उदाहरण के लिए, यदि हम एक सामान्य से आकार 100 के नमूनों का अनुकरण करते हैं, तो हम प्रति नमूने 1 से कम औसत निकलते हैं। यदि हम इसे घातांक के साथ करते हैं, तो हम लगभग 5. औसत करते हैं। लेकिन इसका कोई वास्तविक आधार नहीं है कि यह कहने के लिए कि घातीय मानों का एक उच्च अनुपात "आउटिंग" है, जब तक कि हम एक सामान्य मॉडल के साथ तुलना नहीं करते। विशेष स्थितियों में हमारे पास कुछ विशिष्ट रूप के एक बाहरी नियम होने के विशिष्ट कारण हो सकते हैं, लेकिन कोई सामान्य नियम नहीं है, जो हमें सामान्य सिद्धांतों के साथ छोड़ देता है जैसे कि मैंने इस उपधारा पर शुरू किया था - प्रत्येक मॉडल / वितरण को अपनी स्वयं की रोशनी में इलाज करने के लिए (यदि एक मॉडल के संबंध में कोई मूल्य असामान्य नहीं है, तो उसे उस स्थिति में एक बाहरी क्यों कहें?)
शीर्षक में प्रश्न करने के लिए :
हालांकि यह एक बहुत ही क्रूड इंस्ट्रूमेंट है (यही वजह है कि मैंने क्यूक्यू-प्लॉट पर गौर किया) एक बॉक्सप्लॉट में तिरछापन के कई संकेत हैं - यदि एक कम से कम एक बिंदु एक बाहरी के रूप में चिह्नित है, तो संभावित रूप से (कम से कम) तीन हैं:
इस नमूने (n = 100) में, बाहरी बिंदु (हरा) चरम सीमा को चिह्नित करते हैं, और मध्यिका के साथ बाईं तिरछी सलाह देते हैं। तब बाड़ (नीला) सुझाव देते हैं (जब माध्यिका के साथ संयुक्त होता है) सही तिरछापन का सुझाव देते हैं। फिर टिका (चतुर्थक, भूरा), मध्यमा के साथ संयुक्त होने पर बाएं तिरछापन का सुझाव देते हैं।
जैसा कि हम देखते हैं, उन्हें सुसंगत होने की आवश्यकता नहीं है। जिस पर आप ध्यान केंद्रित करेंगे वह उस स्थिति पर निर्भर करता है जिसमें आप (और संभवतः आपकी प्राथमिकताएँ) हैं।
हालांकि, बॉक्सप्लेट कितना कच्चा है, इस पर एक चेतावनी । यहाँ अंत में उदाहरण दिया गया है - जिसमें डेटा उत्पन्न करने का विवरण शामिल है - एक ही बॉक्सपॉट के साथ चार अलग-अलग वितरण देता है:
जैसा कि आप देख सकते हैं कि पूर्ण समरूपता दिखाने वाले तिरछेपन के उपरोक्त सभी संकेतकों के साथ एक काफी तिरछा वितरण है।
-
आइए इसे इस दृष्टिकोण से लें कि "आपका शिक्षक क्या जवाब दे रहा था, यह देखते हुए कि यह एक बॉक्सप्लॉट है, जो एक बिंदु को एक स्पष्ट रूप से चिह्नित करता है?"।
हम पहले जवाब देने के साथ रह गए हैं "क्या वे आपको उस बिंदु को छोड़कर तिरछापन का आकलन करने की उम्मीद करते हैं, या नमूने में इसके साथ?"। कुछ इसे बाहर कर देंगे, और जो कुछ भी दूसरे जवाब में किया गया, जैसा कि बाकी है, तिरछापन का आकलन करें। हालांकि मैंने उस दृष्टिकोण के विवादित पहलुओं को कहा है, मैं यह नहीं कह सकता कि यह गलत है - यह स्थिति पर निर्भर करता है। कुछ में इसे शामिल किया जाएगा (कम से कम क्योंकि आपके नमूने के 12.5% को छोड़कर सामान्यता से प्राप्त नियम के कारण एक बड़ा कदम * लगता है)।
* एक जनसंख्या वितरण की कल्पना करें जो सुदूर दाएं पूंछ को छोड़कर सममित है (मैंने इसका उत्तर देने में एक ऐसा निर्माण किया - सामान्य लेकिन अत्यधिक दाहिनी पूंछ पारेटो होने के साथ - लेकिन इसे मेरे उत्तर में प्रस्तुत नहीं किया गया)। यदि मैं आकार 8 के नमूने खींचता हूं, तो अक्सर 7 का अवलोकन सामान्य दिखने वाले हिस्से से होता है और एक ऊपरी पूंछ से आता है। यदि हम उस मामले में बॉक्सप्लॉट-आउटलेर्स के रूप में चिह्नित बिंदुओं को बाहर करते हैं, तो हम उस बिंदु को छोड़कर कर रहे हैं जो हमें बता रहा है कि यह वास्तव में तिरछा है! जब हम करते हैं, तो उस स्थिति में रहने वाला छोटा वितरण बाएं-तिरछा होता है, और हमारा निष्कर्ष सही के विपरीत होगा।