तिरछी नज़र का ... क्यों इतने सारे तिरछा कार्य हैं?

मैं इस समुदाय से चार प्रकार के तिरछे पर अधिक अंतर्दृष्टि की उम्मीद कर रहा हूं।

मेरे द्वारा निर्दिष्ट प्रकार http://www.inside-r.org/packages/cran/e1071/docs/skewness सहायता पृष्ठ में उल्लिखित हैं ।

मदद पृष्ठ में पुरानी पद्धति का उल्लेख नहीं किया गया था, लेकिन मैं इसे फिर भी शामिल करता हूं।

require(moments)
require(e1071)


x=rnorm(100)
n=length(x)
hist(x)


###############type=1
e1071::skewness(x,type=1)
sqrt(n) * sum((x-mean(x))^3)/(sum((x - mean(x))^2)^(3/2)) #from e1071::skewness source
m_r=function(x,r) {n=length(x); sum((x - mean(x))^r/n);} ##from e1071::skewness help
g_1=function(x) m_r(x,3)/m_r(x,2)^(3/2)
g_1(x) ##from e1071::skewness help
moments::skewness(x) ##from e1071::skewness help
(sum((x - mean(x))^3)/n)/(sum((x - mean(x))^2)/n)^(3/2) ##from moments::skewness code, exactly as skewness help page


###############type=2
e1071::skewness(x,type=2)
e1071::skewness(x,type=1) * sqrt(n * (n - 1))/(n - 2) #from e1071::skewness source
G_1=function(x) {n=length(x); g_1(x)*sqrt(n*(n-1))/(n-2);} #from e1071::help
G_1(x)
excel.skew=function(x) { n=length(x); return(n/((n-1)*(n-2))*sum(((x-mean(x))/sd(x))^3));}
excel.skew(x)


###############type=3
e1071::skewness(x,type=3)
e1071::skewness(x,type=1) * ((1 - 1/n))^(3/2) #from e1071::skewness source
b_1=function(x) {n=length(x); g_1(x)*((n-1)/n)^(3/2); }  #from e1071::skewness help page
b_1(x);
prof.skew=function(x) sum((x-mean(x))^3)/(length(x)*sd(x)^3);
prof.skew(x)

###############very old method that fails in weird cases
(3*mean(x)-median(x))/sd(x)
#I found this to fail on certain data sets as well...

यहाँ वह कागज है जिसे e1071 के लेखक ने संदर्भित किया है: http://onlinelibrary.wiley.com/doi/10.1111/1467-9884.00122/pdf जॉयन्स और सीए गिल (1998), नमूना स्केचनेस और कुर्टोसिस के तुलनात्मक उपाय।

उस कागज के मेरे पढ़ने से, वे सुझाव देते हैं कि टाइप # 3 में सबसे कम त्रुटि है।

उपरोक्त कोड से तिरछेपन के उदाहरण इस प्रकार हैं:

e1071::skewness(x,type=1)
-0.1620332
e1071::skewness(x,type=2)
-0.1645113
e1071::skewness(x,type=3)
-0.1596088
#old type:
0.2694532

मैंने यह भी देखा कि ई 1071 के लेखक ने हेल्प पेज में नोटों से अलग तिरछा फंक्शन लिखा था। Sqrt को नोटिस करें:

sqrt(n) * sum((x-mean(x))^3)/(sum((x - mean(x))^2)^(3/2)) #from e1071::skewness source

(sum((x - mean(x))^3)/n)/(sum((x - mean(x))^2)/n)^(3/2) #from moments and e1071 help page

कोई विचार क्यों sqrt (n) पहले समीकरण में है? कौन सा समीकरण ओवरफ्लो / अंडरफ्लो को बेहतर तरीके से हैंडल करता है? किसी भी अन्य विचार क्यों वे अलग हैं (लेकिन समान परिणाम उत्पन्न करते हैं)?

skewness

— क्रिस
स्रोत

आपके प्रश्न में "तिरछा के चार प्रकार" का उल्लेख है ... लेकिन फिर एक लिंक देता है और कोड के एक समूह में लॉन्च होता है (जिस भाषा का आप भी उल्लेख नहीं करते हैं)। इसलिए लोगों को यह जानने के लिए कोई लिंक पढ़ने की ज़रूरत नहीं है कि आप क्या पूछ रहे हैं, और उन लोगों के लाभ के लिए जो आर नहीं पढ़ते हैं, और जिन लोगों को कोड पढ़ने में समझ नहीं आती है, उन्हें यह परिभाषित करने में मदद मिलेगी कि कौन से चार स्केवनेस के उपाय आपको पहले (या इसके बजाय अधिमानतः) कोड के एक स्वाथ से मतलब है। [जब आप "इन चारों" को कहते हैं, तो "इन चार" के बजाय, आपको क्यों लगता है कि पाँच या सात या कुछ अन्य संख्याओं के बजाय वास्तव में चार हैं?]

— Glen_b -Reateate Monica

मैंने आपके पोस्ट में पाए जाने वाले विशिष्ट प्रश्नों के उत्तर के कुछ रूप देने का प्रयास किया है और रास्ते में कई मुद्दों को संबोधित किया है, लेकिन इसके बाहर "अधिक अंतर्दृष्टि की उम्मीद" जवाब देने के लिए बहुत अस्पष्ट है। क्या आप अधिक स्पष्ट रूप से पहचान सकते हैं कि आप किन चीजों के बारे में जानकारी चाहते हैं? तिरछेपन से संबंधित हमारी साइट पर कई प्रश्न हैं।

— Glen_b -Reinstate मोनिका

आपकी पोस्ट के लिए धन्यवाद ग्लेन। मैंने दृष्टांत उद्देश्यों के लिए R को शामिल किया और सूत्रों को दिखाने के लिए। इसके अलावा मैं लेटेक्स को नहीं जानता। :(

— क्रिस

आइए आप एक "पुरानी पद्धति" के रूप में वर्णित के साथ शुरू करें; यह दूसरा पियर्सन तिरछापन, या मध्य-तिरछापन है ; वास्तव में क्षण-तिरछापन और जो मोटे तौर पर एक ही विंटेज के हैं (माध्य तिरछापन वास्तव में थोड़ा छोटा है क्योंकि पल का तिरछापन पियर्सन के प्रयासों से पहले का है)।

कुछ इतिहास की थोड़ी चर्चा यहाँ मिल सकती है ; वह पोस्ट आपके अन्य प्रश्नों के एक जोड़े पर भी थोड़ा प्रकाश डाल सकती है।

यदि आप दूसरी पीयरसन तिरछापन का उपयोग करके हमारी साइट खोजते हैं, तो आप काफी कुछ पोस्ट मारेंगे , जिसमें इस उपाय के व्यवहार की कुछ चर्चा होगी।

यह वास्तव में मेरे दिमाग में तिरछापन के उपायों की तुलना में कोई भी अजीब नहीं है; वे दोनों कभी-कभी कुछ अजीब चीजें करते हैं जो लोगों के तिरछापन को मापने की अपेक्षाओं से मेल नहीं खाते हैं।

का सामान्य रूप $b_1$ यहां विकिपीडिया पर चर्चा की गई है ; जैसा कि यह कहा गया है, यह क्षणों के आकलनकर्ता की एक विधि है, और मानकीकृत तीसरे क्षण के संदर्भ में जनसंख्या की गणना का उपयोग करने के लिए एक प्राकृतिक चीज है।

यदि कोई उपयोग करता है $s_n$ के लिये $s_{n-1}$ (यानी बिना बीसेल करेक्शन) आपको मिलता है $g_1$ आप जिस प्रकार का उल्लेख करते हैं; दोनों में से कोई भी मैं "क्षणों की विधि" कहूँगा। यह मेरे लिए स्पष्ट नहीं है कि बहुत से हर क्षेत्र को निष्पक्ष करने की कोशिश की जा रही है क्योंकि यह जरूरी नहीं है कि यह अनुपात को निष्पक्ष न करे; यह करने के लिए समझ में आ सकता है ताकि गणना से मेल खाता है कि लोग हाथ से क्या करने की उम्मीद कर सकते हैं।

हालाँकि, जनसंख्या के तिरछापन को परिभाषित करने के लिए एक दूसरा (समतुल्य) तरीका है, क्यूम्युलेंट के संदर्भ में (उपरोक्त विकिपीडिया लिंक देखें), और यदि नमूने के तिरछेपन के लिए आप उन लोगों के निष्पक्ष अनुमानों का इस्तेमाल करते हैं, तो आपको मिलता है $G_1$ ।

[ध्यान दें कि अंश को गुणा करना $b_1$ द्वारा $\frac{n^2}{(n-1)(n-2)}$ इसे unbiases, ताकि एक और कारण हो सकता है कि लोग उस रूप को देखें। यदि कोई तीसरे और दूसरे क्षण की गणना को निष्पक्ष करने का प्रयास करता है, तो व्यक्ति थोड़ा भिन्न कारक प्राप्त करता है $n,(n-1)$ तथा $(n-2)$ सामने आ रहा है।]

वे तीनों बस तीसरे-पल के तिरछेपन पर थोड़े अलग बदलाव हैं। बहुत बड़े नमूनों में वास्तव में कोई अंतर नहीं है जो आप उपयोग करते हैं। छोटे नमूनों में इन सभी में थोड़ा भिन्नता और भिन्नता होती है।

यहाँ चर्चा किए गए रूपों में तिरछापन की परिभाषा नहीं है (मैंने एक दर्जन के बारे में देखा है, मुझे लगता है - विकिपीडिया लेख काफी कुछ सूचीबद्ध करता है, लेकिन यहां तक कि यह सरगम को कवर नहीं करता है), और न ही तीसरे से संबंधित परिभाषाएँ -मोम तिरछा, जिनमें से मैंने आपके द्वारा यहां उठाए गए तीन से अधिक को देखा है।

तिरछापन के कई उपाय क्यों हैं?

तो (एक पल के लिए उन सभी तीसरे-क्षण तिरछेपन का इलाज करना) इतने अलग-अलग तिरछेपन क्यों? आंशिक रूप से यह इसलिए है क्योंकि एक धारणा के रूप में तिरछापन वास्तव में नीचे पिन करने के लिए काफी कठिन है। यह एक फिसलन भरी चीज है जिसे आप वास्तव में एक ही नंबर पर पिन नहीं कर सकते। नतीजतन, सभी परिभाषाएं किसी तरह से पर्याप्त से कम हैं, लेकिन फिर भी आमतौर पर हमारे व्यापक अर्थों के साथ समझौता होता है कि हम क्या सोचते हैं कि एक तिरछापन उपाय करना चाहिए। लोग बेहतर परिभाषा के साथ आने की कोशिश करते रहते हैं, लेकिन QWERTY कीबोर्ड जैसे पुराने उपाय कहीं नहीं जा रहे हैं।

3 वें क्षण के आधार पर तिरछापन के कई उपाय क्यों हैं?

इतने सारे तीसरे क्षण के तिरछेपन के कारण, ऐसा इसलिए है क्योंकि जनसंख्या-माप को एक नमूने के माप में बदलने का एक से अधिक तरीका है। हमने दो मार्गों को क्षणों के आधार पर और एक को क्यूमुलेंट पर आधारित देखा। हम अभी और निर्माण कर सकते हैं; उदाहरण के लिए हम कुछ वितरण धारणा के तहत एक (छोटा-नमूना) निष्पक्ष उपाय प्राप्त करने की कोशिश कर सकते हैं, या न्यूनतम-माध्य-वर्ग-त्रुटि माप या कुछ अन्य ऐसी मात्रा।

आपको स्काईनेस एनलाइटिंग से संबंधित साइट पर कुछ पोस्ट मिल सकती हैं; कुछ ऐसे हैं जो वितरण के उदाहरण दिखाते हैं जो सममित नहीं हैं लेकिन शून्य तीसरे क्षण तिरछा है। कुछ ऐसे हैं जो पियर्सन मध्य-तिरछापन दिखाते हैं और तीसरे क्षण तिरछापन विपरीत संकेत दे सकता है।

यहाँ तिरछेपन से संबंधित कुछ पोस्टों के लिंक दिए गए हैं:

क्या इसका मतलब है = माध्य का अर्थ है कि एक असमान वितरण सममित है?

बाएं तिरछे डेटा में, माध्य और माध्यिका के बीच क्या संबंध है?

आउटलेर के साथ हिस्टोग्राम से तिरछाता का निर्धारण कैसे करें?

की गणना के बारे में अपने अंतिम प्रश्न के संबंध में $b_1$ :

$\sqrt{n} \cdot \frac{\sum{(x-\bar{x})^3}}{(\sum({x - \bar{x}})^2)^{3/2}}\qquad$ #from e1071 :: तिरछा स्रोत

$\frac{\sum(x - \bar{x})^3/n}{(\sum(x - \bar{x})^2/n)^{3/2}}\qquad$ #from क्षण और e1071 सहायता पृष्ठ

दो रूप बीजगणितीय रूप से समान हैं; दूसरे को स्पष्ट रूप से लिखा गया है "सत्ता के लिए दूसरे क्षण पर तीसरा क्षण $\frac32$ , जबकि पहले सिर्फ शब्दों को रद्द करता है $n$ और बचे हुए मोर्चे को सामने लाता है। मुझे नहीं लगता कि यह अतिप्रवाह / बहिर्वाह से बचने के कारणों के लिए किया गया था; मुझे लगता है कि यह किया गया था क्योंकि यह थोड़ा तेज होने के लिए सोचा गया था। [अगर अतिप्रवाह या अंतर्प्रवाह एक चिंता का विषय है तो शायद गणना अलग तरीके से होगी।]

— Glen_b -Reinstate मोनिका
स्रोत