क्या कोई एक असमान वितरण का उदाहरण पेश कर सकता है जिसमें शून्य का तिरछापन है लेकिन जो सममित नहीं है?


31

मई 2010 में, विकिपीडिया के उपयोगकर्ता मकोराज़ो ने तिरछे लेख में एक वाक्य जोड़ा कि "एक शून्य मान इंगित करता है कि मूल्य अपेक्षाकृत समान रूप से दोनों तरफ वितरित किए जाते हैं, आमतौर पर जरूरी नहीं कि एक सममित वितरण का अर्थ है।" हालाँकि, विकी पृष्ठ में वितरण के कोई वास्तविक उदाहरण नहीं हैं जो इस नियम को तोड़ते हैं। Googling "शून्य विषमता के साथ विषम वितरण उदाहरण" भी कोई वास्तविक उदाहरण नहीं देता है, कम से कम पहले 20 परिणामों में।

इस परिभाषा का उपयोग करते हुए कि तिरछा की गणना , और और R द्वारा की जाती है! सूत्रE[(Xμσ)3]

sum((x-mean(x))^3)/(length(x) * sd(x)^3)

मैं तिरछापन कम करने के लिए एक छोटा, मनमाना वितरण का निर्माण कर सकता हूं। उदाहरण के लिए, वितरण

x = c(1, 3.122, 5, 4, 1.1) 

तिरछे पैदावार । लेकिन यह एक छोटा सा नमूना है और इसके अलावा समरूपता से विचलन बड़ा नहीं है। तो, क्या एक चोटी के साथ एक बड़ा वितरण का निर्माण संभव है जो अत्यधिक विषम है लेकिन अभी भी लगभग शून्य का तिरछा है?5.64947105


3
क्या आप चाहते हैं कि वितरण एकतरफा हो या न हो? शीर्षक ऐसा कहता है, लेकिन पाठ इस बिंदु का बमुश्किल उल्लेख करता है।
दिलीप सरवटे

@Dilip हाँ, मुझे यह और दिलचस्प लगेगा अगर वितरण असमान था, क्योंकि तिरछापन, एक केंद्रीय क्षण के रूप में, वास्तव में अन्यथा इसका मतलब नहीं है।
एंडी मैकेंजी

जवाबों:


28

असतत वितरण पर विचार करें। एक जो मान पर समर्थित है गैर-नकारात्मक संभावनाओं द्वारा निर्धारित किया जाता है कि शर्तों के अधीन (क) वे 1 और (बी) के लिए तिरछा गुणांक बराबर होते हैं 0 (जो तीसरे केंद्रीय क्षण के शून्य के बराबर है)। यह स्वतंत्रता के डिग्री को छोड़ देता है (समीकरण-सेंसिंग सेंस में, सांख्यिकीय नहीं!)। हम उन समाधानों को खोजने की उम्मीद कर सकते हैं जो असमान हैं।x 1 , x 2 , , x k p 1 , p 2 , , p k k - 2kx1,x2,,xkp1,p2,,pkk2

उदाहरण के लिए आसान खोज करने के लिए, मैं एक छोटे से सममित वेक्टर पर समर्थित समाधान की मांग की पर एक अद्वितीय मोड के साथ , शून्य मतलब , और शून्य तिरछा। ऐसा ही एक समाधान है ।0 ( पी 1 , , पी 7 ) = ( 1396 , 3286 , 9586 , 47386 , 8781 , 3930 , 1235 ) / 75600x=(3,2,1,0,1,2,3)0(p1,,p7)=(1396,3286,9586,47386,8781,3930,1235)/75600

संभाव्यता समारोह

आप देख सकते हैं यह असममित है।

यहां (जो कि असममित है) और साथ अधिक स्पष्ट रूप से असममित समाधान है :p = ( 1 , 18 , 72 , 13 , 4 ) / 108x=(3,1,0,1,2)p=(1,18,72,13,4)/108

प्रायिकता कार्य २

अब यह स्पष्ट है कि क्या चल रहा है: क्योंकि माध्य बराबर है , नकारात्मक मान योगदान करते हैं और तीसरे क्षण जबकि सकारात्मक मान योगदान करते हैं और , बिल्कुल नकारात्मक योगदान को संतुलित करता है। हम बारे में एक सममित वितरण ले सकते हैं , जैसे with , और से थोड़ा द्रव्यमान स्थानांतरित करें करने के लिए , से थोड़ा बड़े पैमाने पर करने के लिए नीचे , और करने के लिए नीचे द्रव्यमान का एक मामूली राशि( - 3 ) 3 = - 27 18 × ( - 1 ) 3 = - 18 4 × 2 3 = 32 13 × 1 3 = 13 0 x = ( - 1 , 0 , 1 ) p = ( 1 , 4 , 1) ) / 6 + 1 + 2 + 1 - 10(3)3=2718×(1)3=184×23=3213×13=130x=(1,0,1)p=(1,4,1)/6+1+2+113एक विषमता का निर्माण करते हुए, पर माध्य और पर तिरछी नजर रखते हुए । एक ही दृष्टिकोण असममित बनाते हुए एक शून्य वितरण के शून्य माध्य और शून्य तिरछा बनाए रखने के लिए काम करेगा; यदि हम बड़े पैमाने पर स्थानांतरण के साथ आक्रामक नहीं हैं, तो यह एकतरफा रहेगा।00


संपादित करें: निरंतर वितरण

क्योंकि यह समस्या सामने आती रहती है, आइए निरंतर वितरण के साथ एक स्पष्ट उदाहरण दें। पीटर फ्लोम का एक अच्छा विचार था: मानदंडों के मिश्रण को देखें। दो मानदंडों का मिश्रण ऐसा नहीं करेगा: जब इसका तिरछापन गायब हो जाता है, तो यह सममित होगा। अगला सरलतम मामला तीन मानदंडों का मिश्रण है।

तीन मानदंडों का मिश्रण, स्थान और पैमाने के उपयुक्त विकल्प के बाद, छह वास्तविक मापदंडों पर निर्भर करता है और इसलिए एक असममित, शून्य-विषमता समाधान का उत्पादन करने के लिए पर्याप्त लचीलेपन से अधिक होना चाहिए। कुछ को खोजने के लिए, हमें यह जानना होगा कि मानदंडों के मिश्रण के तिरछेपन की गणना कैसे करें। इनमें से, हम ऐसी किसी भी खोज करेंगे जो असमान हो (यह संभव है कि कोई भी न हो)।

अब, सामान्य रूप से, (गैर-केंद्रीय) एक मानक सामान्य वितरण का क्षण शून्य होता है जब विषम होता है और अन्यथा बराबर होता है । जब हम उस मानक सामान्य वितरण को मानक विचलन के लिए पुनः , तो पल को गुणा करके । जब हम किसी भी वितरण को द्वारा स्थानांतरित करते हैं, तो नया पल को और सहित क्षणों के संदर्भ में व्यक्त किया जा सकता है r 2 r / 2 Γ ( 1 - rrthr σआरवेंσआरμआरवेंआर2r/2Γ(1r2)/πσrthσrμrthr। वितरण के मिश्रण का क्षण (अर्थात, उनका भारित औसत) व्यक्तिगत क्षणों का समान भारित औसत है। अंत में, तीसरा केंद्रीय क्षण शून्य होने पर तिरछापन बिल्कुल शून्य होता है, और यह पहले तीन क्षणों के संदर्भ में आसानी से गणना की जाती है।

यह हमें समस्या पर एक बीजगणितीय आक्रमण देता है। एक समाधान जो मैंने पाया, वह तीन मानदंडों का एक समान मिश्रण है, जिसमें , , और बराबर पैरामीटर । इसका माध्य समान । यह छवि पीडीएफ को नीले रंग में दिखाती है और वितरण का पीडीएफ लाल रंग में इसके अर्थ के बारे में फ़्लिप करता है । इससे उन्हें पता चलता है कि वे दोनों असममित हैं। (यह मोड लगभग , के माध्य से असमान है ।) इन दोनों में निर्माण द्वारा शून्य तिरछा है( 0 , 1 ) ( 1 / 2 , 1 ) ( 0 , (μ,σ)(0,1)(1/2,1)(0,127/18)(0,2.65623)(0+1/2+0)/3=1/60.05192161/6

निरंतर उदाहरण

भूखंड इंगित करते हैं कि ये असमान हैं। (आप स्थानीय मैक्सीमा खोजने के लिए पथरी का उपयोग करके जांच कर सकते हैं।)


(+1) बहुत ही सुस्त उत्तर। हालांकि यह निरंतर वितरण के साथ काम करेगा? संभावित रूप से शिफ्टिंग छोटे छोटे मोड नहीं बनाएगी? मैं सीधे नहीं सोच रहा हूँ ...
मैक्रों

1
आप काफी अच्छी तरह से सोच रहे हैं, मैक्रो: हम सभी को इतना संदेह होना चाहिए। चौड़ी श्रेणियों में फैली छोटी मात्रा को स्थानांतरित करने के लिए चाल है। पहला-व्युत्पन्न परीक्षण आपको संभावित मोड की जांच करने में सक्षम करेगा और इस बात का प्रमाण भी देगा कि इस फॉर्म के पर्याप्त रूप से छोटे बदलाव नए मोड का उत्पादन नहीं करेंगे ।
whuber

जवाब के लिए धन्यवाद! यह वही है जो मैं सहज रूप से सोच रहा था, हालांकि मैं इसे अच्छी तरह से शब्दों में नहीं डाल सकता था - कि आपको वितरण के प्रत्येक पक्ष पर "संतुलन" करना होगा। मुझे आश्चर्य होता है कि क्या ऐसे रूढ़िबद्ध तरीके हैं जिनसे कोई इस संतुलन कार्य को कर सकता है।
एंडी मैकेंजी

एक रास्ता, एंडी, एक असतत समाधान के साथ शुरू करना है और फिर इसे एक सामान्य वितरण के साथ हल करना है। इस मामले में, असमानता आवश्यकता उस सामान्य वितरण को एक बड़े मानक विचलन के लिए मजबूर करेगी। फिर भी, यदि दृढ़ विश्वास अपेक्षित गुण (जैसे कि शून्य तिरछा) को नहीं बदलता है, या यह इसे पूर्वानुमेय तरीके से बदलता है, तो आपके पास समस्या पर एक गणितीय संभाल है। कुछ अर्थों में मेरे हाल के संपादन को इस तरह के हमले के रूप में देखा जा सकता है, हालांकि यह कड़ाई से एक दृढ़ संकल्प नहीं है (क्योंकि तीन मानदंडों में अलग-अलग मानक विचलन हैं)।
whuber

2
मैंने जाँच की है, एंडी: असतत समाधान को एक सामान्य वितरण के साथ हल करने से तिरछापन नहीं बदलता है। जब आप उस सामान्य वितरण को 0.57 या उससे अधिक के आसपास एक मानक विचलन देते हैं, तो परिणाम असमान है। अंतर्निहित असतत वितरण की तरह, इसका शून्य मतलब, शून्य तिरछा होना और असममित होना जारी है। मानक सामान्य और असतत वितरण के बीच द्रव्यमान के नियंत्रित आंदोलन के लिए एक मानक सामान्य वितरण मात्रा के साथ इसे मिलाकर: यह "स्टिरियोटाइप्ड" विधि के लिए आपके अनुरोध को पूरा कर सकता है।
whuber

23

यहाँ एक है जो मुझे https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# पर मिलता है जो मुझे अच्छा लगता है और आर में बदला हुआ: एक उलटा बुर्ज या Dagum वितरण आकार के मापदंडों के साथ और :k=0.0629c=18.1484

g(x)=ckx(c+1)[1+xc](k+1)

इसका मतलब 0.5387, मानक विचलन 0.2907, तिरछा 0.0000 और कर्टोसिस 2.0000 है। स्रोत इसे "हाथी वितरण" भी कहता है: यहाँ छवि विवरण दर्ज करें

आर में मेरा प्रजनन के साथ बनाया गया था

library(actuar)
library(knotR)

# a nonsymmetric distribution with zero skewness
# see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html#

c <- 18.1484
k <- 0.0629

x <- seq(0,1.5,by=.0001)

elephant.density <- dinvburr(x, k, c)
plot(x,elephant.density, type="l")
polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey")
points(0.8,0.8, pch=19, cex=2)

# "ears" created via https://www.desmos.com/calculator/cahqdxeshd
ear.x <- c(0.686, 0.501, 0.42, 0.68)
ear.y <- c(0.698, 0.315, 1.095, 0.983)

myseg(bezier(cbind(ear.x, ear.y)), type="l")

EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf
EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k)
EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k)
(skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196

जैसा कि यह आउटपुट दिखाता है, इन पैरामीटर मानों के लिए तिरछापन काफी शून्य से चार अंक नहीं है। यहाँ और लिए थोड़ा अनुकूलन है :kc

   # optimize skewness a bit further
    skewval <- 1

while (skewval > 10^(-10)){
  optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c)
  skewval <- optskew.k$f.root
  k <- optskew.k$root

  optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k)
  skewval <- optskew.c$f.root
  c <- optskew.c$root
}

उपज

> print(c)
[1] 18.89306

> print(k)
[1] 0.05975542

> print(skewval)
[1] -1.131464e-15

संपादन के लिए धन्यवाद। उस ने कहा, मैं 0.0000 से चार अंकों के तिरछेपन को पुन: उत्पन्न नहीं कर सका, इसके बजाय 0.0001245138 प्राप्त कर रहा हूं (देखें अगला संपादन, आर कोड में)।
क्रिस्टोफ़ हनक

ck

दरअसल, 0.0003756196। 0.0001245138 कुछ प्रारंभिक अनुकूलन के बाद पहले से ही गलती से यहां दिया गया था। में देख लूंगा।
क्रिस्टोफ हनक

@ तोमबा, मैंने थोड़ा अनुकूलन करने की कोशिश की, लेकिन मैं ऐसा करने का कोई दावा नहीं करता हूं कि चतुर तरीके से, मुझे अनुकूलन के साथ बहुत कम अनुभव है।
बजे क्रिस्टोफ हनक

2
तिरछा वह शून्य से तीन अंक (लगभग चार) मेरे दिमाग में बहुत था; यह अधिक सटीक मूल्य की तरह नहीं है जिससे यह किसी भी अलग दिखाई देगा। यदि तिरछापन उस आसपास के क्षेत्र में शून्य को पार कर जाएगा और यह स्पष्ट है कि मूल्यों को मोड़ने के लिए क्या दिशाएँ हैं यदि अधिक सटीकता की आवश्यकता है, तो मुझे लगता है कि यह पर्याप्त है। लेकिन अतिरिक्त प्रयास के लिए यश। (यह एक सुंदर उदाहरण है, वैसे)
Glen_b -Reinstate Monica

9

वास्तविक लाइन के सकारात्मक आधे पर एक वितरण पर विचार करें जो 0 से मोड तक रैखिक रूप से बढ़ता है और फिर मोड के दाईं ओर घातांक है, लेकिन मोड पर निरंतर है।

इसे एक त्रिकोणीय-घातीय वितरण कहा जा सकता है (हालांकि यह अक्सर शार्क फिन की तरह दिखता है)।

θλ

λθλθ6.15

त्रिकोणीय-घातीय शून्य तिरछा के साथ

[1][2]

थ्रेड नॉन-नॉर्मल डिस्ट्रीब्यूशन विथ जीरो स्क्यूनेस और जीरो एक्स्ट्रा कुर्टोसिस? कुछ असममित उदाहरण हैं, जिनमें एक छोटा असतत उदाहरण और दूसरा एक निरंतर असमानता शामिल है:

शून्य तिरछा के साथ Unimodal गाऊसी मिश्रण

असमान असमान वितरण - या समकक्ष, नमूने - शून्य तिरछा के साथ बड़े या छोटे आकार के निर्माण के लिए काफी आसान हैं।

यहाँ एक उदाहरण दिया गया है, जिसे आप एक नमूने के रूप में या (कच्चे आवृत्तियों को 3000 से विभाजित करके) एक pmf के रूप में ('x' मान मान लेते हैं, 'n' उस नमूने में होने वाले समय की संख्या है। ):

x:  -2   -1    0    1    2    3    4    5    6    7    8    9   10
n: 496  498  562 1434    2    1    1    1    1    1    1    1    1

उपरोक्त से निर्मित संभाव्यता द्रव्यमान फ़ंक्शन का एक भूखंड

यह उदाहरण 3-बिंदु वितरण से निर्मित है:

x:          -2              1                  c
n:   c(c-1)(c+1)/6     c(c-1)(c+1)/3 - c       1

ccinixi=0inixi3=0c

इस तरह के अन्य "परमाणु" के सभी तरीके हो सकते हैं, लेकिन यह उदाहरण केवल इस एक प्रकार का उपयोग करता है। परमाणुओं के कुछ संयोजन के लिए, जैसे कि उन्हें कुछ छेदों में जोड़ा जाता है, शेष छिद्रों को भरने के लिए और औसतन और तीसरे क्षण की संरचना को नष्ट किए बिना असमानता की गारंटी देते हैं।

[1]


[2]



3
शायद इसे "शार्क-फिन" शायद कह सकते हैं?
Glen_b -Reinstate मोनिका

@Glen_b पूरी तरह से शार्क-फिन वास्तव में।
एलेकोस पापाडोपोलोस

2

ज़रूर। इसे इस्तेमाल करे:

skew= function (x, na.rm = FALSE) 
 {
    if (na.rm)    x <- x[!is.na(x)]             #remove missing values
    sum((x - mean(x))^3)/(length(x) * sd(x)^3)  #calculate skew   
 }

set.seed(12929883) 
x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1))

 skew(x)
 plot(density(x))

(आप पहले से ही कठिन सामान किया था!)


1
अच्छा, मुझे ये पसंद है। +1
गुंग - को पुनः स्थापित मोनिका

4
यह bimodal नहीं है ... यह बुरी है बहु -modal। घनत्व की साजिश रचने का प्रयास करें; curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
अतिथि

1
इस तरह से उत्पन्न डेटा निश्चित रूप से एकमत नहीं है। आपको केवल यह देखने की आवश्यकता है कि आपके कोड को कटा हुआ और चिपका दिया गया है या नहीं। वास्तव में, सामान्य रूप से वितरित चर का मिश्रण कभी भी असमान नहीं होगा (जब तक कि, मिश्रण अनुपात 1 में से एक नहीं है)।
मैक्रों

8
@ मैक्रो, यह सही नहीं है। उदाहरण के लिए, रोएडर 1994 (जेएएसए) के प्रसिद्ध परिणाम के लिए सार यह है कि "दो मिश्रित मानदंडों का घनत्व बिमोडल नहीं है जब तक कि साधन कम से कम 2 मानक विचलन द्वारा अलग नहीं किए जाते हैं"। यदि उन्हें इससे कम में अलग किया जाता है, तो मिश्रण एकतरफा है।
अतिथि

1
तुम सही हो मैं उस संभावना के बारे में भूल गया था जब मैंने अपना पद बनाया था
मैक्रो

2

E[(Xμσ)3]=0
E[(Xμσ)3|Xμ]+E[(Xμσ)3|X>μ]=0.

YZμ

E[(Yμσ)3]=E[(Zμσ)3]
XYμ(μZ)

YZμμ


1
आप कैसे गारंटी देते हैं कि वितरण असमान है?
दिलीप सरवटे

YZμ

σYZ

@ शुभकर्ता: धिक्कार है। मुझे पता था कि कुछ
नुकसान

2

निम्नलिखित असतत वितरण असममित है और इसमें अशक्तता है: प्रोब (-4) = 1/3, प्रोब (1) = 1/2, प्रोब (5) = 1/6। मैंने इसे डोरिक एट अल।, क्वाल क्वांट (2009) 43: 481-493 के पेपर में पाया; डीओआई 10.1007 / s11135-007-9128-9


+1 यह जाँच करता है और यह एकतरफा है। यह सबसे सरल संभव उदाहरण है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.