कुर्तोसिस परिभाषा में अंतर और उनकी व्याख्या


10

मैंने हाल ही में महसूस किया है कि SPSS और स्टाटा द्वारा प्रदान किए गए कुर्तोसिस मूल्यों में अंतर हैं।

Http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htm देखें

मेरी समझ यह है कि उसी की व्याख्या अलग होगी।

इससे निपटने के बारे में कोई सलाह?


मुझे पहले दो सूत्रों के बारे में पता था और उन लोगों में अंतर करना बहुत आसान है; मैंने वह तीसरा सूत्र नहीं देखा था।
पीटर Flom

जवाबों:


9

तीन सूत्र

कुर्तोसिस के लिए तीन सूत्र आमतौर पर विभिन्न कार्यक्रमों द्वारा उपयोग किए जाते हैं। मैं सभी तीन सूत्रों ( , जी 2 और बी 2 ) और उन कार्यक्रमों का उपयोग करूंगा।g2G2b2

पहले सूत्र और ठेठ कई पाठ्यपुस्तकों में इस्तेमाल किया परिभाषा है (इस लिंक आपके द्वारा प्रदत्त में दूसरा सूत्र है) जहाँmrनमूने के क्षणोंको दर्शाताहै:

g2=m4m22
mr

mr=1n(xix¯)r

कभी-कभी, इस फॉर्मूले में -3 ​​का सुधार शब्द जोड़ा जाता है, ताकि सामान्य वितरण में 0. का कर्टोसिस हो। -3 के कार्यकाल के साथ कर्टोसिस फॉर्मूला को अतिरिक्त कर्टोसिस कहा जाता है (लिंक में पहला सूत्र जो आपने प्रदान किया है)।

दूसरा सूत्र (एसएएस, SPSS और एमएस एक्सेल द्वारा प्रयोग किया जाता है, इस कड़ी में तीसरा सूत्र आपके द्वारा दिए गए है) है

G2=k4k22=n1(n2)(n3)[(n+1)g2+6]

जहां पहले सूत्र में परिभाषित कर्टोसिस है।g2

तीसरा सूत्र (Minitab और BMDP द्वारा प्रयुक्त) है

b2=m4s43=(n1n)2m4m223

जहां है निष्पक्ष नमूना प्रसरण :s2

s2=1n1(xix¯)2

Rkurtosise1071typeg23G2b2

ये दो पत्र चर्चा करते हैं और तीनों सूत्रों की तुलना करते हैं: पहला , दूसरा

सूत्रों के बीच अंतर का सारांश

  1. g2G2b2
  2. G2G2E(G2)=0
  3. के लिए बड़े नमूनों, सूत्रों के बीच अंतर नगण्य हैं और चुनाव में ज्यादा फर्क नहीं पड़ता।
  4. mse(g2)<mse(b2)<mse(G2)g2G2G2G2Var(b2)<Var(g2)<Var(G2)
  5. bias(G2)<bias(g2)<bias(b2)mse(G2)<mse(g2)<mse(b2)G2b2 सबसे बड़ा मतलब चुकता त्रुटि और पूर्वाग्रह है।
  6. n>200bias(G2)<bias(g2)<bias(b2)mse(b2)<mse(g2)<mse(G2)

कुर्तोसिस के बारे में विकिपीडिया पृष्ठ और MathWorld पृष्ठ भी देखें ।


मैं इसे "सामान्य कहानी" की अच्छी, स्पष्ट व्याख्या कहूँगा। मुझे लगता है कि शब्द leptokurtic, mesokurtic, platykurtic सिर्फ सामान हैं जिन्हें हमें 20 वीं शताब्दी में पीछे छोड़ देना चाहिए: हमारे पास एक उपाय है, जिसे हमें मात्रात्मक रूप से सोचना चाहिए। अधिक गंभीरता से, व्याख्या चरम-सपाट बनाम शीर्ष पर पहुंच गई बस वितरण के संभावित आकारों में बहुत भिन्नता के साथ न्याय नहीं करता है, यहां तक ​​कि उन सभी सममित भी हैं। अंत में, जब तक आप अनुचित रूप से छोटे नमूनों के साथ नहीं खेल रहे हैं, तब तक व्यवहार में पूर्वाग्रह बहुत अधिक नहीं काटता है, लेकिन वास्तव में विचरण करता है!
निक कॉक्स

G2γ2g2

G2γ2g2

G2=0

7

प्रश्न में लिंक एसएएस के बारे में भी बात करता है। लेकिन वास्तव में इस सवाल में कुछ भी नहीं है, संभवतः पोस्टर के स्वयं के फोकस को छोड़कर, उन विशेष नामित कार्यक्रमों तक सीमित करता है।

मुझे लगता है कि हमें यहाँ काफी भिन्न प्रकार की समस्याओं को अलग करने की आवश्यकता है, जिनमें से कुछ भ्रम हैं और कुछ वास्तविक हैं।

  1. कुछ कार्यक्रम करते हैं, और कुछ नहीं करते हैं, 3 घटाएं ताकि रिपोर्ट किए गए कर्टोसिस उपाय गौसियन / सामान्य चर के लिए 3 बिना घटाव के हो और 0 घटाव के साथ। मैंने देखा है कि लोग हैरान रह जाते हैं, अक्सर जब अंतर २.९९ का हो जाता है और ठीक ३ का नहीं।

  2. n

इसलिए, # 2 की तुलना में # 1 का एक छोटा मुद्दा है, # 1 बहुत बड़ा सौदा है, लेकिन अगर समझा जाए तो दोनों ही मामूली हैं। सलाह स्पष्ट रूप से उस प्रोग्राम के लिए दस्तावेज़ीकरण को देखने के लिए है जिसका आप उपयोग कर रहे हैं, और अगर कोई प्रलेखन नहीं है जो उस प्रोग्राम को तुरंत छोड़ने के लिए उस तरह का विवरण समझा रहा हो। लेकिन एक चर (1, 2) के रूप में सरल के रूप में एक परीक्षण के मामले में अकेले # 1 (कोई सुधार कारक के साथ) के आधार पर 1 या 4 के कुर्टोसिस का उत्पादन करता है।

सवाल तो व्याख्या के बारे में पूछता है, लेकिन यह बहुत अधिक खुला और विवादास्पद मामला है।

इससे पहले कि हम चर्चा के मुख्य क्षेत्र में आते हैं, अक्सर रिपोर्ट की जाती है, लेकिन बहुत कम ज्ञात कठिनाई यह है कि कर्टोसिस का अनुमान नमूना आकार के कार्य के रूप में लगाया जाता है। मैंने कॉक्स, एनजे 2010 में एक समीक्षा लिखी। नमूना तिरछा और कुर्तोसिस की सीमा। स्टाटा जर्नल 10 (3): 482-495। http://www.stata-journal.com/article.html?article=st0204

सार: नमूना तिरछा और कुर्तोसिस नमूना आकार के कार्यों द्वारा सीमित हैं। पिछले कई दशकों में उनकी सीमाओं, या सन्निकटन को बार-बार खोजा गया है, लेकिन फिर भी वे केवल खराब रूप से ज्ञात हैं। सीमा पूर्वाग्रह का अनुमान लगाती है और, चरम मामलों में, इसका मतलब है कि कोई भी नमूना इसके मूल वितरण के लिए सटीक गवाह नहीं दे सकता है। मुख्य परिणामों को एक ट्यूटोरियल समीक्षा में समझाया गया है, और यह दिखाया गया है कि कैसे Stata और माता का उपयोग उनके परिणामों की पुष्टि करने और पता लगाने के लिए किया जा सकता है।

अब इस बात को आमतौर पर इस बात का पर्याय माना जाता है:

कई लोग कर्टोसिस को चोटी के रूप में अनुवाद करते हैं, लेकिन अन्य लोग इस बात पर जोर देते हैं कि यह अक्सर पूंछ के वजन के माप के रूप में कार्य करता है। वास्तव में, दोनों व्याख्याएं कुछ वितरणों के लिए उचित शब्दांकन हो सकती हैं। यह लगभग अपरिहार्य है कि कुर्टोसिस की कोई सरल मौखिक व्याख्या नहीं है: हमारी भाषा इतनी समृद्ध नहीं है कि दूसरी शक्तियों के विचलन की चौथी शक्तियों के योगों की तुलना करें और दूसरी शक्तियों के योगों की तुलना करें।

नाबालिग और अक्सर अनदेखी की गई क्लासिक में, इरविंग कप्लान्स्की (1945 ए) ने कुर्तोसिस के विभिन्न मूल्यों के साथ वितरण के चार उदाहरणों पर ध्यान आकर्षित किया और कर्टोसिस के कुछ चर्चाओं के अनुरूप नहीं था।

वितरण सभी माध्य 0 और विचरण 1 के साथ सममित हैं और चर लिए घनत्व कार्य हैंxc=π

(1)   (1/3c)(9/4+x4)exp(x2)

(2)   (3/(c8))exp(x2/2)(1/6c)(9/4+x4)exp(x2)

(3)   (1/6c)(exp(x2/4)+4exp(x2))

(4)   (33/16c)(2+x2)exp(3x2/4)

यह इन घनत्वों को प्लॉट करने का निर्देश है। Stata उपयोगकर्ता kaplanskySSC से मेरा प्रोग्राम डाउनलोड कर सकते हैं । घनत्व के लिए एक लघुगणकीय पैमाने का उपयोग करने में मदद मिल सकती है।

पूर्ण विवरणों को दूर किए बिना, ये उदाहरण किसी भी सरल कहानी को कमतर आंकते हैं कि कम या उच्च कर्टोसिस की शिखरता या वास्तव में किसी अन्य एकल विपरीत के संदर्भ में स्पष्ट व्याख्या है।

यदि इरविंग कपलान्स्की नाम एक घंटी बजाता है, तो यह संभावना है क्योंकि आप आधुनिक बीजगणित में उसके काम को जानते हैं। वह (1917-2006) एक कनाडाई (बाद में अमेरिकी) गणितज्ञ थे और उन्होंने हार्वर्ड, शिकागो और बर्कले में पढ़ाया और शोध किया, कोलंबिया विश्वविद्यालय में नेशनल डिफेंस काउंसिल के एप्लाइड गणित समूह में एक युद्धकालीन वर्ष के साथ। कपल्स्की ने समूह सिद्धांत, रिंग सिद्धांत, ऑपरेटर बीजगणित के सिद्धांत और क्षेत्र सिद्धांत में प्रमुख योगदान दिया। वह एक कुशल पियानोवादक और गीतकार थे और गणित के एक उत्साही और स्पष्ट विचारक थे। कपाल्स्की (1943, 1945 बी) और कपलान्स्की और रिओर्डन (1945) द्वारा संभाव्यता और सांख्यिकी में कुछ अन्य योगदानों पर भी ध्यान दें।

कपलान्स्की, आई। 1943. सामान्य वितरण का लक्षण वर्णन। गणित के आंकड़े 14: 197-198।

कपलान्स्की, आई। 1945 ए। कुर्तोसिस से संबंधित एक सामान्य त्रुटि। जर्नल, अमेरिकन सांख्यिकीय एसोसिएशन 40: 259 केवल।

कपलान्स्की, आई। 1945 बी। निरंतर तत्वों के रनों का विषम वितरण। गणित के सांख्यिकी 16: 200-203।

कपलान्स्की, आई और रिओर्डन, जे। 1945। प्रतीकात्मक पद्धति से कई मिलान और रन। गणित के आंकड़े 16: 272-277।


1
+1 कप्लान्स्की के बारे में दिलचस्प टिप्पणियां, जिनके बीजीय कार्य से मैं लंबे समय से परिचित हूं।
whuber

निक, आपकी टिप्पणी "वास्तव में, कुछ व्याख्याओं के लिए दो व्याख्याएं (चरमता और तनाव) दोनों उचित शब्दांकन हो सकते हैं।" यह गलत है इसलिए मददगार नहीं है, क्योंकि कुर्तोसिस आपको "शिखरता" के बारे में कुछ नहीं बताता है। गंभीरता से, क्या आप यह भी परिभाषित कर सकते हैं कि "शिखरता" का क्या अर्थ है? और, एक अनुवर्ती, अगर मैं कर सकता हूं: "शिखरता" की आपकी परिभाषा को देखते हुए (यह मानते हुए कि आप एक के साथ आ सकते हैं), यह कैसे संबंधित है, गणितीय रूप से, कर्टोसिस के लिए?
पीटर वेस्टफॉल

@ पेटर वेस्टफॉल अगर हम इस बात से सहमत हो सकते हैं कि कर्टोसिस क्या कर्टोसिस उपाय है, तो मेरा तर्क सिर्फ कप्लान्स्की का तर्क है, जो ठोस घटता और संख्यात्मक परिणामों पर आधारित है, न कि मौखिक विरलता, यानी कि उच्चतर क्षय कभी-कभी उच्च शिखर घनत्व के साथ जाता है, और इसके विपरीत कम कर्टोसिस। मैं शब्द शिखरवाद के लिए आंशिक नहीं हूं, और जब मौखिक रूप से सरल करने के लिए बाध्य किया जाता है कि व्यवहार में कर्टोसिस ज्यादातर पूंछ वजन की कहानी है। मुझे लगता है कि यहां सूत्र सभी काम करते हैं और सभी सांख्यिकीय वजन उठाते हैं और मौखिक पॉलीमिक्स को कम उपयोगी पाते हैं।
निक कॉक्स

इसके अलावा, मैं सुझाव नहीं दे सकता, पूरी तरह से सममित वितरण के अलावा कुर्तोसिस के किसी भी आसान लक्षण वर्णन। मुझे नहीं लगता कि किसी को भी शिखरता को परिभाषित करने के लिए बाध्य किया जाता है; जो परिभाषा मौजूद है, वह कर्टोसिस की है और व्यावहारिक सवाल यह है कि इसके बारे में कैसे सोचना है और इसका उपयोग कितना दूर है।
निक कॉक्स

बयान "बस क्योंकि कर्टोसिस आपको चोटी के बारे में कुछ नहीं बताता है" अपने आप में निराधार है। अनुपलब्ध संदर्भों में निश्चित रूप से TAS में आपका पेपर शामिल होगा, जो आपकी लंबी चर्चा पर विचार करने के लिए इच्छुक लोगों के लिए सुलभ है।
निक कॉक्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.