सहसंबद्ध गैर-सामान्य डेटा बनाने के लिए विधि


14

मैं सहसंबद्ध, गैर-सामान्य डेटा बनाने के लिए एक विधि खोजने में दिलचस्पी रखता हूं। तो आदर्श रूप से कुछ प्रकार के वितरण जो एक कोवरियस (या सहसंबंध) मैट्रिक्स में एक पैरामीटर के रूप में लेते हैं और इसे अनुमानित करने वाले डेटा उत्पन्न करते हैं। लेकिन यहाँ पकड़ है: जिस विधि को मैं खोजने की कोशिश कर रहा हूं, उसमें इसकी बहुभिन्नरूपी तिरछापन और / या कुपोषण को नियंत्रित करने का लचीलापन होना चाहिए।

मैं फ्लीशमैन की विधि और सामान्य चर की शक्ति पद्धति के उपयोग से परिचित हूं, लेकिन मेरा मानना ​​है कि उन एक्सटेंशनों में से अधिकांश केवल उपयोगकर्ता को सीमांत तिरछापन और कुर्तोसिस के कुछ संयोजनों के लिए अनुमति देते हैं , जिससे मल्टीवेरेट तिरछापन / कोसिस को बस बाहर छोड़ दिया जाता है। अगर मैं सोच रहा था कि क्या कोई विधि है जो कुछ सहसंबंध / सहसंयोजक संरचना के साथ बहुभिन्नरूपी तिरछापन और / या कुर्तोसिस को निर्दिष्ट करने में मदद करती है।

लगभग एक साल पहले मैंने कोप्युला के वितरण पर एक संगोष्ठी ली थी और मुझे प्रोफेसर का उल्लेख करते हुए याद आया कि बेल कॉप्यूल्स के इस्तेमाल से कोई भी ऐसा डेटा तैयार कर सकता है जो अपने 1-डी मार्जिन में से प्रत्येक में सममित है, लेकिन संयुक्त रूप से नए और इसके विपरीत। -versa। या, इससे भी आगे, कि किसी भी निचले-आयामी मार्जिन में उच्चतम आयाम सममित (या नहीं) रखते हुए कुछ तिरछा या कुर्तोसिस हो सकता है। मैं इस विचार से अचंभित था कि इस तरह के लचीलेपन का अस्तित्व हो सकता है मैं किसी प्रकार के लेख या कॉन्फ्रेंस पेपर को खोजने की कोशिश कर रहा हूं जो उक्त विधि का वर्णन करता है, लेकिन मैं असफल रहा हूं :( यह कॉपुलस के उपयोग के माध्यम से नहीं होता है, मैं कुछ भी करने के लिए खुला हूँ जो काम करता है।

संपादित करें: मैंने कुछ आर कोड जोड़ा है जो यह दिखाने का प्रयास करता है कि मेरा क्या मतलब है। अब तक मैं केवल मर्दिया की बहुभिन्नरूपी तिरछापन और कुर्तोसिस की परिभाषा से अच्छी तरह परिचित हूं। जब मैंने पहली बार अपनी समस्या से संपर्क किया तो मैंने भोलेपन से सोचा कि अगर मैं तिरछे मार्जिन (इस उदाहरण में बीटा) के साथ एक सममित कोप्युला (गॉसियन) का उपयोग करता हूं, तो मार्जिन पर एकतरफा परीक्षण महत्वपूर्ण परिणाम देगा लेकिन मल्टीविराइट तिरछा / कुर्तोसिस के लिए मर्डिया का परीक्षण होगा। गैर-महत्वपूर्ण हो। मैंने कोशिश की थी और यह बाहर नहीं आया जैसा कि मैंने उम्मीद की थी:

library(copula)
library(psych)
set.seed(101)

cop1 <- {mvdc(normalCopula(c(0.5), dim=2, dispstr="un"), 
            c("beta", "beta"),list(list(shape1=0.5, shape2=5), 
            list(shape1=0.5, shape2=5)))}

            Q1 <- rmvdc(cop1, 1000)
            x1 <- Q1[,1]
            y1 <- Q1[,2]


cop2 <- {mvdc(normalCopula(c(0.5), dim=2, dispstr="un"), 
            c("norm", "norm"),list(list(mean=0, sd=1), 
            list(mean = 0, sd=1)))}

            Q2 <- rmvdc(cop2, 1000)
            x2 <- Q2[,1]
            y2 <- Q2[,2]

mardia(Q1)  

Call: mardia(x = Q1)

Mardia tests of multivariate skew and kurtosis
Use describe(x) the to get univariate tests
n.obs = 1000   num.vars =  2 
b1p =  10.33   skew =  1720.98  with probability =  0
small sample skew =  1729.6  with probability =  0
b2p =  22.59   kurtosis =  57.68  with probability =  0

mardia(Q2)
Call: mardia(x = Q2)

Mardia tests of multivariate skew and kurtosis
Use describe(x) the to get univariate tests
n.obs = 1000   num.vars =  2 
b1p =  0.01   skew =  0.92  with probability =  0.92
 small sample skew =  0.92  with probability =  0.92
b2p =  7.8   kurtosis =  -0.79  with probability =  0.43

'कॉप 1' वीएस 'कॉप 2' के साथ-साथ अनुभवजन्य द्विभाजन घनत्व भूखंडों के लिए आकृति का निरीक्षण करने पर, मैं यह भी देख सकता हूं कि उनमें से कोई भी सममित नहीं दिखता है। जब मैंने महसूस किया कि यह मेरे विचार से शायद थोड़ा अधिक जटिल है।

मुझे पता है कि मर्डिया केवल मल्टीवेरेट स्केवनेस / कुर्टोसिस की परिभाषा नहीं है, इसलिए मैं खुद को एक ऐसी विधि खोजने के लिए सीमित नहीं कर रहा हूं जो केवल मर्डिया की परिभाषाओं को संतुष्ट करता है।

धन्यवाद!


+1 सबसे दिलचस्प सवाल। क्या आप इस बारे में अधिक विशिष्ट हो सकते हैं कि इस संदर्भ में 'संयुक्त रूप से तिरछा' का अर्थ क्या है (विशेष रूप से एक द्विभाजित)? जब मैं चार चतुर्भुजों में "अलग-अलग" अर्थों में संयुक्त वितरण के रूपों को चित्रित कर सकता हूं (साधनों पर लगाए गए कुल्हाड़ियों के बारे में, कहते हैं), मैं "संयुक्त रूप से तिरछी" विशेष रूप से संदर्भित हो सकता है से परिचित नहीं हूं।
Glen_b -Reinstate मोनिका

कोपल्स का उपयोग करने के लिए के रूप में; स्पष्ट रूप से एक कोपुला सममित (विभिन्न इंद्रियों में) हो सकता है जबकि मार्जिन तिरछे होते हैं, क्योंकि कोपला सीमांत एकरूपता में बदल जाता है। तो एक बहुभिन्नरूपी lognormal ( रूप में भी सरल रूप में कुछexpXX

नमस्कार। मेरे प्रश्न में रुचि लेने के लिए आपका बहुत-बहुत धन्यवाद। यह पहली बार है जब मैं यहां पोस्ट कर रहा हूं इसलिए मुझे आशा है कि मैं चीजों को सही तरीके से कर रहा हूं। मैं टिप्पणी अनुभाग पर अधिक विस्तार से बताऊंगा क्योंकि चरित्र सीमा मुझे आर कोड का उपयोग करने से रोकने की कोशिश करती है और बताती है कि मैं क्या कर रहा हूं
एस। पुन्नी

हाँ, मुझे सिर्फ इतना एहसास हुआ और अधिक विस्तार से जोड़ा गया। मैं आपको इस बोर्ड का उपयोग करने के तरीके के बारे में बताने के लिए समय निकाल रहा हूं। धन्यवाद!
एस। पुन्नी

" केवल एक विधि खोजने के लिए खुद को सीमित नहीं करता है जो केवल मर्डिया की परिभाषाओं को संतुष्ट करता है " - क्या करने की विधि?
Glen_b -Reinstate Monica

जवाबों:


3

बहुत खोज, चारों ओर ऑनलाइन मंचों कूद, प्रोफेसरों के साथ परामर्श और साहित्य की समीक्षा की बहुत करने के बाद, मैं निष्कर्ष है कि शायद के लिए आए हैं इस समस्या को हल करने एकमात्र तरीका बेल कॉपोरल्स के उपयोग के माध्यम से है। यह आपको जोड़ीदार तिरछापन और कुर्तोसिस (या किसी भी उच्च क्षणों) पर कुछ नियंत्रण देता है - पी-वेरिएंट रैंडम वेक्टर के लिए और पी -1 जोड़े कोपलों और शेष पी * (पी -1) / 2 को निर्दिष्ट करने की स्वतंत्रता के लिए - ( पी -1) आयाम किसी प्रकार के सशर्त कोप्युला में निर्दिष्ट किए जा सकते हैं।

मैं उन अन्य तरीकों का स्वागत करता हूं, जो शायद लोगों को पसंद आए हैं, लेकिन कम से कम मैं इस सूचक को एक उत्तर की ओर छोड़ने जा रहा हूं क्योंकि मैं नहीं कर सकता, मेरे जीवन के लिए, इसे संबोधित करने के लिए कोई अन्य तरीके ढूंढें।


2
बेल कोपला क्या है?
सेक्सस एम्पिरिकस

1

आप इसे Ruscio और Kaczetow's (2008) एल्गोरिदम को संशोधित करके हल करने में सक्षम हो सकते हैं। उनका पेपर एक पुनरावृत्त एल्गोरिथ्म (आर कोड के साथ) प्रदान करता है जो वास्तविक और इच्छित सीमांत आकार के बीच अंतर को कम करता है। आप इसे संशोधित करने में सक्षम हो सकते हैं ताकि इसका लक्ष्य बहुभिन्नरूपी (सीमांत के बजाय) क्षण हो।

रुसियो, जे।, और केज़ेटो, डब्ल्यू। (2008)। एक पुनरावृत्त एल्गोरिथ्म का उपयोग करते हुए बहुभिन्नरूपी गैर-असामान्य डेटा का अनुकरण। बहुभिन्नरूपी व्यवहार अनुसंधान, 43 (3), 355‐381। डोई: 10.1080 / 00273170802285693


हे भगवान! धन्यवाद! मैंने एक पल के लिए सोचा कि यह सवाल बस गुमनामी में बदल जाएगा
एस। पुन्नी

1
अच्छी तरह से ... मैं Ruscio और Kaczetow (2008) लेख की समीक्षा की है। दुख की बात यह है कि एल्गोरिदम का NORTA (नॉर्मल टू एनीथिंग) परिवार का सिर्फ एक और (अभी तक अधिक लचीला) कार्यान्वयन है जिसे मल्टीवेरिएट 3 & 4 क्षणों के साथ अच्छी तरह से काम नहीं करने के लिए जाना जाता है। मुझे लगता है मैं इस एक पर एक वर्ग को वापस आ रहा हूँ।
एस। पुन्नी

0

आप सामान्यीकृत अण्डाकार वितरण की जांच करना चाह सकते हैं , जो अन्य विशेषताओं के लिए लचीलेपन के साथ "शास्त्रीय" आकार के मैट्रिक्स की अनुमति देता है।


धन्यवाद! मैं इस लिंक की जाँच करना सुनिश्चित करूँगा। अब, अण्डाकार वितरण सममित नहीं हैं? तो कुर्तोसिस को नियंत्रित कर सकता है लेकिन तिरछा होना चाहिए 0 पर?
एस। पुन्की

यकीन है, लेकिन जीई अण्डाकार नहीं है। कुछ तिरछी अण्डाकार भिन्नताओं के लिए यहाँ भी जाँच करें: stat.tamu.edu/~genton/STAT689/TAMU2009SE.pdf
क्वार्ट्ज

0

मैं यह करने के लिए एक सरल विधि के साथ आया हूं जिसमें कोपल और अन्य जटिल डिजाइन शामिल नहीं हैं। मुझे डर है कि मेरे पास कोई औपचारिक संदर्भ नहीं है, हालांकि विधि अत्यधिक प्रभावी प्रतीत होती है।

विचार सरल है। 1. संयुक्त सामान्य वितरण से किसी भी संख्या में चर बनाएं। 2. प्रत्येक चर के लिए संभावनाओं को प्राप्त करने के लिए चर के univariate सामान्य CDF लागू करें। 3. अंत में किसी भी वितरण के व्युत्क्रम CDF को उस वितरण से ड्रा निकालने के लिए लागू करें।

मैं 2012 में इस पद्धति के साथ आया और स्टाटा का उपयोग करके प्रदर्शित किया । मैंने हाल ही में एक पोस्ट लिखी है जिसमें आर का उपयोग करके एक ही तरीका दिखाया गया है ।


(१) "स्पीयरमैन नॉर्मल डिस्ट्रीब्यूशन" क्या है? (२) सीडीएफ और "सामान्य सीडीएफ" के बीच आप क्या अंतर कर रहे हैं? (३) क्या आप बता सकते हैं कि यह विधि किसी भी सहसंबंध का परिचय कैसे देती है? मुझे डर है कि "चर" और "वितरण" के आपके सामान्य उपयोग आपके विवरण को अस्पष्ट बना देंगे, इसलिए यह बताना मुश्किल है कि यह वास्तव में क्या कर रहा है। क्या आप अधिक सटीक होने के लिए अपने उत्तर को फिर से तैयार कर सकते हैं?
whuber

आपके पोस्ट के लिए शुक्रिया! लिंक का अनुसरण करके कोई भी विधि के बारे में अधिक जानकारी देख सकता है। यह काफी कुछ नहीं करता है जो मैं प्राप्त करने की उम्मीद कर रहा था (यानी वितरण के उच्च-क्रम, उच्च-आयामी क्षणों पर नियंत्रण) लेकिन फिर भी बहुत मूल्यवान दृष्टिकोण।
एस। पुन्की

1
अप्रत्याशित रूप से, मैं एक नया तरीका नहीं देख पाया: कारियो, मार्ने सी। और बैरी एल। जेलसन। मनमाने सीमांत वितरण और सहसंबंध मैट्रिक्स के साथ यादृच्छिक वैक्टर की मॉडलिंग और उत्पादन। तकनीकी रिपोर्ट, औद्योगिक इंजीनियरिंग और प्रबंधन विज्ञान विभाग, नॉर्थवेस्टर्न यूनिवर्सिटी, इवान्स्टन, इलिनोइस, 1997. याहव, इनबाल और गैलिट श्मुइली। "प्रबंधन विज्ञान अनुप्रयोगों में बहुभिन्नरूपी पॉसों डेटा उत्पन्न करने पर।" रॉबर्ट एच। स्मिथ स्कूल रिसर्च पेपर नंबर आरएचएस (2009): 06-085।
फ्रांसिस स्मार्ट

यहां तक ​​कि अगर यह एक 'नई विधि' नहीं है, तो भी मैं अपने सवाल पर विचार करने और कुछ आनंददायक जोड़ने के लिए समय निकालने के लिए धन्यवाद देना चाहूंगा :)
एस। पुंके

0

मेरा मानना ​​है कि निम्नलिखित कागजात में प्रस्तुत विधि किसी भी (संभव) संयोजन के साथ यादृच्छिक बहुभिन्नरूपी उत्पन्न करने की अनुमति देती है, जिसका मतलब है, विचरण, तिरछापन और कुर्तोसिस।

  1. स्टैनफील्ड, पीएम, विल्सन, जेआर, और मिर्का, जीए 1996। जॉनसन डिस्ट्रीब्यूशन, 1996 विंटर सिमुलेशन सम्मेलन की कार्यवाही के साथ बहुभिन्नरूपी इनपुट मॉडलिंग , एड। चर्न्स, जेएम, मॉरिस, डीजे, ब्रूनर, डीटी, और स्वैन, जे जे, 1457-1464।
  2. स्टेनफील्ड, पीएम, विल्सन, जेआर, और किंग, आरई 2004। उत्पाद पुनः उपयोग सुविधाओं में आवेदन के साथ सहसंबंधित संचालन समय का लचीला मॉडलिंग, इंटरनेशनल जर्नल ऑफ प्रोडक्शन रिसर्च , वॉल्यूम 42, नंबर 11, 2179-2196।

डिस्क्लेमर: मैं लेखकों में से नहीं हूं ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.