कर्टोसिस को प्रभावित किए बिना तिरछा बदलने के लिए एक परिवर्तन?


11

अगर कोई परिवर्तन है जो कर्टोसिस को प्रभावित किए बिना एक यादृच्छिक चर के तिरछा को बदल देता है, तो मैं उत्सुक हूं। यह इस बात के अनुरूप होगा कि आरवी का एक एफाइन रूपांतर माध्य और विचरण को प्रभावित करता है, लेकिन तिरछा और कुर्तोसिस नहीं (आंशिक रूप से क्योंकि तिरछा और कुर्तोसिस पैमाने में परिवर्तन के लिए अपरिवर्तनीय माना जाता है)। क्या यह एक ज्ञात समस्या है?


क्या आपको आवश्यकता है कि मानक विचलन इस परिवर्तन के साथ भी स्थिर रहे?
रुसैलपिएरेसे

नहीं, मुझे उम्मीद है कि यह नहीं होगा, लेकिन अतिरिक्त कुर्तोसिस तय होना चाहिए। मैं उम्मीद करूंगा कि परिवर्तन एकरस होगा, और अधिमानतः नियतात्मक होगा।
shabbychef

1
Yikes - उस व्यक्ति के प्रति शोक जो एक गैर-नियतात्मक कार्य को साबित करना चाहता है, वह है मोनोटोनिक।
russellpierce

जवाबों:


6

मेरा जवाब कुल हैक की शुरुआत है, लेकिन आप जो भी पूछते हैं उसे करने के लिए मुझे किसी भी स्थापित तरीके के बारे में पता नहीं है।

मेरा पहला कदम यह होगा कि आप अपने डेटासेट को क्रमबद्ध करें। आप अपने डेटासेट में आनुपातिक स्थिति पा सकते हैं और फिर इसे एक सामान्य वितरण में बदल सकते हैं, इस विधि का उपयोग रेनॉल्ड्स एंड हेविट, 1996 में किया गया था। PROCMiracle में नीचे नमूना आर कोड देखें।

एक बार जब वितरण सामान्य हो जाता है, तो समस्या को उसके सिर पर बदल दिया गया है - कर्टोसिस को समायोजित करने का मामला लेकिन तिरछा नहीं। एक Google खोज ने सुझाव दिया कि कोई भी जॉन और ड्रेपर की प्रक्रियाओं का पालन कर सकता है, 1980 में कर्टोसिस को समायोजित करने के लिए, लेकिन तिरछा नहीं - लेकिन मैं उस परिणाम को दोहरा नहीं सका।

इनपुट (सामान्यीकृत) मान लेने वाले एक क्रूड स्प्रेडिंग / संकुचन फ़ंक्शन को विकसित करने के मेरे प्रयासों से सामान्य मान पर चर की स्थिति के आनुपातिक रूप से एक मूल्य को जोड़ता या घटाता है, जिसके परिणामस्वरूप एक मोनोटोनिक समायोजन होता है, लेकिन व्यवहार में पैदा होता है एक द्विपाद वितरण हालांकि वांछित तिरछापन और कुर्तोसिस मान है।

मुझे लगता है कि यह एक पूर्ण उत्तर नहीं है, लेकिन मुझे लगा कि यह सही दिशा में एक कदम प्रदान कर सकता है।

PROCMiracle <- function(datasource,normalrank="BLOM")
  {
     switch(normalrank,
      "BLOM" = {
                  rmod <- -3/8
                  nmod <- 1/4
                },
      "TUKEY" = {
                  rmod <- -1/3
                  nmod <- 1/3
                },
      "VW" ={
                  rmod <- 0
                  nmod <- 1
            },
      "NONE" = {
                  rmod <- 0
                  nmod <- 0
                }
    )
    print("This may be doing something strange with NA values!  Beware!")
    return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod))))
  }

मैं कुछ इस तरह से कर रहा था: रैंक, फिर एक निश्चित कर्टोसिस और तिरछा पाने के लिए जी-एंड-एच परिवर्तन का उपयोग करें। हालाँकि, यह तकनीक मानती है कि मैं वास्तव में जनसंख्या कर्टोसिस को जानता हूं, जिसका मैं अनुमान लगा सकता हूं, लेकिन मुझे दिलचस्पी है, दार्शनिक रूप से, अगर कोई परिवर्तन है जो मेरे बिना
कुर्तोसिस

@ शब्बीशेफ: ओह, ठीक है, फिर कुछ नया नहीं जोड़ने के लिए खेद है। हालाँकि, आपने कुछ नया जोड़ा है, मैंने पहले जी-एंड-एच फार्मूले के बारे में नहीं सुना था। क्या आपके पास एक स्वतंत्र रूप से सुलभ उद्धरण है जो इसे प्रदान करता है? मैं इसके साथ एक पेपर पर लड़खड़ा गया ( fic.wharton.upenn.edu/fic/papers/02/0225.pdf ) लेकिन धारणा मेरे लिए थोड़ी विदेशी है (विशेष रूप से यह है कि e ^ Z ^ g या कुछ और )? मैंने इसे इस तरह आज़माया ... लेकिन परिणाम अजीब लगे ... a + b * (e ^ g ^ z-1) * (exp ((h * z ^ 2) / 2) / g)।
रसेलपिएरेसे

1
@drnexus: मैं अपनी तकनीक का उल्लेख करके परिणामों को पूर्वाग्रह नहीं करना चाहता था। मैंने हेन्स एट से जी-और-एच और जी-एंड-के वितरण के बारे में सीखा। अल, dx.doi.org/10.1016/S0378-3758(97)00050-5 , और फिशर एंड क्लेन, econstor.eu/bitstream/10419/29578/1/614055873/pdf
shabbychef

1

एक और संभावित दिलचस्प तकनीक दिमाग में आ गई है, हालांकि यह सवाल का जवाब नहीं देता है, एक नमूना को एक निश्चित नमूना एल-तिरछा और नमूना एल-कर्टोसिस (साथ ही एक निश्चित मतलब और एल-स्केल) के लिए बदलना है। ये चार अवरोध क्रम के आँकड़ों में रैखिक होते हैं। अवलोकनों के नमूने पर रूपांतरित मोनोटोनिक रखने के लिए फिर दूसरे समीकरणों की आवश्यकता होगी । इसके बाद इसे द्विघात अनुकूलन समस्या के रूप में पेश किया जा सकता है: कम से कम करेंn - 1 2nn12दिए गए अवरोधों के अधीन नमूना आदेश आँकड़ों और रूपांतरित संस्करण के बीच का मानदंड। यह एक प्रकार का निराला दृष्टिकोण है, यद्यपि। मूल प्रश्न में, मैं कुछ अधिक बुनियादी और मौलिक खोज रहा था। मैं भी एक ऐसी तकनीक की तलाश कर रहा था, जिसे अलग-अलग अवलोकनों पर लागू किया जा सके, जो कि नमूनों के पूरे समूह के स्वतंत्र हो।


0

मैं डेटा-ट्रांसफ़ॉर्मेशन का उपयोग करने के बजाय लेप्टोक्यूरिक वितरण का उपयोग करके इस डेटा सेट को मॉडल करूंगा। मुझे जोन्स और पेवेसी (2009), बायोमेट्रिक से साइन-आर्किसिंह वितरण पसंद है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.