दो सामान्य रूप से वितरित चर, या एक के व्युत्क्रम के अनुपात को कैसे मापें?


12

समस्या: मैं एक बेयर्सियन मेटा-विश्लेषण में एक पुजारी और डेटा के रूप में उपयोग के लिए वितरण को पैरामीटर कर रहा हूं। डेटा को सारांश आंकड़ों के रूप में साहित्य में प्रदान किया जाता है, लगभग विशेष रूप से सामान्य रूप से वितरित होने के लिए माना जाता है (हालांकि कोई भी चर <0 नहीं हो सकता है, कुछ अनुपात हैं, कुछ बड़े पैमाने पर हैं, और आदि)।

मैं दो मामलों को लेकर आया हूं जिनके लिए मेरे पास कोई समाधान नहीं है। कभी-कभी ब्याज का पैरामीटर डेटा का व्युत्क्रम या दो चर का अनुपात होता है।

उदाहरण:

  1. दो सामान्य रूप से वितरित चर का अनुपात:
    • डेटा: माध्य और sd प्रतिशत नाइट्रोजन और प्रतिशत कार्बन के लिए
    • पैरामीटर: कार्बन का नाइट्रोजन से अनुपात।
  2. आम तौर पर वितरित चर का व्युत्क्रम:
    • डेटा: द्रव्यमान / क्षेत्र
    • पैरामीटर: क्षेत्र / द्रव्यमान

मेरा वर्तमान दृष्टिकोण सिमुलेशन का उपयोग करना है:

उदाहरण के लिए प्रतिशत कार्बन और नाइट्रोजन डेटा के एक सेट के लिए जैसे: xbar.n, c, variance: se.n, c और नमूना आकार: nn, nc:

set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N

मैं ratio.cn = perc.c / perc.n को पैरामीटर करना चाहता हूं

# parameter of interest
ratio.cn <- perc.c / perc.n

तब सीमा के साथ सबसे अच्छा फिट वितरण चुनें मेरी पूर्व के लिए0

library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
    dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}

प्रश्न: क्या यह एक वैध दृष्टिकोण है? क्या अन्य / बेहतर दृष्टिकोण हैं?

अग्रिम में धन्यवाद!

अद्यतन: Cauchy वितरण, जिसे साथ दो मानदंडों के अनुपात के रूप में परिभाषित किया गया है , सीमित उपयोगिता है क्योंकि मैं विचरण का अनुमान लगाना चाहूंगा। शायद मैं एक कॉची से n ड्रॉ के सिमुलेशन के विचरण की गणना कर सकता हूं?μ=0

मैं निम्नलिखित पूर्ण-सूत्र अनुमानों मिला, लेकिन मैं यह देखने के लिए अगर वे एक ही परिणाम ... दे परीक्षण नहीं किया Hayya एट अल, 1975 μ y : एक्स = μ y / m यू एक्स + σ 2 एक्स * μ y / μ 3 एक्स + वी ( एक्स , वाई ) * σ 2 एक्स * σ 2 y / μ 2 एक्स

μ^y:x=μy/mux+σx2μy/μx3+cov(x,y)σx2σy2/μx2
σ^y:x2=σx2×μy/mux4+σy2/mux22cov(x,y)σx2σy2/mux3

हेय्या, जे। और आर्मस्ट्रांग, डी। और ग्रेसिस, एन।, 1975। दो सामान्य रूप से वितरित चर के अनुपात पर एक नोट। प्रबंधन विज्ञान 21: 1338--1341


क्या मुझे काउच से एक अलग प्रश्न के रूप में यादृच्छिक ड्रॉ पर विचरण की गणना के बारे में अपडेट प्रश्न पोस्ट करना चाहिए?
डेविड लेबॉयर

david - चूँकि आपके वैरिएबल सभी सकारात्मक हैं, इसलिए आप साथ उपद्रव क्यों करना चाहते हैं ? btw - अपने सिमुलेशन में, आप प्रति चर और per.n उत्पन्न कर रहे हैं कि स्वतंत्र हैं। क्या यह सही है - और यदि ऐसा है, तो क्या आप चाहते हैं? μ=0
रोनाफ

नहीं, मैं = 0 के साथ उपद्रव नहीं करना चाहता ; इन चर को आम तौर पर स्वतंत्र माना जाता है, और कोवरियन डेटा शायद ही कभी उपलब्ध हो। चूंकि सी काफी स्थिर है, स्वतंत्रता एक उचित धारणा है। μ
डेविड लेबर

XYZ=XYxyp(x,y)dxdy

जवाबों:


6

आप अनुपात वितरण पर विकिपीडिया लेख के तहत कुछ संदर्भों को देखना चाह सकते हैं । यह संभव है कि आप उपयोग करने के लिए बेहतर सन्निकटन या वितरण पाएंगे। अन्यथा, आपका दृष्टिकोण ध्वनि लगता है।

अद्यतन मुझे लगता है कि एक बेहतर संदर्भ हो सकता है:

पृष्ठ 195 पर सूत्र 2-4 देखें।

अपडेट २

कॉची से विचरण के संबंध में आपके अद्यतन प्रश्न पर - जैसा कि जॉन कुक ने टिप्पणियों में बताया है, विचरण मौजूद नहीं है। तो, एक नमूना विचरण लेने से बस "अनुमानक" के रूप में काम नहीं होगा। वास्तव में, आप पाएंगे कि आपका नमूना रूपांतर बिल्कुल भी परिवर्तित नहीं होता है और आप नमूने लेते रहते हैं।


संदर्भ के लिए धन्यवाद, यही वह जगह है जहां मुझे 1975 का संदर्भ और मेरे प्रश्न में समीकरण मिला, हालांकि मैं आश्वस्त हूं कि समीकरण मेरी समस्या के लिए उपयुक्त हैं।
डेविड लेबॉयर

हाया पर एक नज़र डालते हुए, ऐसा लगता है कि वे अनुपात के लिए एक सामान्य सन्निकटन प्राप्त करने से संबंधित हैं और यह निर्धारित करने के लिए सिमुलेशन का उपयोग करते हैं कि कब लागू होता है (भिन्नता के गुणांक, cv का उपयोग करके)। क्या आपके मामले में cv मापदंड को पूरा करता है? यदि हां, तो अनुमान लागू होते हैं।
आर्स

1
@ डेविड: उत्तर में अद्यतन के बजाय मार्साग्लिया 1965 का उपयोग करें।
ars

एनबी: मार्साग्लिया ने 2004 में जेएसएस में एक अपडेट प्रकाशित किया ।
डेविड लेबॉयर

XYZ=XYxyp(x,y)dxdy

0

y-1~एन(,)

काऊची का उपयोग करने के लिए नीचे मेरा सुझाव ars और जॉन द्वारा टिप्पणी के रूप में काम नहीं करता है।

दो सामान्य रूप से यादृच्छिक चर का अनुपात कॉची वितरण का अनुसरण करता है । आप इस विचार का उपयोग कॉची के मापदंडों की पहचान करने के लिए कर सकते हैं जो आपके पास मौजूद डेटा के सबसे अधिक निकट हैं।


ए। मुझे विचरण का अनुमान लगाने की आवश्यकता है और कॉची वितरण के विचरण को परिभाषित नहीं किया गया है।
डेविड लेबॉयर

ख। यदि मैं आपका दूसरा बिंदु समझता हूं, तो, मैं मान सकता हूं कि y-1 ~ एन (म्यू, सिग्मा), लेकिन मुझे अभी भी y के लिए दिए गए सारांश आंकड़ों से म्यू और सिग्मा की गणना करने की आवश्यकता है; यह भी, मैंने मूल्यों के साथ वितरण पर विचार नहीं करने के लिए चुना है <0 केवल परिभाषित चर के लिए 0> (भले ही कई मामलों में p (X <0 | X ~ N (mu, s)) -> 0)
David LeBauer

शून्य साधन के लिए काची लागू नहीं होता है?
ars

@ आप सही हैं। कॉची तो सीमित उपयोग की हो सकती है।

Ars: हाँ, मेरा मानना ​​है कि कॉची परिणाम के लिए शून्य साधनों की आवश्यकता होती है। लेकिन फिर भी इसका मतलब यह है कि कम से कम उस विशेष मामले में, डेविड जो परिवर्तन का अनुमान लगाने की कोशिश कर रहा है, वह उदाहरण नहीं है।
जॉन डी। कुक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.