आकस्मिक तालिकाओं के बायेसियन विश्लेषण: प्रभाव आकार का वर्णन कैसे करें


9

मैं क्रूसके के डूइंग बायेसियन डेटा विश्लेषण में उदाहरणों के माध्यम से काम कर रहा हूं , विशेष रूप से ची में पोइसन घातीय एनोवा। 22, जिसे वह आकस्मिक टेबल के लिए स्वतंत्रता के लगातार ची-स्क्वायर परीक्षणों के विकल्प के रूप में प्रस्तुत करता है।

मैं देख सकता हूं कि कैसे हम उन इंटरैक्शन के बारे में जानकारी प्राप्त करते हैं जो वैरिएबल स्वतंत्र होने पर (यानी जब एचडीआई शून्य को बाहर करता है) से अधिक या कम बार होने की उम्मीद की जाती है।

मेरा सवाल यह है कि मैं इस ढांचे में एक प्रभाव आकार की गणना या व्याख्या कैसे कर सकता हूं ? उदाहरण के लिए, क्रुस्चके लिखते हैं "काले बालों के साथ नीली आंखों का संयोजन कम बार होता है अगर आंखों का रंग और बालों का रंग स्वतंत्र था", लेकिन हम उस एसोसिएशन की ताकत का वर्णन कैसे कर सकते हैं? मैं कैसे बता सकता हूं कि कौन सी बातचीत दूसरों की तुलना में अधिक चरम हैं? अगर हमने इन आंकड़ों का ची-वर्ग परीक्षण किया तो हम समग्र प्रभाव के माप के रूप में Cramér के V की गणना कर सकते हैं। मैं इस बायेसियन संदर्भ में प्रभाव का आकार कैसे व्यक्त करूं?

यहाँ पुस्तक (कोडित R) से स्व-निहित उदाहरण है , बस इस मामले में उत्तर मुझे स्पष्ट दृष्टि से छिपा हुआ है ...

df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15, 
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond", 
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))

df

         Blue Brown Green Hazel
Black      20    68     5    15
Blond      94     7    16    10
Brunette   84   119    29    54
Red        17    26    14    14

प्रभाव आकार के उपायों (पुस्तक में नहीं) के साथ यहां लगातार उत्पादन होता है:

vcd::assocstats(df)
                    X^2 df P(> X^2)
Likelihood Ratio 146.44  9        0
Pearson          138.29  9        0

Phi-Coefficient   : 0.483 
Contingency Coeff.: 0.435 
Cramer's V        : 0.279

एचडीआई और सेल संभाव्यता (पुस्तक से सीधे) के साथ यहां बायसियन आउटपुट है:

# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R", 
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")

# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))

# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))

और यहां डेटा पर लागू पॉइसन घातीय मॉडल के पीछे के भूखंड हैं:

यहाँ छवि विवरण दर्ज करें

और अनुमानित सेल संभावनाओं पर पश्च वितरण के भूखंड:

यहाँ छवि विवरण दर्ज करें

जवाबों:


1

सूचकांक के अनुसार, क्रूसके केवल दो बार प्रभाव आकार का उल्लेख करते हैं, और दोनों बार मीट्रिक पूर्वानुमानित चर के ते संदर्भ में हैं। लेकिन पी पर यह थोड़ा है। 601:

यदि शोधकर्ता स्वतंत्रता के उल्लंघन में रुचि रखता है, तो ब्याज के परिमाण पर है । इस उद्देश्य के लिए मॉडल विशेष रूप से सुविधाजनक है, क्योंकि गैर-विहीनता उत्पन्न हो रही है यह निर्धारित करने के लिए मनमाने ढंग से परस्पर विरोधी विरोधाभासों की जांच की जा सकती है।βrc

इसलिए, मैं उस को इकट्ठा करता हूं जो व्याख्या करने का पैरामीटर है। चलो और सभी गुणांकों के उत्पादों को उनसे संबंधित एक्स तत्वों, को छोड़कर के कुल योग के बराबर और । चूँकि और । जब = 1, तब बढ़ता है या सिकुड़ता है कारक से , नहीं?β1,2Sβ1,2x1,2yiPois(λi)λi=eβ1,2x1,2+S=eβ1,2x1,2eSx1,2λieβ1,2


1

एनोवा मॉडल में प्रभाव के आकार का अध्ययन करने का एक तरीका "सुपर जनसंख्या" और "परिमित जनसंख्या" मानक विचलन को देखकर है। आपके पास दो तरह की तालिका है, इसलिए यह 3 विचरण घटक (2 मुख्य प्रभाव और 1 इंटरैक्शन) है। यह mcmc विश्लेषण पर आधारित है। आप प्रत्येक mcmc नमूने के लिए प्रत्येक प्रभाव के लिए मानक विचलन की गणना करते हैं।

sk=1dk1j=1dk(βk,jβ¯k)2

जहाँ , एनोवा तालिका की "पंक्ति" को अनुक्रमित करता है। बनाम के mcmc नमूनों के सरल बॉक्सप्लॉट प्रभाव आकारों पर काफी शिक्षाप्रद हैं।kskk

एंड्रयू जेलमैन ने इस दृष्टिकोण की वकालत की। उनके 2005 के पत्र "विचरण का विश्लेषण देखें: यह पहले से कहीं अधिक महत्वपूर्ण क्यों है"


वह कागज यहाँ उपलब्ध है
शॉन ईस्टर

ये दोनों जवाब बहुत ही आशाजनक लगते हैं, धन्यवाद। क्या आप में से कोई परिचित है जो Rयह बता सके कि यह कैसे प्रोग्राम किया जा सकता है?
बेन

@ सीनियन - लिंक जोड़ने के लिए धन्यवाद। @, ये गणना R में सरल हैं। हालांकि, मुझे यकीन नहीं है कि आपके नमूने किस रूप में हैं। आपको sd ()"लागू" कार्यों में से एक के साथ संयुक्त उपयोग करने में सक्षम होना चाहिए । बॉक्सप्लॉट्स के लिए, ये मूल के साथ प्राप्त करने के लिए सरल हैं boxplot ()
संभाव्यताविषयक

धन्यवाद, क्या आप मेरे प्रश्न में उदाहरण डेटा और कोड का उपयोग करके प्रदर्शित कर सकते हैं?
बेन

संक्षेप में, नहीं क्योंकि मैंने आपके द्वारा पोस्ट किए गए कोड को नहीं समझा है - मैं यह नहीं देख सकता कि डेटा कैसे व्यवस्थित है। और जैसा कि मैंने कहा, यह अपने आप को करने के लिए एक कठिन विश्लेषण नहीं है। यह दृष्टिकोण एक सरल उपाय (मानक विचलन) की गणना कर रहा है। इसके अतिरिक्त, आर कोडिंग आपके प्रश्न का हिस्सा नहीं है - आपने आकस्मिक टेबल विश्लेषण को संक्षेप में कैसे किया जाए, इसके बारे में पूछा।
संभाव्यताविषयक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.