मैं क्रूसके के डूइंग बायेसियन डेटा विश्लेषण में उदाहरणों के माध्यम से काम कर रहा हूं , विशेष रूप से ची में पोइसन घातीय एनोवा। 22, जिसे वह आकस्मिक टेबल के लिए स्वतंत्रता के लगातार ची-स्क्वायर परीक्षणों के विकल्प के रूप में प्रस्तुत करता है।
मैं देख सकता हूं कि कैसे हम उन इंटरैक्शन के बारे में जानकारी प्राप्त करते हैं जो वैरिएबल स्वतंत्र होने पर (यानी जब एचडीआई शून्य को बाहर करता है) से अधिक या कम बार होने की उम्मीद की जाती है।
मेरा सवाल यह है कि मैं इस ढांचे में एक प्रभाव आकार की गणना या व्याख्या कैसे कर सकता हूं ? उदाहरण के लिए, क्रुस्चके लिखते हैं "काले बालों के साथ नीली आंखों का संयोजन कम बार होता है अगर आंखों का रंग और बालों का रंग स्वतंत्र था", लेकिन हम उस एसोसिएशन की ताकत का वर्णन कैसे कर सकते हैं? मैं कैसे बता सकता हूं कि कौन सी बातचीत दूसरों की तुलना में अधिक चरम हैं? अगर हमने इन आंकड़ों का ची-वर्ग परीक्षण किया तो हम समग्र प्रभाव के माप के रूप में Cramér के V की गणना कर सकते हैं। मैं इस बायेसियन संदर्भ में प्रभाव का आकार कैसे व्यक्त करूं?
यहाँ पुस्तक (कोडित R
) से स्व-निहित उदाहरण है , बस इस मामले में उत्तर मुझे स्पष्ट दृष्टि से छिपा हुआ है ...
df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15,
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond",
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))
df
Blue Brown Green Hazel
Black 20 68 5 15
Blond 94 7 16 10
Brunette 84 119 29 54
Red 17 26 14 14
प्रभाव आकार के उपायों (पुस्तक में नहीं) के साथ यहां लगातार उत्पादन होता है:
vcd::assocstats(df)
X^2 df P(> X^2)
Likelihood Ratio 146.44 9 0
Pearson 138.29 9 0
Phi-Coefficient : 0.483
Contingency Coeff.: 0.435
Cramer's V : 0.279
एचडीआई और सेल संभाव्यता (पुस्तक से सीधे) के साथ यहां बायसियन आउटपुट है:
# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
"http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R",
"http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")
# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))
# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))
और यहां डेटा पर लागू पॉइसन घातीय मॉडल के पीछे के भूखंड हैं:
और अनुमानित सेल संभावनाओं पर पश्च वितरण के भूखंड: