जब तराजू का निर्माण करते हैं, तो सादा राशि से अधिक " कारक स्कोर " का उपयोग करने के बारे में सुझाव प्राप्त करना चाहते हैं। एक कारक स्कोरिंग के "गैर-परिष्कृत" तरीकों पर Ie "परिष्कृत"। DiStefano एट अल से। (2009, pdf ), जोर जोड़ा गया:
कारक स्कोर गणना विधियों के दो मुख्य वर्ग हैं: परिष्कृत और गैर-परिष्कृत। कारक वितरण पर व्यक्तियों के प्लेसमेंट के बारे में जानकारी प्रदान करने के लिए गैर-परिष्कृत तरीके अपेक्षाकृत सरल, संचयी प्रक्रियाएं हैं। सादगी खुद को कुछ आकर्षक विशेषताओं के लिए उधार देती है, अर्थात गैर-परिष्कृत तरीके दोनों की गणना करना आसान है और व्याख्या करना आसान है। परिष्कृत गणना पद्धतियां अधिक परिष्कृत और तकनीकी दृष्टिकोणों का उपयोग करके कारक स्कोर बनाती हैं। वे गैर-परिष्कृत तरीकों की तुलना में अधिक सटीक और जटिल हैं और उन अनुमानों को प्रदान करते हैं जो मानकीकृत स्कोर हैं।
मेरे दिमाग में, यदि लक्ष्य एक ऐसा पैमाना बनाना है जिसका उपयोग अध्ययन और सेटिंग्स में किया जा सकता है, तो सभी स्केल वस्तुओं का एक साधारण योग या औसत स्कोर समझ में आता है। लेकिन मान लें कि लक्ष्य एक कार्यक्रम के उपचार प्रभावों का मूल्यांकन करना है और महत्वपूर्ण विपरीत नमूना-उपचार बनाम नियंत्रण समूह के भीतर है। क्या कोई कारण है कि हम कारक स्कोर को रकम या औसत पसंद कर सकते हैं?
विकल्पों के बारे में ठोस होने के लिए, यह सरल उदाहरण लें:
library(lavaan)
library(devtools)
# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1 3 4 3 4 3 3 4 4 3
# 2 2 1 2 2 4 3 2 1 3
# 3 1 3 4 4 4 2 1 2 2
# 4 1 2 1 2 1 2 1 3 2
# 5 3 3 4 4 1 1 2 4 1
# 6 2 2 2 2 2 2 1 1 1
# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf
# non-refined -----------------------------------------------------------------
mydata$sumScore <- rowSums(mydata[, 1:9])
mydata$avgScore <- rowSums(mydata[, 1:9])/9
hist(mydata$avgScore)
# refined ---------------------------------------------------------------------
model <- '
tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
'
fit <- sem(model, data = mydata, meanstructure = TRUE,
missing = "pairwise", estimator = "WLSMV")
factorScore <- predict(fit)
hist(factorScore[,1])
They are more exact
इस अतिरिक्त जोर ने हमें इस तथ्य से विचलित नहीं करना चाहिए कि यहां तक कि कारक स्कोर अनिवार्य रूप से अक्षम हैं ("अंडरडर्मेड")।
"more exact"
। रेखीय रूप से गणना किए गए कारक स्कोर के बीच प्रतिगमन विधि इस अर्थ में "सटीक" है "अज्ञात सच्चे कारक मूल्यों के साथ सबसे अधिक सहसंबद्ध"। तो हां, अधिक सटीक (रैखिक बीजगणितीय दृष्टिकोण के भीतर), लेकिन पूरी तरह से सटीक नहीं।