मैंने prcomp()
आर में एक पीसीए (प्रमुख घटक विश्लेषण) करने के लिए फ़ंक्शन का उपयोग किया । हालांकि, उस फ़ंक्शन में एक बग है जैसे कि na.action
पैरामीटर काम नहीं करता है। मैंने स्टैकओवरफ्लो पर मदद मांगी ; वहाँ दो उपयोगकर्ताओं ने NA
मूल्यों से निपटने के दो अलग-अलग तरीकों की पेशकश की । हालांकि, दोनों समाधानों के साथ समस्या यह है कि जब कोई NA
मूल्य होता है, तो उस पंक्ति को गिरा दिया जाता है और पीसीए विश्लेषण में नहीं माना जाता है। मेरा वास्तविक डेटा सेट 100 x 100 का एक मैट्रिक्स है और मैं केवल एक पूरी पंक्ति खोना नहीं चाहता क्योंकि इसमें एक एकल NA
मान शामिल है।
निम्न उदाहरण से पता चलता है कि prcomp()
फ़ंक्शन पंक्ति 5 के लिए कोई मुख्य घटक वापस नहीं करता है क्योंकि इसमें एक NA
मान होता है ।
d <- data.frame(V1 = sample(1:100, 10), V2 = sample(1:100, 10),
V3 = sample(1:100, 10))
result <- prcomp(d, center = TRUE, scale = TRUE, na.action = na.omit)
result$x # $
d$V1[5] <- NA # $
result <- prcomp(~V1+V2, data=d, center = TRUE, scale = TRUE, na.action = na.omit)
result$x
अगर मैं सेट कर सकते हैं मैं सोच रहा था NA
एक विशिष्ट संख्यात्मक मूल्य के मूल्यों जब center
और scale
की तैयारी में हैं TRUE
ताकि prcomp()
समारोह काम करता है और युक्त पंक्तियों को दूर नहीं करता NA
है, लेकिन यह भी पीसीए विश्लेषण के परिणाम को प्रभावित नहीं करता।
मैंने NA
एक एकल स्तंभ में माध्य मान के साथ या 0. के करीब मान के साथ मानों को बदलने के बारे में सोचा । हालांकि, मुझे यकीन नहीं है कि यह पीसीए विश्लेषण को कैसे प्रभावित करता है।
क्या कोई भी उस समस्या को हल करने का एक अच्छा तरीका सोच सकता है?
NA
मूल्यों का क्या मतलब है : "लापता" का कारण क्या है?