मैंने prcomp()आर में एक पीसीए (प्रमुख घटक विश्लेषण) करने के लिए फ़ंक्शन का उपयोग किया । हालांकि, उस फ़ंक्शन में एक बग है जैसे कि na.actionपैरामीटर काम नहीं करता है। मैंने स्टैकओवरफ्लो पर मदद मांगी ; वहाँ दो उपयोगकर्ताओं ने NAमूल्यों से निपटने के दो अलग-अलग तरीकों की पेशकश की । हालांकि, दोनों समाधानों के साथ समस्या यह है कि जब कोई NAमूल्य होता है, तो उस पंक्ति को गिरा दिया जाता है और पीसीए विश्लेषण में नहीं माना जाता है। मेरा वास्तविक डेटा सेट 100 x 100 का एक मैट्रिक्स है और मैं केवल एक पूरी पंक्ति खोना नहीं चाहता क्योंकि इसमें एक एकल NAमान शामिल है।
निम्न उदाहरण से पता चलता है कि prcomp()फ़ंक्शन पंक्ति 5 के लिए कोई मुख्य घटक वापस नहीं करता है क्योंकि इसमें एक NAमान होता है ।
d <- data.frame(V1 = sample(1:100, 10), V2 = sample(1:100, 10),
V3 = sample(1:100, 10))
result <- prcomp(d, center = TRUE, scale = TRUE, na.action = na.omit)
result$x # $
d$V1[5] <- NA # $
result <- prcomp(~V1+V2, data=d, center = TRUE, scale = TRUE, na.action = na.omit)
result$x
अगर मैं सेट कर सकते हैं मैं सोच रहा था NAएक विशिष्ट संख्यात्मक मूल्य के मूल्यों जब centerऔर scaleकी तैयारी में हैं TRUEताकि prcomp()समारोह काम करता है और युक्त पंक्तियों को दूर नहीं करता NAहै, लेकिन यह भी पीसीए विश्लेषण के परिणाम को प्रभावित नहीं करता।
मैंने NAएक एकल स्तंभ में माध्य मान के साथ या 0. के करीब मान के साथ मानों को बदलने के बारे में सोचा । हालांकि, मुझे यकीन नहीं है कि यह पीसीए विश्लेषण को कैसे प्रभावित करता है।
क्या कोई भी उस समस्या को हल करने का एक अच्छा तरीका सोच सकता है?
NAमूल्यों का क्या मतलब है : "लापता" का कारण क्या है?