मुझे पता है कि पीसीए उद्देश्य आयामीता को कम करना है
ऐसा अक्सर लोग मानते हैं, लेकिन वास्तव में पीसीए एक ऑर्थोगोनल आधार पर आपके डेटा का एक प्रतिनिधित्व है। यह आधार अभी भी आपके मूल डेटा के समान ही है। कुछ भी नहीं खोया ... अभी तक। आयामी कमी का हिस्सा पूरी तरह से आप पर निर्भर है। पीसीए यह सुनिश्चित करता है कि आपके नए प्रक्षेपण के शीर्ष आयाम सबसे अच्छे आयाम हैं, जिन्हें संभवतः आपके डेटा के रूप में दर्शाया जा सकता है। सबसे अच्छा मतलब क्या है? यहीं समझाया गया विचरण अंदर आता है।क क
जाहिर है इस मामले में नहीं
मुझे उस पर यकीन नहीं होगा! आपके दूसरे प्लॉट से, दृष्टिगत रूप से ऐसा लगता है कि आपके डेटा की बहुत सारी जानकारी क्षैतिज रेखा पर प्रक्षेपित की जा सकती है। यह मूल आयाम के बजाय 1 आयाम है, जो 2 आयामों में था! स्पष्ट रूप से आप कुछ जानकारी खो देते हैं क्योंकि आप Y- अक्ष निकाल रहे हैं, लेकिन क्या यह जानकारी हानि आपको स्वीकार्य है, क्या आपका कॉल है।
वहाँ तो मैं उन्हें बाहर की जाँच करने के लिए प्रोत्साहित करते हैं क्या पीसीए साइट पर है से संबंधित प्रश्नों की एक टन कर रहे हैं यहाँ , यहाँ , यहाँ या यहाँ । यदि आपके पास इसके बाद अन्य प्रश्न हैं, तो कृपया उन्हें पोस्ट करें और मुझे मदद करने में खुशी होगी।
आपके वास्तविक प्रश्न के रूप में:
क्या कहानी है जो आप पीसीए प्लॉट में तापमान बनाम आइसक्रीम के बारे में बता सकते हैं?
चूंकि नए निर्देशांक कुल्हाड़ियों मूल निर्देशांक का एक रैखिक संयोजन है, तो ... मूल रूप से कुछ भी नहीं! PCA आपको एक उत्तर देगा जैसे (संख्याएँ बनी):
पी सी १पी सी 2= 2.5 × आइसक्रीम - 3.6 × तापमान= - 1.5 × आइसक्रीम + 0.6 × तापमान
क्या यह आपके लिए उपयोगी है? शायद। लेकिन मुझे नहीं लगता :)
संपादित
मैं इस संसाधन को जोड़ूंगा जो मुझे लगता है कि सहायक है क्योंकि इंटरैक्टिव चार्ट शांत हैं।
फिर से एडिट किया गया
यह स्पष्ट करने के लिए कि सबसे अच्छा का क्या अर्थ है:क
पीसीए उन आयामों को खोजने की कोशिश करता है जो डेटा पर अनुमान लगाए जाने पर सबसे अधिक विचरण करते हैं। मान लें कि आपके डेटा में आयाम हैं, तो पहले PC आपके डेटा में किसी भी अन्य आयाम की तुलना में अधिक विचरण को समझा सकता है। यही कारण है कि मैं सबसे अच्छा मतलब है । आपके लिए यह उपयोगी है या नहीं, यह दूसरी बात है।n > केकक क