एक लाख, पीसीए संस्करण की कल्पना


31

क्या प्रिंसिपल कंपोनेंट एनालिसिस के आउटपुट की कल्पना करना संभव है जो सिर्फ सारांश सारणियों की तुलना में अधिक अंतर्दृष्टि देते हैं? क्या यह करना संभव है जब टिप्पणियों की संख्या बड़ी हो, ~ 1e4 कहें? और क्या यह संभव है कि आर [अन्य वातावरण में आपका स्वागत है]?


2
कुछ प्रश्न: आपके पास कितने घटक हैं? नमूना आकार के अलावा, क्या ऐसा कुछ है जो इस पीसीए आउटपुट के प्रदर्शन को अन्य निरंतर चर के प्रदर्शन से अलग होने की आवश्यकता है जो किसी के साथ व्यवहार कर सकता है? क्या आप विभिन्न समूहों के स्कोर के विपरीत प्रयास कर रहे हैं, और यदि ऐसा है तो कितने? आम तौर पर, आप अपने प्रदर्शन के साथ क्या हासिल करने की उम्मीद कर रहे हैं?
रोलांडो

जवाबों:


53

Biplot पीसीए के परिणामों दृश्यमान करने के लिए एक उपयोगी उपकरण है। यह आपको मुख्य घटक स्कोर और दिशाओं की एक साथ कल्पना करने की अनुमति देता है। 10,000 टिप्पणियों के साथ आप संभवतः ओवर-प्लॉटिंग की समस्या में भाग लेंगे। अल्फा सम्मिश्रण वहाँ मदद कर सकता है।

यहाँ UCI ML रिपॉजिटरी से वाइन डेटा का एक पीसी बाइप्लॉट है :

यूसीआई एमएल रिपोजिटरी से वाइन डेटा का पीसी बिप्लॉट

अंक प्रत्येक अवलोकन के पीसी 1 और पीसी 2 स्कोर के अनुरूप हैं। तीर PC1 और PC2 के साथ चर के सहसंबंध का प्रतिनिधित्व करते हैं। सफेद वृत्त तीरों की सैद्धांतिक अधिकतम सीमा को इंगित करता है। डेटा में 3 वाइन किस्मों में से प्रत्येक के लिए अंडाकार 68% डेटा दीर्घवृत्त हैं।

मैंने इस प्लॉट को यहां उपलब्ध कराने के लिए कोड बनाया है


5
वास्तव में डायनामाइट जोड़।
rolando2

1

p×2VVVT

V

4

एक वेचर प्लॉट आपको अपने पीसीए के आइगेनवेल्यूज की कल्पना करने में मदद कर सकता है। यह अनिवार्य रूप से मार्चेंको-पाश्चर वितरण के खिलाफ eigenvalues ​​की एक क्यूक्यू साजिश है। मेरे पास यहां एक उदाहरण है: वचेर प्लॉट एक एकल प्रमुख स्वदेशी दिखा रहा हैएक प्रमुख स्वदेशी है जो मार्चेंको-पाश्चर वितरण के बाहर है। इस तरह की साजिश की उपयोगिता आपके आवेदन पर निर्भर करती है।


7
यहां अधिक जानना संभव होगा (शायद कुछ अतिरिक्त अन्वेषण और / या कुछ उपयोगी लिंक)। Marchenko-Pastur वितरण क्या है? यह पीसीए से कैसे संबंधित है? यदि यह धारण करता है या नहीं करता है तो आपके परिणामों के लिए इसका क्या अर्थ है? (आदि)
गुंग - को पुनः स्थापित मोनिका

0

तुम भी मनोवैज्ञानिक पैकेज का उपयोग कर सकते हैं।

इसमें एक प्लॉट.फैक्टर विधि शामिल है, जो स्कैप्लॉट मैट्रिक्स की शैली में एक दूसरे के खिलाफ विभिन्न घटकों को प्लॉट करेगी।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.