सभी पीएलएस घटक एक साथ मूल डेटा के विचरण का एक हिस्सा क्यों समझाते हैं?


10

मेरे पास एक डेटासेट है जिसमें 10 चर हैं। मैं इन 10 चर द्वारा एक प्रतिक्रिया प्रतिक्रिया चर की भविष्यवाणी करने के लिए आंशिक रूप से कम से कम वर्ग (PLS) भागा, 10 PLS घटक निकाले, और फिर प्रत्येक घटक के विचरण की गणना की। मूल डेटा पर मैंने सभी चर के वेरिएंट का योग लिया जो 702 है।

तब मैंने पीएलएस द्वारा समझाए गए विचरण के प्रतिशत को प्राप्त करने के लिए इस योग से प्रत्येक पीएलएस घटकों के विचरण को विभाजित किया, और आश्चर्यजनक रूप से सभी घटकों ने मिलकर मूल विचरण का केवल 44% समझाया।

इसका स्पष्टीकरण क्या है? क्या यह 100% नहीं होना चाहिए?


जैसा कि मैं प्रतिक्रिया पक्ष (वाई) पर जानता हूं कि पीएलएस घटकों की संख्या का निर्धारण क्या है अवलोकन की न्यूनतम संख्या है। मेरे पास 20 अवलोकन हैं। लेकिन दूसरी तरफ मैं सिर्फ 10 स्वतंत्र चर है जो मुझे 10 PLS तक सीमित करता है। मेरा प्रश्न यह है कि प्रत्येक घटक (पीएलएस या पीसीए) द्वारा स्पष्ट रूप से विचरण की गणना के लिए सामान्य सूत्र क्या है।
रास

mathworks.com/help/stats/plsregress.html इस उदाहरण में Y पक्ष पर सिर्फ एक चर है और 10 घटकों की गणना करें।
रीस

जवाबों:


12

सभी पीएलएस घटकों के भिन्न रूप का योग आम तौर पर 100% से कम होता है।

आंशिक कम वर्गों (पीएलएस) के कई संस्करण हैं। आपने यहां जो प्रयोग किया है, वह कई वैरिएबल पर एक univariate प्रतिक्रिया चर का PLS प्रतिगमन है ; इस एल्गोरिथ्म को पारंपरिक रूप से PLS1 के रूप में जाना जाता है (जैसा कि अन्य वेरिएंट के विपरीत है, रोसीपाल और क्रेमर, 2006, संक्षिप्त और संक्षिप्त अवलोकन के लिए आंशिक रूप से वर्गों में हाल के अग्रिमों को देखें )। PLS1 को बाद में SIMPLS नामक एक अधिक सुरुचिपूर्ण सूत्रीकरण के समतुल्य दिखाया गया (देखें रोशपाल और क्रेमर में देय जोंग 1988 के संदर्भ में)। SIMPLS द्वारा प्रदान किया गया दृश्य यह समझने में मदद करता है कि PLS1 में क्या चल रहा है।yX

यह पता चला है कि PLS1 क्या करता है, रेखीय अनुमानों के एक क्रम को खोजने के लिए , ऐसा है:ti=Xwi

  1. और बीच अधिकतम है;yti
  2. सभी वेट वैक्टर में यूनिट की लंबाई होती है, ;wi=1
  3. कोई भी दो PLS घटक (उर्फ स्कोर वैक्टर) और असंबद्ध हैं।titj

ध्यान दें कि वेट वैक्टर को ऑर्थोगोनल नहीं होना चाहिए (और नहीं)।

इसका मतलब यह है कि अगर में चर हैं और आपको PLS घटक मिले, तो आपको आधार वैक्टरों पर असंबद्ध अनुमानों के साथ एक गैर-ऑर्थोगोनल आधार मिला। कोई गणितीय रूप से यह साबित कर सकता है कि ऐसी स्थिति में इन सभी अनुमानों के भिन्नताओं का योग कम हो जाएगा तो का कुल । वे समान होंगे यदि वजन वैक्टर ऑर्थोगोनल (जैसे पीसीए में) थे, लेकिन पीएलएस में ऐसा नहीं है।Xk=1010X

मुझे इस मुद्दे पर स्पष्ट रूप से चर्चा करने वाली किसी भी पाठ्यपुस्तक या पेपर का पता नहीं है , लेकिन मैंने पहले इसे रेखीय विभेदक विश्लेषण (एलडीए) के संदर्भ में समझाया है, जो गैर-ऑर्थोगोनल वजन वाले वैक्टर पर कई असंबद्ध अनुमानों को जन्म देता है, यहां देखें : पीसीए और एलडीए में व्याख्या किए गए विचरण का अनुपात


धन्यवाद और हाँ जो समझ में आता है। मुझे नहीं पता था कि लोडिंग (वजन) वैक्टर ऑर्थोगोनल नहीं हैं। इस प्रकार यह एक्स के अधिकतम संस्करण पर कब्जा नहीं करता है। matlab उदाहरण के बाद, क्या आप मेरी मदद कर सकते हैं कि मैं गणितीय रूप से "PCTVAR" मान कैसे प्राप्त कर सकता हूं?
रस्स

मुझे यकीन नहीं है, लेकिन मैं इसके बारे में सोच सकता हूं। क्या पहला कॉलम PCTVAR(X में समझाया गया विचरण का प्रतिशत) आपकी गणनाओं से सहमत नहीं है? या आप दूसरे कॉलम (वाई में समझाया गया विचरण का प्रतिशत) के बारे में पूछ रहे हैं? सामान्य तौर पर, यदि आप पीएलएस गणित में जाना चाहते हैं, तो मेरा सुझाव है कि आप रोजपल और क्रेमर द्वारा पेपर पढ़ना शुरू करें और लिंक का पालन करें।
अमीबा
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.