की अंतर्निहित मॉडल PLS है कि किसी दिए गए मैट्रिक्स एक्स और एन वेक्टर y से संबंधित हैं एक्स = टी पी ' + ई , y = टी क्यू ' + च , जहां टी एक अव्यक्त है n × कश्मीर मैट्रिक्स, और ई , f शोर की शर्तें हैं (sssuming X , y केंद्रित हैं)।
PLS के अनुमान का उत्पादन , और एक 'शॉर्टकट' प्रतिगमन गुणांकों के वेक्टर, बीटा ऐसी है कि y ~ एक्स β । मैं का वितरण प्राप्त करना चाहते हैं β कुछ सरल बनाने मान्यताओं, जो शायद निम्नलिखित को शामिल करना चाहिए के तहत:
- मॉडल सही है, यानी अज्ञात के लिए टी , पी , क्यू ,
- अव्यक्त कारकों की संख्या, , ज्ञात है, और PLS एल्गोरिथ्म में उपयोग की जाती है;
- वास्तविक त्रुटि शब्द ज्ञात भिन्नताओं के साथ सामान्य शून्य मतलब शून्य हैं;
यह प्रश्न कुछ हद तक अपरिभाषित है क्योंकि 'पीएलएस एल्गोरिथ्म' के वेरिएंट के स्कोर हैं, लेकिन मैं उनमें से किसी के लिए परिणाम स्वीकार करूंगा। मैं भी कैसे के वितरण का अनुमान लगाने के संबंध में मार्गदर्शन को स्वीकार करेंगे β के माध्यम से जैसे एक बूटस्ट्रैप, लेकिन शायद कि एक अलग सवाल है।