आंशिक कम से कम वर्गों के प्रतिगमन (PLSR) या आंशिक रूप से कम से कम वर्गों के संरचनात्मक समीकरण मॉडलिंग (PLS-SEM) में, "आंशिक" शब्द किसको संदर्भित करता है?
आंशिक कम से कम वर्गों के प्रतिगमन (PLSR) या आंशिक रूप से कम से कम वर्गों के संरचनात्मक समीकरण मॉडलिंग (PLS-SEM) में, "आंशिक" शब्द किसको संदर्भित करता है?
जवाबों:
मैं इस सवाल का जवाब देना चाहूंगा, काफी हद तक ऐतिहासिक परिप्रेक्ष्य पर आधारित है , जो काफी दिलचस्प है। हरमन वोल्ड, जिन्होंने आंशिक रूप से कम से कम वर्ग (PLS) दृष्टिकोण का आविष्कार किया , ने अभी PLS (या यहां तक कि आंशिक शब्द का उल्लेख नहीं ) शब्द का उपयोग शुरू नहीं किया है। के दौरान प्रारंभिक अवधि (1966-1969), वह के रूप में इस दृष्टिकोण के लिए भेजा NILES इस विषय पर अवधि और उसके प्रारंभिक पेपर के शीर्षक का संक्षिप्त नाम - Iterative कम से कम वर्गों प्रक्रिया द्वारा गैर रेखीय आकलन , 1966 में प्रकाशित।
जैसा कि हम देख सकते हैं, प्रक्रियाओं को बाद में आंशिक कहा जाएगा, इसे पुनरावृत्त के रूप में संदर्भित किया गया है, जो वजन और अव्यक्त चर (LVs) का आकलन करने की प्रक्रिया की पुनरावृत्ति प्रकृति पर ध्यान केंद्रित कर रहा है। "कम से कम वर्ग" शब्द एक मॉडल के अन्य अज्ञात मापदंडों (Wold, 1980) का अनुमान लगाने के लिए सामान्य न्यूनतम वर्ग (OLS) प्रतिगमन का उपयोग करने से आता है । ऐसा लगता है कि शब्द "आंशिक" की जड़ें NILES प्रक्रियाओं में हैं, जिसने "एक मॉडल के मापदंडों को उप-भागों में विभाजित करने के विचार को लागू किया है ताकि उन्हें भागों में अनुमान लगाया जा सके" (सांचेज़, 2013, पृष्ठ 216; जोर मेरा) ।
PLS शब्द का पहला प्रयोग पेपर नॉनलेयर पुनरावृत्त आंशिक कम से कम वर्गों (NIPALS) अनुमान प्रक्रियाओं में हुआ है , जो प्रकाशन PLS इतिहास की अगली अवधि - NIPALS मॉडलिंग अवधि। 1970 और 1980 का दशक नरम मॉडलिंग का दौर बन जाता है , जब, कार्ल जोर्सकॉग के SEM के दृष्टिकोण से प्रभावित होकर, वोल्ड ने NIPALS के दृष्टिकोण को नरम मॉडलिंग में बदल दिया, जिसने मूल रूप से आधुनिक PLS दृष्टिकोण (मूल शब्द PLS 1970 के अंत में मुख्यधारा बन गया) )। 1990 के दशक, पीएलएस इतिहास में अगली अवधि, जिसे सांचेज (2013) "अंतराल" अवधि कहता है, बड़े पैमाने पर इसके उपयोग को कम करके चिह्नित किया गया है। सौभाग्य से, 2000 के दशक ( समेकन की अवधि) से शुरू), पीएलएस ने एसईएम विश्लेषण के लिए एक बहुत लोकप्रिय दृष्टिकोण के रूप में अपनी वापसी का आनंद लिया, खासकर सामाजिक विज्ञान में।
अद्यतन (अमीबा की टिप्पणी के जवाब में):
अद्यतन 2 (आगे स्पष्टीकरण):
अमीबा के जवाब में व्यक्त की गई चिंताओं के जवाब में, मैं कुछ चीजों को स्पष्ट करना चाहूंगा। मुझे ऐसा लगता है कि हमें NIPALS और PLS के बीच "आंशिक" शब्द के उपयोग को अलग करने की आवश्यकता है। यह 1 के बारे में दो अलग-अलग प्रश्न बनाता है) NIPALS में "आंशिक" का अर्थ और 2) PLS में "आंशिक" का अर्थ (यह Phil2014 द्वारा मूल प्रश्न है)। जबकि मुझे पूर्व के बारे में निश्चित नहीं है, मैं बाद के बारे में और स्पष्टीकरण दे सकता हूं।
वोल्ड के अनुसार, सोजस्ट्रॉम और एरिकसन (2001),
PLS में "आंशिक" इंगित करता है कि यह एक आंशिक प्रतिगमन है, क्योंकि ...
दूसरे शब्दों में, "आंशिक" इस तथ्य से उपजा है कि PLS के लिए NIPALS एल्गोरिथ्म द्वारा डेटा अपघटन में सभी घटक शामिल नहीं हो सकते हैं , इसलिए "आंशिक"। मुझे संदेह है कि यही कारण सामान्य रूप से NIPALS पर लागू होता है, यदि "आंशिक" डेटा पर एल्गोरिथ्म का उपयोग करना संभव है। यह NIPALS में "P" की व्याख्या करेगा।
NIPALS परिभाषा में "nonlinear" शब्द का उपयोग करने के संदर्भ में ( nonlinear PLS के साथ भ्रमित न करें , जो PLS दृष्टिकोण के nonlinear संस्करण का प्रतिनिधित्व करता है!), मुझे लगता है कि यह स्वयं एल्गोरिथ्म को नहीं , बल्कि nonlinear मॉडल को संदर्भित करता है , जो हो सकता है रेखीय प्रतिगमन-आधारित NIPALS का उपयोग करके विश्लेषण किया गया।
अद्यतन 3 (हरमन वॉल्ड की व्याख्या):
जबकि हरमन वोल्ड का 1969 का पेपर NIPALS पर सबसे शुरुआती पेपर लगता है, मैं इस विषय पर सबसे शुरुआती पेपरों में से एक खोजने में कामयाब रहा। वह वोल्ड (1974) का एक पेपर है, जहां PLS के "पिता" ने NIPALS की परिभाषा में "आंशिक" शब्द का उपयोग करने के लिए अपना तर्क प्रस्तुत किया है (पृष्ठ 71)।
3.1.4। NIPALS का अनुमान: Iterative OLS। यदि मॉडल के एक या अधिक चर अव्यक्त हैं, तो भविष्यवक्ता संबंध में न केवल अज्ञात पैरामीटर, बल्कि अज्ञात चर भी शामिल हैं, जिसके परिणामस्वरूप अनुमान समस्या nonlinear हो जाती है। जैसा कि 3.1 (iii) में इंगित किया गया है, NIPALS एक पुनरावृत्ति प्रक्रिया द्वारा इस समस्या को हल करते हैं, चरण s = 1, 2 के साथ कहते हैं, ... प्रत्येक चरण s में मॉडल की प्रत्येक पूर्वसूचक संबंध के लिए OLS प्रतिगमन की एक सीमित संख्या शामिल है। प्रत्येक ऐसा प्रतिगमन अज्ञात मापदंडों और अव्यक्त चर (इसलिए नाम आंशिक कम से कम वर्ग) के एक उप-सेट के लिए प्रॉक्सी अनुमान देता है , और ये प्रॉक्सी अनुमान नए प्रॉक्सी अनुमानों की गणना करने के लिए प्रक्रिया के अगले चरण में उपयोग किए जाते हैं।
संदर्भ
रोजपाल, आर। (2011)। Nonlinear आंशिक कम से कम वर्ग: एक सिंहावलोकन। लोधी एच। और यमनिशी वाई। (ईडीएस) में, रसायन विज्ञान और उन्नत मशीन लर्निंग परिप्रेक्ष्य: जटिल कम्प्यूटेशनल तरीके और सहयोगात्मक तकनीक , पीपी। 169-189। एसीसीएम, आईजीआई ग्लोबल। Http://aiolos.um.savba.sk/~roman/Papers/npls_book.pdf से लिया गया
सांचेज, जी (2013)। आर। बर्कले, CA: Trowchez संस्करणों के साथ PLS पथ मॉडलिंग । Http://gastonsanchez.com/PLS_Path_Modeling_with_R.pdf से लिया गया
वॉल्ड, एच। (1974)। अव्यक्त चर के साथ बहती है: NIPALS मॉडलिंग के प्रकाश में तरीकों का विभाजन। यूरोपीय आर्थिक समीक्षा, 5 , 67-86। उत्तर हॉलैंड प्रकाशन।
वॉल्ड, एच। (1980)। सैद्धांतिक ज्ञान होने पर मॉडल निर्माण और मूल्यांकन दुर्लभ है: सिद्धांत और आंशिक रूप से कम से कम वर्ग। जे। कंमेंटा और जेबी राम्सी (ईडीएस) में, अर्थमेटिक मॉडल का मूल्यांकन , पी। 47-74। न्यूयॉर्क: अकादमिक प्रेस। Http://www.nber.org/chapters/c11693 से लिया गया
वॉल्ड, एस।, सोजोस्ट्रम, एम।, और एरिकसन, एल। (2001)। पीएलएस-रिग्रेशन: केमोमेट्रिक्स का एक मूल उपकरण। केमोमेट्रिक्स और इंटेलिजेंट लेबोरेटरी सिस्टम, 58 , 109-130। doi: 10.1016 / S0169-7439 (01) 00155-1 http://www.libpls.net/publication/PLS_basic_2001.pdf से लिया गया
हालांकि, ऐतिहासिक रूप से, जैसा कि @Aleksandr अच्छी तरह से बताता है (+1), PLS को वोल्ड द्वारा पेश किया गया था जिन्होंने इसे लागू करने के लिए अपने NIPALS एल्गोरिथम का उपयोग किया था; NIPALS का अर्थ है "नॉनलाइनियर iterated आंशिक कम से कम वर्ग", इसलिए जाहिर है P में PLS सिर्फ NIPALS से मिला है।
(उन्होंने इसे "नॉनलाइनर" क्यों कहा, यह मुझे अभी भी समझ में नहीं आया है।)
यह शब्द उल्लेखनीय रूप से भ्रामक है, क्योंकि यदि यह "आंशिक" है, तो प्रत्येक अपेक्षा-अधिकतमकरण एल्गोरिथ्म "आंशिक" भी है (वास्तव में, एनआईपीवालों को ईएम के एक आदिम रूप के रूप में देखा जा सकता है, रोविस 1998 देखें )। मुझे लगता है कि PLS मशीन लर्निंग प्रतियोगिता में सबसे अधिक भ्रामक शब्द के लिए एक अच्छा उम्मीदवार है। काश, वोल्ड जूनियर के प्रयासों के बावजूद इसे बदलने की संभावना नहीं होती (ऊपर @ मोमो की टिप्पणी देखें)।