आप अपने मूल 99 (100-1) चर का एक उपसमूह नहीं चुनते हैं।
प्रत्येक प्रमुख घटक सभी 99 भविष्यवाणियों चर (x- चर, IVs, ...) के रैखिक संयोजन हैं। यदि आप पहले 40 प्रमुख घटकों का उपयोग करते हैं, तो उनमें से प्रत्येक 99 मूल भविष्यवक्ता-चर का एक कार्य है। (कम से कम साधारण पीसीए के साथ - ज़ार, हस्ती और टिब्शिरानी के एसपीसीए जैसे विरल / नियमित संस्करण हैं जो कम चर के आधार पर घटकों का उत्पादन करेंगे।)
दो सकारात्मक सहसंबद्ध चर के सरल मामले पर विचार करें, जो सादगी के लिए हम मान लेंगे समान रूप से चर रहे हैं। फिर पहला मुख्य घटक दोनों अंशों के योग का एक (भिन्नात्मक) गुणक होगा और दूसरा दो चर के अंतर का (भिन्नात्मक) गुणक होगा; अगर दोनों समान रूप से परिवर्तनीय नहीं हैं, तो पहला प्रमुख घटक अधिक-चर को एक और अधिक वजन देगा, लेकिन इसमें अभी भी दोनों शामिल होंगे।
तो आप अपने 99 एक्स-चर के साथ शुरू करते हैं, जिसमें से आप प्रत्येक मूल चर पर संबंधित भार को लागू करके अपने 40 प्रमुख घटकों की गणना करते हैं। [मेरी चर्चा में एनबी मुझे लगता हैy और यह एक्सपहले से ही केंद्रित हैं।]
आप तब अपने 40 नए चर का उपयोग करते हैं जैसे कि वे अपने आप में भविष्यवक्ता थे, जैसे कि आप किसी भी एकाधिक प्रतिगमन समस्या के साथ करेंगे। (व्यवहार में, अनुमान लगाने के अधिक कुशल तरीके हैं, लेकिन आइए कम्प्यूटेशनल पहलुओं को एक तरफ छोड़ दें और बस एक मूल विचार से निपटें)
आपके दूसरे प्रश्न के संबंध में, यह स्पष्ट नहीं है कि "पीसीए को उलटने" से आपका क्या मतलब है।
आपके पीसी मूल चर के रैखिक संयोजन हैं। मान लीजिए कि आपके मूल संस्करण अंदर हैंX, और आप गणना करते हैं Z=XW (कहाँ पे X है n×99 तथा W है 99×40 मैट्रिक्स जिसमें प्रमुख घटक भार होता है 40 घटक जो आप उपयोग कर रहे हैं), फिर आप अनुमान लगाते हैं y^=Zβ^PC प्रतिगमन के माध्यम से।
फिर आप लिख सकते हैं y^=Zβ^PC=XWβ^PC=Xβ^∗ कहो (कहाँ) β^∗=Wβ^PCजाहिर है), इसलिए आप इसे मूल भविष्यवक्ताओं के कार्य के रूप में लिख सकते हैं; मुझे नहीं पता कि आपके what उलटने ’का क्या मतलब है, लेकिन यह मूल संबंध को देखने का एक सार्थक तरीका हैy तथा X। यह मूल गुणांक के पाठ्यक्रम पर एक प्रतिगमन का अनुमान लगाकर प्राप्त होने वाले गुणांक के समान नहीं है - इसे पीसीए करके नियमित किया जाता है; भले ही आप अपने मूल एक्स के प्रत्येक के लिए गुणांक प्राप्त करेंगे, लेकिन उनके पास केवल आपके द्वारा फिट किए गए घटकों की संख्या का df है।
मुख्य घटक प्रतिगमन पर विकिपीडिया भी देखें ।