मान लीजिए कि हमें फॉर्म के डेटा का एक सेट दिया गया है तथा । हमें भविष्यवाणी करने का काम दिया जाता है के मूल्यों पर आधारित है । हम दो अनुमानों का अनुमान लगाते हैं:
हम एक ऐसे प्रतिगमन का भी अनुमान लगाते हैं जो मूल्यों की भविष्यवाणी करता है के मूल्यों पर आधारित है , अर्थात्:
मान लीजिए अब हमें मान दिया गया है , तब हमारे पास भविष्यवाणी करने के दो अलग-अलग तरीके होंगे :
कौन सा सामान्य रूप से बेहतर होगा?
मैं अनुमान लगा रहा हूं कि पहला समीकरण बेहतर होगा क्योंकि यह डेटा बिंदुओं के दो रूपों से जानकारी का उपयोग करता है जबकि दूसरा समीकरण केवल डेटा बिंदुओं से जानकारी का उपयोग करता है जो पूर्वसूचक मान। आंकड़ों में मेरा प्रशिक्षण सीमित है और इस प्रकार मैं कुछ पेशेवर सलाह लेना चाहूंगा।
इसके अलावा, सामान्य तौर पर, डेटा के प्रति सबसे अच्छा दृष्टिकोण क्या है जिसमें अधूरी जानकारी है? दूसरे शब्दों में, हम उन आंकड़ों से सबसे अधिक जानकारी कैसे निकाल सकते हैं जिनमें सभी मूल्य नहीं हैं आयाम?