ऊर्ध्वाधर दूरी क्यों?


11

ओएलएस अनुमान में क्षैतिज दूरी के बजाय बिंदुओं के ऊर्ध्वाधर विचलन को लाइन में क्यों शामिल किया जाता है?


1
पुराना सवाल है, लेकिन मुझे लगता है कि डेटा को संभाव्यता वितरण के नमूने के रूप में देखना जो कि x द्वारा पैरामाट्राइज़ किया गया है, उपयोगी है
बेंडी

जवाबों:


12

ओएलएस ( साधारण न्यूनतम वर्ग ) मानता है कि क्षैतिज दूरियों द्वारा दर्शाए गए मान या तो प्रयोग करने वाले द्वारा पूर्वनिर्धारित होते हैं या उच्च सटीकता (ऊर्ध्वाधर दूरी के सापेक्ष) के साथ मापा जाता है। जब क्षैतिज दूरी में अनिश्चितता का सवाल होता है, तो आपको ओएलएस का उपयोग नहीं करना चाहिए, लेकिन इसके बजाय त्रुटियों-में-चर मॉडल या, संभवतः, प्रमुख घटक विश्लेषण पर ध्यान देना चाहिए


"ऑर्थोगोनल रिग्रेशन" एक और चीज है जिसका सामना तब हो सकता है जब दूषित फोड़े-फुंसियों और ऑर्डिनेट से निपटने के तरीकों की तलाश की जाती है।
JM एक सांख्यिकीविद नहीं है

+1 यह अभी तक केवल आंकड़ों में एक आला है; प्रायोगिक भौतिकी में अधिक जटिल न्यूनतम वर्ग विधियाँ (न केवल एक्स परिवर्तनशीलता को जोड़ना, बल्कि त्रुटि सन्निकटन के आधार पर अंकों के लिए अलग-अलग दंड); ROOT फ्रेमवर्क में दर्जनों ऐसे हैं।

1

दिलचस्प सवाल। मेरा उत्तर यह होगा कि जब हम एक ओएलएस मॉडल फिट कर रहे हैं, तो हम स्पष्ट रूप से और मुख्य रूप से हाथ पर निर्भर चर की भविष्यवाणी / व्याख्या करने की कोशिश कर रहे हैं - "वाई बनाम एक्स" में "वाई"। इस प्रकार, हमारी मुख्य चिंता परिणाम के संबंध में हमारी फिट लाइन से वास्तविक टिप्पणियों तक की दूरी को कम करना होगा, जिसका अर्थ है कि ऊर्ध्वाधर दूरी को कम करना। यह पाठ्यक्रम अवशिष्ट को परिभाषित करता है।

इसके अलावा, कम से कम वर्गों के फार्मूले अधिकांश अन्य प्रतिस्पर्धी तरीकों की तुलना में प्राप्त करना आसान है, शायद यही वजह है कि यह पहले आसपास आया था। : पी

ऊपर 'वाउबर' के दृष्टिकोण के रूप में, अन्य दृष्टिकोण हैं जो एक्स-वाई का इलाज करते हैं, जब एक सबसे फिट लाइन फिट करते समय बराबर जोर दिया जाता है। ऐसा एक दृष्टिकोण जो मुझे पता है कि "प्रिंसिपल लाइन्स" या "प्रिंसिपल कर्व्स" रिग्रेशन है, जो पॉइंट्स और लाइन के बीच ऑर्थोगोनल डिस्टेंस को कम करता है (वर्टिकल एरर लाइन्स के बजाय जो आपके पास फिटेड लाइन के लिए 90 डिग्री पर है) । मैं आपके पढ़ने के लिए नीचे एक संदर्भ पोस्ट करता हूं। यह लंबा है, लेकिन बहुत ही सुलभ और ज्ञानवर्धक है।

आशा है कि इस मदद करता है, ब्रेंडन

  1. ट्रेवर हस्ती। प्रिंसिपल कर्व्स एंड सर्फेस , पीएचडी थीसिस, स्टैनफोर्ड यूनिवर्सिटी; 1984

1

यह संभवतः डिज़ाइन किए गए प्रयोगों से भी संबंधित है - यदि एक्स एक नियंत्रित मात्रा है जो प्रयोगात्मक डिजाइन का हिस्सा है, तो इसे नियतात्मक के रूप में माना जाता है; whilst y परिणाम है, और एक यादृच्छिक मात्रा है। x एक निरंतर मात्रा हो सकती है (उदाहरण के लिए कुछ दवा की सघनता), लेकिन 0/1 विभाजन हो सकता है (2 नमूना t- परीक्षण के लिए अग्रणी यह ​​मानते हुए कि गॉसियन है)। यदि x एक निरंतर मात्रा है, तो कुछ माप त्रुटि हो सकती है, लेकिन आमतौर पर यदि यह y की परिवर्तनशीलता की तुलना में बहुत छोटा है तो इसे अनदेखा कर दिया जाता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.