मैंने इसे कुछ साल पहले एक बार खरोंच से क्रमादेशित किया है, और मेरे पास अपने कंप्यूटर पर टुकड़ा-वार रैखिक प्रतिगमन करने के लिए एक मैटलैब फ़ाइल है। लगभग 20 माप बिंदु या तो के लिए लगभग 1 से 4 ब्रेकप्वाइंट कम्प्यूटेशनल रूप से संभव है। 5 या 7 ब्रेक पॉइंट वास्तव में बहुत अधिक होने लगते हैं।
जैसा कि मैं देख रहा हूं कि शुद्ध गणितीय दृष्टिकोण यह है कि आपके प्रश्न के नीचे टिप्पणी में जुड़े प्रश्न में उपयोगकर्ता mbq द्वारा सुझाए गए सभी संभावित संयोजनों का प्रयास करें।
चूंकि फिट लाइनें लगातार और आसन्न हैं (कोई ओवरलैप नहीं), कॉम्बिनेटरिक्स पास्कल त्रिकोण का पालन करेंगे। अगर लाइन सेगमेंट के उपयोग किए गए डेटा पॉइंट्स के बीच ओवरलैप्स थे, तो मेरा मानना है कि कॉम्बिनेटरिक्स स्टर्लिंग के नंबर का दूसरी तरह से अनुसरण करेंगे।
मेरे दिमाग में सबसे अच्छा समाधान फिट लाइनों का संयोजन चुनना है जिसमें फिट लाइनों के आर ^ 2 सहसंबंध मूल्यों का सबसे कम मानक विचलन है। मैं एक उदाहरण के साथ समझाने की कोशिश करूंगा। ध्यान रखें कि यह पूछना कि डेटा में कितने विराम बिंदुओं को खोजना चाहिए, यह सवाल पूछने के समान है "ब्रिटेन का तट कब तक है?" फ्रैक्चर के बारे में बेनोइट मैंडेलब्रोट्स (एक गणितज्ञ) पत्रों में से एक के रूप में। और ब्रेक प्वाइंट की संख्या और प्रतिगमन गहराई के बीच एक व्यापार बंद है।
अब उदाहरण के लिए।
yएक्सएक्सy
x12345678910111213141516171819202122232425262728y123456789109876543212345678910R2line11,0001,0001,0001,0001,0001,0001,0001,0001,0001,0000,97090,89510,77340,61340,43210,25580,11390,027200,00940,02220,02780,02390,01360,00320,00040,01180,04R2line20,04000,01180,00040,00310,01350,02380,02770,02220,0093−1,9780,02710,11390,25580,43210,61340,77330,89510,97081,0001,0001,0001,0001,0001,0001,0001,0001,0001,000sumofR2values1,04001,01181,00041,00311,01351,02381,02771,02221,00931,0000,99801,00901,02921,04551,04551,02911,00900,99801,0001,00941,02221,02781,02391,01361,00321,00041,01181,04standarddeviationofR20,67880,69870,70670,70480,69740,69020,68740,69130,70040,70710,66730,55230,36590,12810,12820,36590,55230,66720,70710,70040,69140,68740,69020,69740,70480,70680,69870,6788
इन y मानों का ग्राफ है:
जिसमें स्पष्ट रूप से दो ब्रेक प्वाइंट हैं। तर्क के लिए हम R ^ 2 सहसंबंध मानों की गणना करेंगे (एक्सेल सेल फ़ार्मुलों (यूरोपीय डॉट-कॉमा शैली) के साथ):
=INDEX(LINEST(B1:$B$1;A1:$A$1;TRUE;TRUE);3;1)
=INDEX(LINEST(B1:$B$28;A1:$A$28;TRUE;TRUE);3;1)
दो फिट लाइनों के सभी गैर-अतिव्यापी संयोजनों के लिए । R ^ 2 मानों के सभी संभावित जोड़े में ग्राफ है:
सवाल यह है कि आर ^ 2 मूल्यों की कौन सी जोड़ी है, जिसे हमें चुनना चाहिए, और शीर्षक में पूछे गए अंकों के अनुसार हम कितने ब्रेक पॉइंट का सामान्यीकरण करते हैं? एक विकल्प उस संयोजन को चुनना है जिसके लिए आर-स्क्वायर सहसंबंध का योग सबसे अधिक है। यह प्लॉट करने से हमें नीचे का ऊपरी नीला वक्र मिलता है:
1,0455
टुकड़ा वार रैखिक प्रतिगमन - मतलाब - कई विराम बिंदु