लगभग सब कुछ मैं रेखीय प्रतीपगमन और GLM के बारे में पढ़ने के लिए इस पर निर्भर: जहां च ( एक्स , β ) एक गैर-बढ़ती या गैर कम करने के समारोह एक्स और β पैरामीटर आप अनुमान और परीक्षण है के बारे में परिकल्पना। लिंक कार्यों की और के परिवर्तनों दर्जनों रहे हैं y और एक्स बनाने के लिए y रैखिक कार्य च ( एक्स , β ) ।
अब, अगर आप के लिए गैर बढ़ती / गैर-घटते आवश्यकता को दूर कार्य करता है और बहुआयामी पद trig:, मैं एक पैरामीट्रिक linearized मॉडल फिटिंग के लिए केवल दो विकल्प के बारे में पता। दोनों प्रत्येक अनुमानित y और X के पूरे सेट के बीच कृत्रिम निर्भरता पैदा करते हैं , जिससे वे एक बहुत ही गैर-मजबूत फिट बन जाते हैं जब तक कि यह मानने के पूर्व कारण न हों कि आपका डेटा वास्तव में एक चक्रीय या बहुपद प्रक्रिया द्वारा उत्पन्न होता है।
यह किसी प्रकार का गूढ़ किनारा मामला नहीं है। यह पानी और फसल की पैदावार के बीच वास्तविक, सामान्य ज्ञान का संबंध है (एक बार भूखंड पानी के नीचे काफी गहरे हो जाने पर, फसल की पैदावार कम होने लगेगी), या नाश्ते पर खपत कैलोरी के बीच और गणित प्रश्नोत्तरी में प्रदर्शन, या एक कारखाने में श्रमिकों की संख्या। और उनके द्वारा उत्पादित विगेट्स की संख्या ... संक्षेप में, लगभग किसी भी वास्तविक जीवन का मामला जिसके लिए रैखिक मॉडल का उपयोग किया जाता है, लेकिन एक विस्तृत पर्याप्त सीमा को कवर करने वाले डेटा के साथ जो आप नकारात्मक रिटर्न में पिछले कम रिटर्न देते हैं।
मैंने ave अवतल ’, x उत्तल’,, वक्रता ’, 'नॉन-मोनोटोनिक’, terms बाथटब ’जैसे शब्दों की तलाश की और मैं भूल गया कि कितने अन्य हैं। कुछ प्रासंगिक प्रश्न और उससे भी कम उपयोगी उत्तर। तो, व्यावहारिक रूप से, यदि आपके पास निम्न डेटा (R कोड, y निरंतर चर x और असतत चर समूह का एक कार्य है):
updown<-data.frame(y=c(46.98,38.39,44.21,46.28,41.67,41.8,44.8,45.22,43.89,45.71,46.09,45.46,40.54,44.94,42.3,43.01,45.17,44.94,36.27,43.07,41.85,40.5,41.14,43.45,33.52,30.39,27.92,19.67,43.64,43.39,42.07,41.66,43.25,42.79,44.11,40.27,40.35,44.34,40.31,49.88,46.49,43.93,50.87,45.2,43.04,42.18,44.97,44.69,44.58,33.72,44.76,41.55,34.46,32.89,20.24,22,17.34,20.14,20.36,24.39,22.05,24.21,26.11,28.48,29.09,31.98,32.97,31.32,40.44,33.82,34.46,42.7,43.03,41.07,41.02,42.85,44.5,44.15,52.58,47.72,44.1,21.49,19.39,26.59,29.38,25.64,28.06,29.23,31.15,34.81,34.25,36,42.91,38.58,42.65,45.33,47.34,50.48,49.2,55.67,54.65,58.04,59.54,65.81,61.43,67.48,69.5,69.72,67.95,67.25,66.56,70.69,70.15,71.08,67.6,71.07,72.73,72.73,81.24,73.37,72.67,74.96,76.34,73.65,76.44,72.09,67.62,70.24,69.85,63.68,64.14,52.91,57.11,48.54,56.29,47.54,19.53,20.92,22.76,29.34,21.34,26.77,29.72,34.36,34.8,33.63,37.56,42.01,40.77,44.74,40.72,46.43,46.26,46.42,51.55,49.78,52.12,60.3,58.17,57,65.81,72.92,72.94,71.56,66.63,68.3,72.44,75.09,73.97,68.34,73.07,74.25,74.12,75.6,73.66,72.63,73.86,76.26,74.59,74.42,74.2,65,64.72,66.98,64.27,59.77,56.36,57.24,48.72,53.09,46.53),
x=c(216.37,226.13,237.03,255.17,270.86,287.45,300.52,314.44,325.61,341.12,354.88,365.68,379.77,393.5,410.02,420.88,436.31,450.84,466.95,477,491.89,509.27,521.86,531.53,548.11,563.43,575.43,590.34,213.33,228.99,240.07,250.4,269.75,283.33,294.67,310.44,325.36,340.48,355.66,370.43,377.58,394.32,413.22,428.23,436.41,455.58,465.63,475.51,493.44,505.4,521.42,536.82,550.57,563.17,575.2,592.27,86.15,91.09,97.83,103.39,107.37,114.78,119.9,124.39,131.63,134.49,142.83,147.26,152.2,160.9,163.75,172.29,173.62,179.3,184.82,191.46,197.53,201.89,204.71,214.12,215.06,88.34,109.18,122.12,133.19,148.02,158.72,172.93,189.23,204.04,219.36,229.58,247.49,258.23,273.3,292.69,300.47,314.36,325.65,345.21,356.19,367.29,389.87,397.74,411.46,423.04,444.23,452.41,465.43,484.51,497.33,507.98,522.96,537.37,553.79,566.08,581.91,595.84,610.7,624.04,637.53,649.98,663.43,681.67,698.1,709.79,718.33,734.81,751.93,761.37,775.12,790.15,803.39,818.64,833.71,847.81,88.09,105.72,123.35,132.19,151.87,161.5,177.34,186.92,201.35,216.09,230.12,245.47,255.85,273.45,285.91,303.99,315.98,325.48,343.01,360.05,373.17,381.7,398.41,412.66,423.66,443.67,450.39,468.86,483.93,499.91,511.59,529.34,541.35,550.28,568.31,584.7,592.33,615.74,622.45,639.1,651.41,668.08,679.75,692.94,708.83,720.98,734.42,747.83,762.27,778.74,790.97,806.99,820.03,831.55,844.23),
group=factor(rep(c('A','B'),c(81,110))));
plot(y~x,updown,subset=x<500,col=group);
आप पहले एक बॉक्स-कॉक्स परिवर्तन की कोशिश कर सकते हैं और देख सकते हैं कि क्या यह यंत्रवत समझ में आता है, और यह असफल होने पर, आप एक लॉजिस्टिक या एसिम्प्टोटिक लिंक फ़ंक्शन के साथ एक नॉनलाइनियर कम से कम वर्ग मॉडल फिट कर सकते हैं।
तो, आपको पैरामीट्रिक मॉडल को पूरी तरह से क्यों छोड़ देना चाहिए और एक ब्लैक-बॉक्स पद्धति पर वापस आना चाहिए जैसे स्प्लिन जब आपको पता चलता है कि पूरा डेटासेट इस तरह दिखता है ...
plot(y~x,updown,col=group);
मेरे प्रश्न हैं:
- कार्यात्मक संबंधों के इस वर्ग का प्रतिनिधित्व करने वाले लिंक फ़ंक्शंस खोजने के लिए मुझे किन शर्तों की खोज करनी चाहिए?
या
- कार्यात्मक संबंधों के इस वर्ग के लिए लिंक फ़ंक्शंस को डिज़ाइन करने या मौजूदा लोगों को विस्तारित करने के लिए मुझे क्या पढ़ना और / या खोजना चाहिए जो वर्तमान में केवल मोनोटोनिक प्रतिक्रियाओं के लिए हैं?
या
- बिल्ली, यहां तक कि StackExchange टैग इस प्रकार के प्रश्न के लिए सबसे उपयुक्त है!
R
कोड में सिंटैक्स त्रुटियां हैं: group
उद्धृत नहीं किया जाना चाहिए। (२) कथानक सुंदर है: लाल डॉट्स एक रेखीय संबंध प्रदर्शित करते हैं जबकि काले रंग को कई तरीकों से फिट किया जा सकता है, जिसमें एक टुकड़ा रेखीय प्रतिगमन (एक बदलाव मॉडल के साथ प्राप्त) और संभवतः एक घातीय के रूप में भी शामिल है। हालांकि, मैं इनकी सिफारिश नहीं कर रहा हूं , क्योंकि मॉडलिंग के विकल्पों को प्रासंगिक विषयों में डेटा और प्रेरित सिद्धांतों द्वारा समझने की समझ से सूचित किया जाना चाहिए। वे आपके शोध के लिए एक बेहतर शुरुआत हो सकती हैं।