आर में समुद्री मील कैसे निर्दिष्ट करें
ns
समारोह एक उत्पन्न करता है प्राकृतिक प्रतिगमन पट्टी एक इनपुट वेक्टर दी आधार। गांठों को या तो एक डिग्री-ऑफ-फ्रीडम तर्क के माध्यम से निर्दिष्ट किया जा सकता है df
जो एक पूर्णांक लेता है या एक समुद्री मील तर्क के माध्यम से knots
होता है जो एक वेक्टर लेता है जो समुद्री मील का वांछित स्थान देता है। ध्यान दें कि आपके द्वारा लिखे गए कोड में
library(splines)
lda.pred <- lda(y ~ ns(x, knots=5))
आपने पांच समुद्री मील का अनुरोध नहीं किया है, बल्कि स्थान 5 पर एकल (आंतरिक) गाँठ का अनुरोध किया है ।
यदि आप df
तर्क का उपयोग करते हैं, तो वेक्टर की मात्रा के आधार पर आंतरिक समुद्री मील का चयन किया जाएगा x
। उदाहरण के लिए, यदि आप कॉल करते हैं
ns(x, df=5)
फिर आधार में क्रमशः 20 वीं, 40 वीं, 60 वीं और 80 वीं मात्राओं में रखी गई दो सीमा गांठें और 4 आंतरिक समुद्री मील शामिल x
होंगे। सीमा समुद्री मील, डिफ़ॉल्ट रूप से, न्यूनतम और अधिकतम पर रखी जाती हैं x
।
यहाँ समुद्री मील के स्थानों को निर्दिष्ट करने के लिए एक उदाहरण है
x <- 0:100
ns(x, knots=c(20,35,50))
यदि आप कॉल करने के बजाय ns(x, df=4)
, आप क्रमशः 25, 50 और 75 स्थानों पर 3 आंतरिक समुद्री मील के साथ समाप्त हो जाएगा।
आप यह भी निर्दिष्ट कर सकते हैं कि क्या आप एक अवरोधन शब्द चाहते हैं। आम तौर पर यह निर्दिष्ट नहींns
किया जाता है क्योंकि अक्सर सबसे अधिक संयोजन के साथ उपयोग किया जाता है lm
, जिसमें एक अवरोधन निहित होता है (जब तक कि मजबूर न हो)। यदि आप intercept=TRUE
अपने कॉल में उपयोग करते हैं ns
, तो सुनिश्चित करें कि आप जानते हैं कि आप ऐसा क्यों कर रहे हैं, क्योंकि यदि आप ऐसा करते हैं और फिर lm
भोलेपन से कॉल करते हैं , तो डिज़ाइन मैट्रिक्स रैंक की कमी हो जाएगी।
गांठ लगाने की रणनीतियाँ
नॉट को आमतौर पर क्वांटाइल्स में रखा जाता है, जैसे कि डिफ़ॉल्ट व्यवहार ns
। अंतर्ज्ञान यह है कि यदि आपके पास बहुत सारे डेटा एक साथ बंद हो गए हैं, तो आप उस क्षेत्र में किसी भी संभावित गैरकानूनी मॉडल के लिए अधिक समुद्री मील चाहते हैं। लेकिन, इसका मतलब यह नहीं है कि (ए) एकमात्र विकल्प या (बी) सबसे अच्छा विकल्प है।
अन्य विकल्प स्पष्ट रूप से बनाए जा सकते हैं और डोमेन-विशिष्ट हैं। आपके भविष्यवक्ताओं के हिस्टोग्राम और घनत्व के अनुमानों को देखते हुए, जहां डेटा की जरूरत होती है, वहां सुराग दे सकते हैं, जब तक कि कुछ "कैनोनिकल" विकल्प आपके डेटा को न दे दें।
प्रतिगमन की व्याख्या करने के संदर्भ में, मैं यह नोट करूंगा कि जब आप निश्चित रूप से गाँठ लगाने के साथ "चारों ओर" खेल सकते हैं, तो आपको यह महसूस करना चाहिए कि आप इसके लिए एक मॉडल-चयन जुर्माना लगाते हैं कि आपको मूल्यांकन के लिए सावधान रहना चाहिए और किसी भी इनफ़ेक्शन को समायोजित करना चाहिए। परिणाम।