मुझे व्याख्यात्मक चर के बीच बातचीत कैसे करनी चाहिए जब उनमें से एक में द्विघात और घन शब्द हो सकते हैं?


10

मुझे पूरी उम्मीद है कि मैंने इस सवाल को इस तरह से प्रतिपादित किया है कि इसका निश्चित रूप से उत्तर दिया जा सके - यदि नहीं, तो कृपया मुझे बताएं और मैं फिर से कोशिश करूंगा! मुझे यह भी ध्यान देना चाहिए कि मैं इन विश्लेषणों के लिए R का उपयोग करूंगा।

मेरे पास इस बात के कई उपाय हैं plant performance (Ys)कि मुझे संदेह है कि मैंने लगाए गए चार उपचारों से प्रभावित थे - flower thinning (X1), fertilization (X2), leaf clipping (X3)और biased flower thinning (X4)। सभी संभावित Ys के लिए, N कम से कम 242 है, इसलिए मेरे नमूने का आकार बड़ा था। सभी भूखंडों को या तो पतले होने के अधीन किया गया था या नहीं, लेकिन प्रत्येक भूखंड को अन्य तीन उपचारों में से एक (और केवल एक) के अधीन किया गया था (या नहीं - नियंत्रण भूखंड भी थे)। इस डिजाइन का विचार यह परीक्षण करने के लिए था कि क्या अन्य तीन उपचार या तो "मास्किंग" करने में सक्षम थे या पतले होने के प्रभाव को "बढ़ाते" थे। इस प्रकार, डिजाइन के अनुसार, बाद के तीन उपचार (X2-X4) एक दूसरे के साथ बातचीत नहीं कर सकते क्योंकि वे पार नहीं किए गए थे, लेकिन वे प्रत्येक फूल के पतले होने के साथ बातचीत कर सकते हैं - और वे शायद करते हैं।

मेरी स्पष्ट परिकल्पना यह है कि 1) फूल थिनिंग महत्वपूर्ण होगा और यह 2) अंतःक्रियात्मक शर्तें, X1*X2, X1*X3, and X1*X4,फूल के पतले होने के बीच और अन्य तीन उपचार भी महत्वपूर्ण होंगे। यही है, फूल के पतले होने की बात होनी चाहिए, लेकिन इसके तरीकों में जो बदलाव होना चाहिए वह अन्य तीन उपचारों द्वारा किया गया है।

मैं इस जानकारी को मिश्रित-मॉडल में शामिल करना चाहता हूं:

Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)

लेकिन एक हैंग-अप है: मेरे पास यह मानने का अच्छा कारण है कि वाई पर थिनिंग के प्रभाव गैर-रैखिक हैं। वे शायद द्विघात हैं, लेकिन शायद कुछ मामलों में घन भी। ऐसा इसलिए है क्योंकि प्रदर्शन के पतले होने के प्रभाव से पतलेपन के उच्च स्तर पर तेजी से बढ़ने की संभावना है। अगर मैं X1 के लिए द्विघात और घन शब्दों को जोड़कर इस गैर-रैखिक संबंध को उपरोक्त समीकरण के माध्यम से मॉडल करने की कोशिश करता हूं, तो मैं अंतःक्रियात्मक शर्तों को मॉडल करने का तरीका अनिश्चित हूं - क्या मुझे X1 के हर संभव संयोजन को शामिल करना है, (X1) ^ 2, और (X1) ^ 3 * X2, X3 और X4? क्योंकि यह अनुमान लगाने के लिए बहुत सारे मापदंडों की तरह लगता है, यहां तक ​​कि मेरे पास मौजूद डेटा बिंदुओं की संख्या के साथ, और मैं अनिश्चित हूं कि मुझे प्राप्त परिणामों की व्याख्या कैसे करनी चाहिए। इस स्थिति को मॉडल बनाने के लिए यह एक जैविक तरीका होगा।

इसलिए, इस मुद्दे का समाधान करने के लिए मेरे पास तीन विचार हैं:

  1. पहले एक छोटे से मॉडल को फिट करें, उदाहरण के लिए Y ~ X1 + X1^2 + X^3 + Random effects, यह पता लगाने के एकमात्र उद्देश्य के साथ कि क्या पतले और वाई के बीच संबंध रैखिक, द्विघात, या घन है, और फिर संबंध को रैखिक बनाने के लिए एक वर्ग- या क्यूब-रूट के माध्यम से पतले को बदलना। वहां से, अंतःक्रियात्मक शब्दों को रूपांतरित चर के साथ ऊपर से मॉडल किया जा सकता है।
  2. मान लें कि महत्वपूर्ण इंटरैक्शन, यदि वे होते हैं, तो केवल X1 शर्तों में से एक को प्रभावित करें (अर्थात केवल रैखिक, द्विघात या घन शब्द), और तदनुसार इंटरैक्शन मॉडल करें। मुझे यकीन नहीं है कि अगर यह दृष्टिकोण समझ में आता है।
  3. ऊपर चर्चा के रूप में पतले शब्दों और अन्य उपचारों के बीच हर संभव इंटरैक्शन शब्द के साथ बस "पूर्ण मॉडल" फिट करें। फिर, तुच्छ अंतःक्रियात्मक शर्तों को बताएं और परिणामों की व्याख्या करने के लिए ग्राफ़ और अन्य तकनीकों का उपयोग करें।

इनमें से कौन सा दृष्टिकोण, यदि कोई हो, सबसे अधिक समझ में आता है और क्यों, यह देखते हुए कि मैं परिकल्पना परीक्षण में रुचि रखता हूं और मॉडल चयन नहीं? विशेष रूप से, अगर # 1 ऊपर का मतलब नहीं है, तो ऐसा क्यों है? मैंने इस लेख और इस लेख को पढ़ा है और उन्हें पचाने की कोशिश की है कि वे मेरे लिए क्या मतलब हो सकते हैं, लेकिन आगे पढ़ने के लिए किसी भी स्रोत की भी बहुत सराहना की जाएगी!

जवाबों:


7

उन तरीकों में से कोई भी ठीक से काम नहीं करेगा। दृष्टिकोण 3. करीब आया, लेकिन फिर आपने कहा कि आप तुच्छ शब्दों को पसंद करेंगे। यह समस्याग्रस्त है क्योंकि सह-रैखिकताएं यह पता लगाना असंभव बनाती हैं कि किन शर्तों को हटाया जाए, और क्योंकि यह आपको परिकल्पना परीक्षणों में स्वतंत्रता की गलत डिग्री प्रदान करेगा यदि आप प्रकार I त्रुटि को संरक्षित करना चाहते हैं।

प्रभावी नमूना आकार और संकेत के आधार पर: आपकी समस्या में शोर अनुपात मैं सभी उत्पाद और मुख्य प्रभाव शर्तों के साथ एक मॉडल फिटिंग का सुझाव देता हूं, और भूखंडों और "चंक परीक्षणों" का उपयोग करके मॉडल की व्याख्या करता हूं (संबंधित शर्तों के कई डीएफ परीक्षण, अर्थात। समग्र बातचीत के लिए एक परीक्षण, nonlinear बातचीत के लिए परीक्षण, मुख्य प्रभाव + बातचीत, आदि सहित समग्र प्रभाव के लिए परीक्षण)। आर rmsपैकेज मानक यूनीवेट मॉडल के लिए और अनुदैर्ध्य मॉडल के लिए ऐसा करना आसान बनाता है जब मल्टीवेरेट सामान्य होता है। उदाहरण:Y

# Fit a model with splines in x1 and x2 and tensor spline interaction surface
# for the two.  Model is additive and linear in x3.
# Note that splines typically fit better than ordinary polynomials
f <- ols(y ~ rcs(x1, 4) * rcs(x2, 4) + x3)
anova(f)   # get all meaningful hypothesis tests that can be inferred
           # from the model formula
bplot(Predict(f, x1, x2))    # show joint effects
plot(Predict(f, x1, x2=3))   # vary x1 and hold x2 constant

जब आप anovaतालिका देखते हैं तो आप उन पंक्तियों को लेबल करते देखेंगे All Interactionsजो पूरे मॉडल के लिए सभी इंटरैक्शन शर्तों के संयुक्त प्रभाव का परीक्षण करती हैं। एक व्यक्तिगत भविष्यवक्ता के लिए यह केवल तब सहायक होता है जब भविष्यवक्ता एक से अधिक चर के साथ सहभागिता करता है। तालिका में प्रत्येक पंक्ति द्वारा दिखाने के printलिए विधि में एक विकल्प है कि anova.rmsशून्य के खिलाफ कौन से मापदंडों का परीक्षण किया जा रहा है। यह सब श्रेणीबद्ध और निरंतर भविष्यवाणियों के मिश्रण के साथ काम करता है।

यदि आप polइसके बजाय साधारण बहुपद का उपयोग करना चाहते हैं rcs

दुर्भाग्य से मैंने मिश्रित प्रभाव वाले मॉडल लागू नहीं किए हैं।


1
इस उत्तर के लिए धन्यवाद। मैंने पहले कभी भी छींटे का उपयोग नहीं किया है, लेकिन मुझे लगता है कि मैं आपके उदाहरण को समझता हूं। मेरे कुछ फॉलो-अप प्रश्न हैं, यदि यह ठीक है? 1. जब आपके उदाहरण के रूप में, ओल्स से एनोवा परिणाम को देखते हैं, तो एक कारक के नीचे "सभी इंटरैक्शन" से क्या मतलब है? यही है, क्या के साथ सभी बातचीत? 2. क्या मिश्रित-मॉडलिंग दृष्टिकोण में एक समान दृष्टिकोण अनुमेय होगा? मुझे लगता है कि मुझे यादृच्छिक कारकों की आवश्यकता है। क्या आपका उदाहरण, उदाहरण के लिए, lme4 के साथ संगत है? 3. यदि बातचीत के कुछ उपचार स्पष्ट हैं तो क्या यह काम करेगा? उदाहरण के लिए, क्या होगा यदि X2 एक 2-स्तरीय कारक था?
बाजीग

2

जब मैं बाद में पैरामीट्रिक रिग्रेशन मॉडल का अनुमान लगाने जा रहा हूं, तब भी मैं आश्रित चर और भविष्यवाणियों के बीच संबंधों के कार्य रूपों का आकलन करने के लिए नॉनपैरेमेट्रिक स्मूथिंग रेजिमेंट्स का उपयोग करने का प्रशंसक हूं। जबकि मुझे बहुत बार ग़ैर-रिश्तेदार रिश्ते मिल गए हैं, मैंने कभी भी ग़ैर-अंतःक्रियात्मक अंतःक्रिया शब्द नहीं पाया है, यहाँ तक कि जब मुख्य प्रभाव दृढ़ता से प्रभावित होते हैं। मेरा घर ले: अंतःक्रियात्मक प्रभावों को उन्हीं कार्यात्मक रूपों से युक्त होने की आवश्यकता नहीं होती है, जिनमें वे शामिल होते हैं।


तो, स्पष्ट करने के लिए, आपका घर लेना यह है कि अगर मैं विकल्प # 2 का चयन करता हूं, तो मैं केवल रैखिक एक्स 1 शब्द के साथ बातचीत की शर्तों को सुरक्षित रूप से शामिल कर सकता हूं और "उच्च आदेश इंटरैक्शन शर्तों" के बारे में चिंता नहीं कर सकता, उदाहरण के लिए एक्स 1 ^ 2 * एक्स 3 और इसी तरह?
बाजीग

1
@Bajcz खैर ... मुझे लगता है कि मैं दो बातें कह रहा हूं: (1) मैं उन डेटा सेटों में शामिल होने में कामयाब रहा हूं जिनका सामना मैंने केवल रैखिक बातचीत के साथ किया है, लेकिन यह भी (2) मुझे देखना पसंद है (नॉनपेर्मेट्रिक रिग्रेशन का उपयोग करके) और डेटा को बताएं कि मुझे गैर-विकल्प के विकल्प पर विचार करना चाहिए या नहीं। [एक मॉडल फिट या परिकल्पना परीक्षण दृष्टिकोण को ग़ैर-समोच्च शर्तों पर ले जाना IMO है, इसके बारे में जाने का गलत तरीका है, क्योंकि यह उदाहरण के लिए, उदाहरण के लिए, निष्कर्ष पर आधारित है, उदाहरण के लिए, बहुपद शब्दों का एक मनमाना सेट, बजाय डेटा के खुद के लिए।]
एलेक्सिस

3
यह मानने का कोई बड़ा कारण नहीं है कि इंटरैक्शन रैखिक होने की अधिक संभावना है। मैं nonlinear बातचीत के महान उदाहरणों में आया हूँ। "तलाश" और "आपको डेटा बताने" का विचार बुरी आत्मविश्वास अंतराल कवरेज समस्याओं सहित अनुमान समस्याओं से ग्रस्त है।
फ्रैंक हरेल

1
@FrankHarrell धन्यवाद! आपका पहला वाक्य ठीक वही बिंदु है जो मैं ऊपर टिप्पणी में मेरे (2) पार पाने की कोशिश कर रहा था (मेरा पिछला अनुभव भविष्य में नाटकीय रूप से भिन्न हो सकता है)। OTOH: डेटा को बोलने नहीं देना वास्तविक डेटा के बारे में अनुमानों पर मॉडलिंग मान्यताओं की कलाकृतियों के बारे में अनुमान लगाने के लिए एक शानदार रणनीति है।
एलेक्सिस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.