क्या यह एक द्विघात शब्द जोड़ने के लिए समझ में आता है लेकिन एक मॉडल के लिए रैखिक शब्द नहीं है?


57

मेरे पास एक मिश्रित (मिश्रित) मॉडल है, जिसमें मेरे पूर्ववर्तियों में से एक को प्राथमिक रूप से केवल पूर्वसूचक (प्रायोगिक हेरफेर के कारण) से संबंधित होना चाहिए। इसलिए, मैं मॉडल में केवल द्विघात शब्द जोड़ना चाहूंगा। दो चीजें मुझे ऐसा करने से रोकती हैं:

  1. मुझे लगता है कि मैंने कुछ समय पढ़े हैं कि उच्च क्रम के बहुपदों को फिट करते समय आपको हमेशा निचले क्रम के बहुपद को शामिल करना चाहिए। मैं भूल गया कि मुझे यह कहां मिला और साहित्य में मैंने देखा (जैसे, फ़रवे, 2002; फॉक्स, 2002) मुझे एक अच्छी व्याख्या नहीं मिल रही है।
  2. जब मैं दोनों को जोड़ता हूं, तो रैखिक और द्विघात शब्द, दोनों महत्वपूर्ण हैं। जब मैं उनमें से केवल एक को जोड़ता हूं, तो वे महत्वपूर्ण नहीं हैं। हालांकि, भविष्यवक्ता और डेटा का एक रैखिक संबंध व्याख्या करने योग्य नहीं है।

मेरे प्रश्न का संदर्भ विशेष रूप से मिश्रित-मॉडल का उपयोग कर lme4रहा है, लेकिन मैं ऐसे उत्तर प्राप्त करना चाहूंगा जो यह बता सके कि यह क्यों है या यह उच्च श्रेणी के बहुपद में कम क्यों नहीं है और निचले क्रम के बहुपद में नहीं है।

यदि आवश्यक हो तो मैं डेटा प्रदान कर सकता हूं।


5
मुझे लगता है कि इस सवाल का जवाब मददगार हो सकता है।

6
हां मैं प्रोक्रिस्टिनेटर से सहमत हूं, और बातचीत के प्रश्न अनिवार्य रूप से समान विचार हैं। इस विषय पर हमारे पास कुछ उच्च मतदान प्रश्न हैं। प्रो के सुझाव के अलावा, यह भी देखें कि क्या सभी इंटरैक्शन शर्तों को प्रतिगमन मॉडल में उनके व्यक्तिगत शब्दों की आवश्यकता है? और अगर प्रतिगमन में मेरे प्रत्यक्ष प्रभाव को मिटा दिया जाए तो क्या होगा?
एंडी डब्ल्यू

इन सवालों के याद दिलाने के लिए धन्यवाद। वहां दिए गए उत्तरों से ऐसा लगता है कि यह एक अच्छी रणनीति है यदि आपके पास केवल प्राथमिकताओं को शामिल करने के लिए अच्छे कारण हैं और गलत नहीं हैं। प्रश्न जो बना रहता है वह है स्केलेबिलिटी के बारे में (देखें: सांख्यिकी.स्टैकएक्सचेंज . com / a / 27726 / 442 )। क्या मुझे केवल द्विघात शब्द का उपयोग करते समय फिटिंग से पहले अपने चर को केंद्र में रखना चाहिए?
हेनरिक

1
@ हेनरिक - आपके द्वारा पोस्ट किए गए लिंक में मेरा उत्तर यह था कि भविष्यवक्ता मूल्यों (जैसे कि अर्थ केंद्रित) में मनमाने ढंग से बदलाव पर निर्भरता में मॉडल का अनुमान कैसे लगाया गया था - यह पर्याप्त निष्कर्ष निकालने के लिए अवांछनीय है, कुछ इस तरह के मनमाने ढंग से निर्भर करता है जिसके कारण मेरा जवाब आपके लिए है प्रश्न 'नहीं' है, इसी कारण से।
मैक्रों

2
द्विघात बनाम रैखिक का मुद्दा पारस्परिक रूप से पारस्परिक रूप से अलग-अलग है जो मुझे लगता है कि इसे डुप्लिकेट नहीं माना जाना चाहिए।
गुंग - फिर से बहाल करें मोनिका

जवाबों:


66

1. रैखिक शब्द क्यों शामिल है?

यह ध्यान रखना बहुत कठिन है कि द्विघात संबंध को दो तरीकों से लिखा जा सकता है:

y=a0+a1x+a2x2=a2(xb)2+c

(जहां, गुणांक के बराबर, हम और पाते हैं )। मूल्य संबंध के वैश्विक चरम सीमा से मेल खाता है (ज्यामितीय रूप से, यह एक परवलय के शीर्ष का पता लगाता है)।a 2 b 2 + c = a 0 x = b2a2b=a1a2b2+c=a0x=b

यदि आप रैखिक शब्द शामिल नहीं करते हैं , तो संभावनाएं कम हो जाती हैंa1x

y=a0+a2x2=a2(x0)2+c

(जहां अभी, स्पष्ट रूप से, और यह माना जाता है कि मॉडल में निरंतर शब्द होता है )। अर्थात आप बल ।a 0 b = 0 हैc=a0a0b=0

इसके प्रकाश में, प्रश्न # 1 नीचे आता है कि क्या आप निश्चित हैं कि वैश्विक चरम सीमा पर होनी चाहिए । यदि आप हैं, तो आप रैखिक शब्द को सुरक्षित रूप से छोड़ सकते हैं । अन्यथा, आपको इसे शामिल करना होगाa 1 xx=0a1x

2. महत्व में परिवर्तन को कैसे समझा जाए क्योंकि शब्दों को शामिल किया गया है या बाहर रखा गया है?

Https://stats.stackexchange.com/a/28493 पर संबंधित थ्रेड में इस पर विस्तार से चर्चा की गई है ।

वर्तमान मामले में, का इंगित करता है कि रिश्ते में वक्रता है और का इंगित करता है कि है : ऐसा लगता है कि आपको दोनों शब्दों (साथ ही साथ, निश्चित रूप से) को शामिल करने की आवश्यकता है।1 बीa2a1b


1
शुक्रिया व्हीबर बहुत बढ़िया जवाब। इसलिए अगर मैं 0 पर सैद्धांतिक चरम सीमा को केंद्र में रखता हूं (यह वास्तव में न्यूनतम है) तो मैं रैखिक शब्द का उपयोग करने के साथ ठीक हूं। यह एक बहुत महत्वपूर्ण द्विघात भविष्यवक्ता (रैखिक एक के बिना) की ओर जाता है।
हेनरिक

यदि चर के दोनों रैखिक और द्विघात नियम परस्पर संबंधित हैं, तो क्या मैं दोनों को एक मॉडल में शामिल कर सकता हूं, या क्या मुझे एक को बाहर करना चाहिए (जो मुझे लगता है कि यह द्विघात होना चाहिए)?
मट्टो

@ टेरेसा एक प्रतिगमन में सहसंबद्ध शब्दों को समाप्त करने का कोई सामान्य कारण नहीं है। (यदि ऐसा होता, तो बनाए गए प्रतिगमन मॉडल के विशाल बहुमत परेशानी में पड़ जाते!) बहुत दृढ़ता से सहसंबद्ध शब्द जो एक साथ या तो केवल शब्द की तुलना में मॉडल के फिट के लिए सार्थक कुछ भी नहीं करते हैं, उन शब्दों के सबसेट को कम किया जा सकता है।
whuber

@ शुभंकर, आपका बहुत-बहुत धन्यवाद! इसके अलावा, एक लॉजिस्टिक रिग्रेशन मॉडल के लिए, मैंने प्रभाव आकार का अनुमान लगाने के लिए ऑड्स अनुपात का उपयोग किया, लेकिन केवल रैखिक शब्दों के साथ। जब मेरे पास रैखिक और द्विघात होता है, तो क्या मैं उसी दृष्टिकोण का उपयोग कर सकता हूं और उसी तरह से परिणामों की व्याख्या कर सकता हूं?
मट्टो

काफी नहीं। इसका कारण यह है कि आप रैखिक और द्विघात शब्दों को अलग-अलग नहीं बदल सकते। आपको विचार करना होगा कि जब आप मूल चर को थोड़ा बदलेंगे तो प्रतिक्रिया कैसे बदलेगी।
whuber

22

@whuber ने यहां बहुत ही शानदार जवाब दिया है। मैं सिर्फ एक छोटा सा मानार्थ बिंदु जोड़ना चाहता हूं। प्रश्न कहता है कि "भविष्यवक्ता और डेटा का एक रैखिक संबंध व्याख्यात्मक नहीं है"। यह एक आम गलतफहमी पर संकेत देता है, हालांकि मैं आमतौर पर इसे दूसरे छोर पर सुनता हूं ('स्क्वॉड [क्यूबिक, इत्यादि] शब्द की व्याख्या क्या है?')।

जब हमारे पास कई अलग-अलग सहसंयोजकों के साथ एक मॉडल होता है , तो प्रत्येक बीटा [शब्द] को आम तौर पर अपनी व्याख्या की जा सकती है। उदाहरण के लिए, यदि:

GPA^college=β0+β1GPAhighschool+β2class rank+β3SAT,

(GPA का अर्थ है ग्रेड पॉइंट एवरेज;
रैंक एक हाईस्कूल में अन्य छात्रों के सापेक्ष एक छात्र का GPA का आदेश है; और
SAT का अर्थ है & स्कोलॉस्टिक एप्टीट्यूड टेस्ट ’एक मानक, विश्वविद्यालय जाने वाले छात्रों के लिए राष्ट्रव्यापी परीक्षण)

फिर हम प्रत्येक बीटा / अवधि के लिए अलग-अलग व्याख्याएं दे सकते हैं। उदाहरण के लिए, यदि किसी छात्र का हाई स्कूल GPA 1 अंक अधिक था - बाकी सब बराबर - हम उम्मीद करेंगे कि उनका कॉलेज GPA अंक अधिक हो। β1

हालांकि, यह ध्यान रखना महत्वपूर्ण है कि इस तरीके से किसी मॉडल की व्याख्या करना हमेशा स्वीकार्य नहीं होता है। एक स्पष्ट मामला है जब कुछ चर के बीच एक बातचीत होती है, क्योंकि यह अलग-अलग अवधि के लिए अलग-अलग शब्द के लिए संभव नहीं होगा और अभी भी बाकी सभी को स्थिर रखा है - आवश्यकता के अनुसार, बातचीत का शब्द भी बदल जाएगा। इस प्रकार, जब कोई इंटरैक्शन होता है, तो हम मुख्य प्रभावों की व्याख्या नहीं करते हैं, लेकिन केवल सरल प्रभाव , जैसा कि अच्छी तरह से समझा जाता है।

बिजली की शर्तों के साथ स्थिति सीधे अनुरूप है, लेकिन दुर्भाग्य से, व्यापक रूप से समझा नहीं जाता है। निम्नलिखित मॉडल पर विचार करें: (इस स्थिति में, का उद्देश्य एक प्रोटोटाइप निरंतर का प्रतिनिधित्व करना है।) लिए को बदलना संभव नहीं है। भी बदल रहा है। और इसके विपरीत। सीधे शब्दों में कहें, जब एक मॉडल में बहुपद शब्द होते हैं, तो एक ही अंतर्निहित कोवरिएट पर आधारित विभिन्न शब्द अलग-अलग व्याख्याओं को बर्दाश्त नहीं करते हैं। ( , , आदि) अवधि किसी भी स्वतंत्र अर्थ नहीं है। तथ्य यह है कि एक

y^=β0+β1x+β2x2
xxx2x2xx17p-पावर बहुपद शब्द एक मॉडल में 'महत्वपूर्ण' है जो इंगित करता है कि और से संबंधित फ़ंक्शन में 'बेंड' हैं । यह दुर्भाग्यपूर्ण है, लेकिन अपरिहार्य है, कि जब वक्रता मौजूद है, तो व्याख्या अधिक जटिल हो जाती है, और संभवतः कम सहज। परिवर्तनों के रूप में में परिवर्तन का आकलन करने के लिए , हमें पथरी का उपयोग करना होगा। उपरोक्त मॉडल का व्युत्पन्न है: जो रूप में के अपेक्षित मान में परिवर्तन की तात्कालिक दर है , बाकी सभी समान हो रहे हैं। यह इतना साफ नहीं है जितना बहुत शीर्ष मॉडल की व्याख्या; महत्वपूर्ण रूप से, परिवर्तन की तात्कालिक दरp1xyy^x
dydx=β1+2β2x
yxy के स्तर पर निर्भर करता है जिससे परिवर्तन का आकलन किया जाता हैx । इसके अलावा, में परिवर्तन की दर एक तात्कालिक दर है; , यह से तक पूरे अंतराल में लगातार बदल रहा है । यह एक वक्रतापूर्ण संबंध की प्रकृति है। yxoldxnew

1
बहुत बढ़िया प्रतिक्रिया! यह मुझे कुछ उत्कृष्ट प्रतिक्रियाओं की याद दिलाता है जो उपयोगकर्ता chl ने पारस्परिक प्रभाव की व्याख्या करने पर प्रदान की है । वह इस प्रतिक्रिया में लेख संदर्भ देता है, अंतःक्रिया प्रभाव की पहचान करने में सर्वोत्तम प्रथाएं क्या हैं? । और इस प्रतिक्रिया में कोप्लॉट्स का उपयोग करके रेखांकन प्रदर्शित करने का एक अद्भुत उदाहरण देता है, क्या दो निरंतर चर के बीच बातचीत संभव है?
एंडी डब्ल्यू

1
गंग के जवाब के लिए मैं सिर्फ यह कहना चाहता हूं कि सांख्यिकीय मॉडलिंग में शोर शामिल होता है जो एक बहुपद प्रतिगमन मॉडल में विवरण को बदल सकता है। मुझे लगता है कि बिल ह्यूबर ने जो केंद्र मुद्दा उठाया था वह एक ग्रेटा था क्योंकि एक सूत्र में एक रैखिक शब्द गायब है और दूसरे में यह द्विघात शब्द के साथ होता है। संकेत में वक्रता की ताकत पहले आदेश शब्द की तुलना में अधिक की आवश्यकता को निर्धारित करती है लेकिन वास्तव में हमें एक रैखिक शब्द की आवश्यकता के बारे में भी कुछ नहीं बताती है।
माइकल चेरिक

7

@ व्हिबर के उत्तर का उत्तर यह बताने में लक्ष्य पर सही है कि रैखिक शब्द को छोड़ना "सामान्य" है, द्विघात मॉडल यह कहने के बराबर है, "मैं पूरी तरह से निश्चित हूं कि चरम सीमा ।"x=0

हालांकि, आपको यह भी जांचने की आवश्यकता है कि आप जिस सॉफ्टवेयर का उपयोग कर रहे हैं, उसमें "गोचथा" है या नहीं। जब तक आप बहुपद केंद्र को बंद नहीं करते हैं तब तक कुछ सॉफ्टवेयर स्वचालित रूप से डेटा को केंद्र में रख सकते हैं जब एक बहुपद फिटिंग और उसके गुणांक का परीक्षण करते हैं। यही है, यह एक समीकरण फिट हो सकता है जो तरह दिखता है, जहां आपके s का मतलब है । यह एक्सटम पर होने के लिए मजबूर करेगा । ˉ एक्स एक्स एक्स = ˉ एक्सY=b0+b2(xx¯)2x¯xx=x¯

आपका कथन कि रैखिक और द्विघात दोनों शब्द महत्वपूर्ण हैं, जब दोनों को कुछ स्पष्टीकरण की आवश्यकता होती है। उदाहरण के लिए, SAS उस उदाहरण के लिए टाइप I और / या टाइप III परीक्षण की रिपोर्ट कर सकता है। टाइप I द्विघात में डालने से पहले रैखिक का परीक्षण करता है। प्रकार III मॉडल में द्विघात के साथ रैखिक का परीक्षण करता है।


2
यह एक उचित बिंदु है, लेकिन बनाने से पहले डेटा केवल b / c केंद्रित थे, इसका मतलब यह नहीं है कि आप "बिल्कुल निश्चित है कि एक्सट्रीम "। यह कहना कि अब "एक्सट्रीम " पर होने से पहले के बराबर है । या तो मामले में आप अपने मॉडल की निष्पक्षता को चरम सीमा w / अनंत परिशुद्धता के एक्स-मूल्य को निर्दिष्ट करने की क्षमता पर दांव लगा रहे हैं। अंतर b / t प्रकार I और प्रकार III परीक्षण भी संभावित रूप से दिलचस्प जोड़ है, लेकिन nb, वे केवल भिन्न होंगे यदि और सहसंबद्ध हैं, अर्थात, यदि केंद्र नहीं हुआ था। एक्स = 0 एक्स = ˉ एक्स एक्स एक्स 2x2x=0x=x¯xx2
गंग - मोनिका को बहाल करना

एक अलग नोट पर, आप '' पर '' प्रतीक के साथ संभव है, उनके उपयोगकर्ता नाम को बताकर उपयोगकर्ता के योगदान का उल्लेख कर सकते हैं। उदाहरण के लिए, इस मामले में, '@ whuber के जवाब सही निशाने पर है ...' (ए भावना है जिसके साथ मैं सहमत हूँ।)
गुंग - फिर से बहाल करें मोनिका

1
धन्यवाद, एमिल, उन यादों को योगदान देने के लिए: वे दोनों ध्यान में रखने योग्य हैं।
whuber

3

ब्रैंबोर, क्लार्क और गॉर्डर (2006) (जो कि एक इंटरनेट परिशिष्ट के साथ आता है ) में इंटरेक्शन मॉडल को समझने और सामान्य नुकसान से बचने के तरीके पर बहुत स्पष्ट रूप से ध्यान दिया जाता है, जिसमें आपको क्यों (लगभग) हमेशा निचले क्रम की शर्तें शामिल हैं ( इंटरैक्शन मॉडल में "संवैधानिक शब्द")।

विश्लेषकों को सभी संवैधानिक शब्दों को शामिल करना चाहिए जब बहुत ही दुर्लभ परिस्थितियों को छोड़कर गुणात्मक बातचीत मॉडल निर्दिष्ट करना। संवैधानिक शब्दों से हमारा तात्पर्य है, ऐसे प्रत्येक तत्व से जो संवादात्मक शब्द का निर्माण करते हैं। [..]

पाठक को ध्यान देना चाहिए, हालांकि, गुणक बातचीत मॉडल विभिन्न प्रकार के रूप ले सकते हैं और इसमें या जैसे उच्च-क्रम इंटरैक्शन शब्द जैसे द्विघात नियम शामिल हो सकते हैं । कोई फर्क नहीं पड़ता कि बातचीत शब्द किस रूप में लेता है, सभी संवैधानिक शब्दों को शामिल किया जाना चाहिए। इस प्रकार, जब बातचीत शब्द है शामिल किया जाना चाहिए और , , , , , और जब बातचीत शब्द है शामिल किया जाना चाहिए । एक्स जेड जम्मू एक्स एक्स 2 एक्स जेड जम्मू एक्स जेड एक्स जे जेड जम्मू एक्स जेड जम्मूX2XZJXX2XZJXZXJZJXZJ

ऐसा करने में विफलता का परिणाम एक अंडरस्क्राइब मॉडल में हो सकता है जो पक्षपाती अनुमानों को जन्म देगा। इससे हीनतापूर्ण त्रुटियाँ हो सकती हैं।

यदि यह स्थिति है और का संबंध (या ) के साथ है, जैसा कि वस्तुतः किसी भी सामाजिक विज्ञान की परिस्थिति में होगा, तो संवैधानिक शब्द को छोड़ने से पक्षपातपूर्ण (और असंगत) , , और अनुमान होंगे। । हालांकि हमेशा इस तरह के रूप में मान्यता नहीं दी जाती है, यह लोप किए गए चर पूर्वाग्रह का एक सीधा मामला है (ग्रीन 2003, पीपी। 148-2149)।X Z X Z β 0 β 1 β 3 हैZXZXZβ0β1β3

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.