जब जीएएम बनाम जीएलएम का उपयोग करना है


15

मुझे लगता है कि यह एक संभावित व्यापक प्रश्न हो सकता है, लेकिन मैं सोच रहा था कि क्या जीएलएम (सामान्यीकृत रैखिक मॉडल) पर जीएएम (सामान्यीकृत एडिटिव मॉडल) के उपयोग को इंगित करने वाली सामान्य धारणाएं हैं?

किसी ने हाल ही में मुझे बताया कि GAMs का उपयोग केवल तब किया जाना चाहिए जब मैं डेटा संरचना को "एडिटिव" मानता हूं, यानी मुझे उम्मीद है कि x का जोड़ वाई की भविष्यवाणी करेगा। एक अन्य व्यक्ति ने बताया कि एक जीएलएम की तुलना में एक जीएएम एक अलग प्रकार का प्रतिगमन विश्लेषण करता है, और यह कि एक जीएलएम को प्राथमिकता दी जाती है जब रैखिकता ग्रहण की जा सकती है।

अतीत में मैं पारिस्थितिक डेटा के लिए एक जीएएम का उपयोग कर रहा हूं, उदाहरण के लिए:

  • निरंतर समय
  • जब डेटा में रैखिक आकार नहीं था
  • मेरे पास मेरे y की भविष्यवाणी करने के लिए कई एक्स थे जो मैंने सोचा था कि कुछ नॉनलाइनियर इंटरैक्शन है जो मैं एक सांख्यिकीय परीक्षण के साथ "सतह भूखंडों" का उपयोग करके कल्पना कर सकता हूं

मुझे स्पष्ट रूप से यह समझ नहीं है कि एक जीएलएम की तुलना में जीएएम क्या करता है। मेरा मानना ​​है कि यह एक वैध सांख्यिकीय परीक्षण है, (और मुझे कम से कम पारिस्थितिक पत्रिकाओं में GAMs के उपयोग में वृद्धि दिखाई दे रही है), लेकिन मुझे यह जानने की आवश्यकता है कि इसका उपयोग अन्य प्रतिगमन विश्लेषणों पर इंगित किया गया है।


GAM का उपयोग तब किया जाता है जब रैखिक भविष्यवक्ता कुछ भविष्यवाणियों के अज्ञात चिकनी कार्यों पर रैखिक रूप से निर्भर करता है।
user2974951

1
अंतर धुँधला है क्योंकि आप संख्यात्मक covariables का प्रतिनिधित्व कर सकते हैं जैसे कि एक GLM में एक तख़्तापलट द्वारा भी।
माइकल एम

3
जबकि अंतर धुँधला है, गम की बातचीत भी smae तरीके का प्रतिनिधित्व कर सकती है क्योंकि glm की इतनी अधिक सख्त संवेदनशीलता की आवश्यकता नहीं है, बड़ा अंतर निष्कर्ष के रूप में है: गम की विशेष विधियों की जरूरत है, क्योंकि अनुमान प्रक्षेपण के माध्यम से नहीं किया जाता है, लेकिन स्मूथी के माध्यम से किया जाता है। जो व्यवहार में आता है, उसे मैं नहीं समझता।
kjetil b halvorsen

GLM GAM।
us --r11852

जवाबों:


14

मुख्य अंतर इम्हो यह है कि रैखिक, या सामान्यीकृत रैखिक के "शास्त्रीय" रूपों के दौरान, मॉडल एक निश्चित रैखिक या आश्रित चर और सहसंयोजकों के बीच संबंधों के कुछ अन्य पैरामीट्रिक रूप ग्रहण करते हैं, गाम इस के किसी भी विशिष्ट रूप को प्राथमिकता नहीं मानते हैं। निर्भर चर पर गैर-रैखिक प्रभाव को प्रकट करने और अनुमान लगाने के लिए संबंध, और इसका उपयोग किया जा सकता है। विस्तार से अधिक है, जबकि में (सामान्यीकृत) मॉडल रैखिक रैखिक भविष्यवक्ता की एक भारित योग है covariates, , Gams में इस शब्द चिकनी समारोह की राशि की जगह, जैसे , जहाँni=1nβixii=1nj=1qβisj(xi)s1(),,sq()सुचारू आधार कार्य हैं (जैसे क्यूबिक स्प्लिन) और आधार आयाम है। आधार कार्यों के संयोजन से GAMs बड़ी संख्या में कार्यात्मक संबंध का प्रतिनिधित्व कर सकते हैं (ऐसा करने के लिए वे इस धारणा पर भरोसा करते हैं कि सच्चा संबंध सहज होने के बजाय, सहज होने की संभावना है)। वे अनिवार्य रूप से GLMs का एक विस्तार हैं, हालांकि वे इस तरह से डिज़ाइन किए गए हैं जो उन्हें संख्यात्मक कोवरिअट्स के नॉनलाइनियर प्रभावों को उजागर करने के लिए विशेष रूप से उपयोगी बनाते हैं, और ऐसा करने के लिए "स्वचालित" फैशन (हस्ती और तिब्स्सानी मूल लेख से), उनके पास ' पूरी तरह से स्वचालित होने का लाभ, यानी "कलाकार" की ओर से "जासूस" कार्य की आवश्यकता नहीं है )।q


2
ठीक है, लेकिन जैसा कि टिप्पणियों में कहा गया है, यह सब ग्लम के साथ भी किया जा सकता है ... मुझे संदेह है कि मुख्य अंतर व्यावहारिक है। R कार्यान्वयन mgcvउन चीजों को करता है जो आप नहीं कर सकते हैं glm, लेकिन उस ढांचे में भी किया जा सकता है ...
kjetil b halvorsen

हां, मैं आपसे सहमत हूं, जीएएम जीएलएम का एक विस्तार हैं। हालाँकि यह सवाल था कि जीएएम का उपयोग कब करना है और जीएलएम का उपयोग कब करना है, और यह मुझे प्रतीत हुआ कि ऑप का मतलब जीएलएम के "शास्त्रीय" रूपों से है, जिसमें आमतौर पर भविष्यवाणियों के रूप में आधार फ़ंक्शन का एक सेट शामिल नहीं होता है और इसे प्रकट करने के लिए उपयोग नहीं किया जाता है / अज्ञात अज्ञात संबंध।
Matteo

धन्यवाद - यह मददगार है। और हाँ, मैं क्लासिक GLM के बारे में बात कर रहा था
mulerig

@ मैट्टो सिर्फ दो और चीजें: i) वास्तव में "सच्चे रिश्ते के सहज होने की बजाए, आप क्या कर सकते हैं?" (ii) "संख्यात्मक सहसंयोजकों के nonlinear प्रभावों को उजागर करने के लिए विशेष रूप से उपयोगी है" - कोई कैसे (/ जैसे mgcv) के साथ nonlinearity का वर्णन / परिमाणित करेगा ?
मुलरिग

वास्तविक संबंध वास्तव में सहज नहीं हो सकता है, हालांकि GAMs आमतौर पर संभावना अधिकतमकरण की प्रक्रिया के दौरान "विग्लगनेस" दंड को जोड़कर मॉडल जटिलता के लिए नियंत्रित करते हैं (आमतौर पर अनुमानित फ़ंक्शन के दूसरे व्युत्पन्न के एकीकृत वर्ग के अनुपात के रूप में लागू किया जाता है)। संख्यात्मक सहसंयोजकों के गैर-रेखीय प्रभाव का अर्थ है कि आश्रित चर पर एक विशेष संख्यात्मक चर का प्रभाव, उदाहरण के लिए, चर मान के साथ एकात्मक रूप से बढ़ता / घटता नहीं है, लेकिन एक अज्ञात आकार है, उदाहरण के लिए अधिकतम अधिकतम सीमा, मिनीमा, विभक्ति बिंदु। ..
मैटो

14

मैं इस बात पर जोर दूंगा कि जीएलएम की तुलना में GAM अधिक लचीले हैं, और इसलिए उनके उपयोग में अधिक देखभाल की आवश्यकता है। अधिक शक्ति के साथ अधिक से अधिक जिम्मेदारी आती है।

आप पारिस्थितिकी में उनके उपयोग का उल्लेख करते हैं, जिसे मैंने भी देखा है। मैं कोस्टा रिका में था और एक वर्षावन में किसी तरह का अध्ययन देखा जहां कुछ स्नातक छात्रों ने कुछ डेटा को जीएएम में फेंक दिया था और इसके पागल-जटिल स्मूदी को स्वीकार कर लिया था क्योंकि सॉफ्टवेयर ने ऐसा कहा था। यह बहुत ही निराशाजनक था, केवल हास्यपूर्ण / सराहनीय तथ्य को छोड़कर, जिसमें उन्होंने कड़ाई से एक फुटनोट शामिल किया था जो इस तथ्य को प्रलेखित करता था कि वे एक जीएएम और उच्च-क्रम वाले स्मूदी का उपयोग करते थे।

आपको यह समझने की ज़रूरत नहीं है कि GAMs उनका उपयोग करने के लिए कैसे काम करते हैं, लेकिन आपको वास्तव में अपने डेटा, समस्या के बारे में सोचने की ज़रूरत है, आपके सॉफ़्टवेयर के मापदंडों का स्वचालित चयन जैसे चिकनी ऑर्डर, आपकी पसंद (आपके द्वारा निर्दिष्ट स्मूदीज़, इंटरैक्शन,) अगर एक चिकना उचित है, आदि), और आपके परिणामों की विश्वसनीयता।

बहुत सारे प्लॉट्स करें और अपने स्मूदिंग कर्व्स को देखें। क्या वे कम डेटा वाले क्षेत्रों में पागल हो जाते हैं? क्या होता है जब आप एक कम-ऑर्डर चिकनी को निर्दिष्ट करते हैं या पूरी तरह से चौरसाई को हटाते हैं? क्या उस वैरिएबल के लिए कोई डिग्री 7 चिकनी है, क्या यह आश्वासन के बावजूद ओवरफिटिंग है कि यह अपने विकल्पों को पार कर रहा है? क्या आपके पास पर्याप्त डेटा है? यह उच्च गुणवत्ता या शोर है?

मुझे GAMS पसंद है और लगता है कि वे डेटा की खोज के लिए अंडर-सराहना हैं। वे सिर्फ सुपर-लचीले हैं और यदि आप खुद को कठोरता के बिना विज्ञान की अनुमति देते हैं, तो वे आपको जीएलएम जैसे सरल मॉडल की तुलना में सांख्यिकीय जंगल में आगे ले जाएंगे।


1
मुझे लगता है कि मैं सबसे अधिक बार उन ग्रेड छात्रों ने क्या किया है: मेरे डेटा को एक गम में फेंक दो और इस बात से चकित हो जाओ कि mgcvमेरा डेटा कितनी अच्छी तरह से संभालता है। मैं अपने मापदंडों से पारंगत होने की कोशिश करता हूं, और मैं जांचता हूं कि अनुमानित मान मेरे डेटा से कितनी अच्छी तरह मेल खाते हैं। आपकी टिप्पणियाँ थोड़ी और कठोर होने के लिए एक अच्छी याद दिलाती हैं - और शायद अंत में सिमोन वुड्स बुक मिल जाए!
mluerig

हेक, मैं अभी तक एक चर का पता लगाने के लिए एक स्मूथी का उपयोग करने के लिए जाऊंगा, और फिर या तो कम मूल्य पर स्वतंत्रता की डिग्री को ठीक करूंगा या चिकनी और उपयोग को समाप्त करूंगा, कह सकता हूं, अगर स्मूथी मूल रूप से द्विघात है, तो एक चुकता शब्द। एक द्विघात उम्र के प्रभाव के लिए समझ में आता है, उदाहरण के लिए।
वेन

@Wayne, मैं गामा के संबंध में डेटा अन्वेषण पर एक जवाब के लिए यहां आया था, और आपने इसे इंगित किया। डेटा अन्वेषण के लिए आप GAM का उपयोग कैसे करते हैं? और आप यह कैसे तय करेंगे कि क्या जीएएम की जरूरत है, या यदि जीएलएम पर्याप्त होगा। क्या यह समझ में आएगा कि एक साधारण GAM को चलाने के लिए जिसमें आप प्रतिक्रिया और प्रत्येक संभावित भविष्यवाणियों को बारी-बारी से चलाते हैं, और यह देखते हैं कि क्या संबंध GAM (यानी गैर-रैखिक और गैर-मोनोटोनिक संबंध) को वारंट करता है?
तिलन

6

मुझे केवल टिप्पणी जोड़ने के लिए कोई प्रतिष्ठा नहीं है। मैं वेन की टिप्पणी से पूरी तरह सहमत हूं: अधिक शक्ति के साथ अधिक जिम्मेदारी आती है । GAMs बहुत लचीले हो सकते हैं और अक्सर हमें पागल-जटिल स्मूदी मिलते हैं । फिर, मैं शोधकर्ताओं को चिकनी कार्यों की स्वतंत्रता की डिग्री (गांठों की संख्या) को प्रतिबंधित करने और विभिन्न मॉडल संरचनाओं (बातचीत / कोई बातचीत आदि) का परीक्षण करने के लिए दृढ़ता से सलाह देता हूं।

GAMs को मॉडल-संचालित दृष्टिकोणों के बीच माना जा सकता है (हालांकि सीमा फ़र्ज़ी है मैं GLM को उस समूह में शामिल करूंगा) और डेटा-संचालित दृष्टिकोण (जैसे कृत्रिम तंत्रिका नेटवर्क या रैंडम फ़ॉरेस्ट जो पूरी तरह से गैर-रेखीय चर प्रभाव के रूप में मानते हैं)। तदनुसार, मैं हस्ति और तिब्शीरानी से पूरी तरह सहमत नहीं हूं क्योंकि गम्स को अभी भी कुछ जासूसी के काम की जरूरत है (आशा है कि कोई मुझे ऐसा कहने के लिए नहीं मारेगा)।

एक पारिस्थितिक दृष्टिकोण से, मैं इन अविश्वसनीय चर पागल-जटिल स्मूदों से बचने के लिए आर पैकेज घोटाले का उपयोग करने की सलाह दूंगा । इसे नताल्या प्या और साइमन वुड द्वारा विकसित किया गया था और यह चिकनी वक्रों को वांछित आकार (जैसे यूनीकोडल या मोनोटोनिक) के लिए बाध्य करने की अनुमति देता है, यहां तक ​​कि दो-तरफ़ा बातचीत के लिए भी। मुझे लगता है कि सुचारु कार्यों के आकार में बाधा के बाद GLM एक मामूली विकल्प बन जाता है, लेकिन यह केवल मेरी व्यक्तिगत राय है।

Pya, N., वुड, एसएन, 2015. आकार विवश योज्य मॉडल। स्टेट। कंप्यूटर। 25 (3), 543–559। 10.1007 / s11222-013-9448-7

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.