मैं एक नॉनलाइनियर एसोसिएशन का परीक्षण कैसे कर सकता हूं?


37

प्लॉट 1 के लिए, मैं एक्स और वाई के बीच के संबंध को एक साधारण सहसंबंध का परीक्षण कर सकता हूं। प्लॉट 1

प्लॉट 2 के लिए, जहां संबंध अशुभ है फिर भी एक्स और वाई के बीच एक स्पष्ट संबंध है, मैं एसोसिएशन का परीक्षण कैसे कर सकता हूं और इसकी प्रकृति को लेबल कर सकता हूं? प्लॉट 2

जवाबों:


35

... संबंध गैर-स्पष्ट है फिर भी एक्स और वाई के बीच एक स्पष्ट संबंध है, मैं एसोसिएशन का परीक्षण कैसे कर सकता हूं और इसकी प्रकृति को लेबल कर सकता हूं?

ऐसा करने का एक तरीका यह होगा कि का उपयोग करते हुए अर्ध-पैरामीट्रिक रूप से अनुमानित फ़ंक्शन के रूप में को फिट किया जाए , उदाहरण के लिए, एक सामान्यीकृत योज्य मॉडल और परीक्षण कि क्या कार्यात्मक अनुमान स्थिर है या नहीं, जो और बीच कोई संबंध नहीं दर्शाता है । यह दृष्टिकोण आपको बहुपद प्रतिगमन करने और बहुपद के आदेश के बारे में कभी-कभी मनमाने निर्णय लेने से मुक्त करता है।yxyx

विशेष रूप से, यदि आपके पास अवलोकन हैं, , तो आप मॉडल को फिट कर सकते हैं:(Yi,Xi)

E(Yi|Xi)=α+f(Xi)+εi

और परिकल्पना । में , आप फ़ंक्शन का उपयोग करके ऐसा कर सकते हैं । यदि आपका परिणाम है और आपका भविष्यवक्ता है, तो आप टाइप कर सकते हैं:H0:f(x)=0, xRgam()yx

library(mgcv) 
g <- gam(y ~ s(x)) 

टाइपिंग summary(g)आपको ऊपर दिए गए परिकल्पना परीक्षण का परिणाम देगा। जहां तक ​​रिश्ते की प्रकृति की विशेषता है, यह एक कथानक के साथ सबसे अच्छा होगा। ऐसा करने का एक तरीका R(ऊपर दिए कोड को पहले ही दर्ज कर लिया गया है)

plot(g,scheme=2)

यदि आपकी प्रतिक्रिया चर असतत है (जैसे बाइनरी), तो आप इस ढांचे के भीतर एक लॉजिस्टिक जीएएम ( R, आप family=binomialअपनी कॉल में जोड़ देंगे gam) को फिट करके समायोजित कर सकते हैं । इसके अलावा, अगर आप एक से अधिक भविष्यवक्ताओं है, तो आप कई अतिरिक्त शर्तों (या साधारण रेखीय शब्द) multivariable काम करता है, उदाहरण के लिए शामिल हैं, या फिट कर सकते हैं यदि आप भविष्यवक्ताओं था । यदि आप डिफ़ॉल्ट विधियों का उपयोग करते हैं, तो संबंध की जटिलता स्वचालित रूप से क्रॉस सत्यापन द्वारा चुनी जाती है, हालांकि यहां बहुत अधिक लचीलापन है - रुचि होने पर सहायता फ़ाइल देखें ।f(x,z)x, zgam


1
मैं इस दृष्टिकोण को दोनों ओर दो अलग-अलग रैंक सहसंबंधों के लिए पसंद करता हूं क्योंकि यह संपूर्ण के रूप में संबंध की जांच करता है। यह पैरामीट्रिक मॉडल से भी बेहतर है, इसलिए मैंने इसके बजाय इसे स्वीकार किया है। x=a
user1447630

@ user1447630 यह रिश्ते के लिए एक मॉडल है। बहुपद रैखिक प्रतिगमन या nonlinear प्रतिगमन और साथ ही additive मॉडल एक कार्य संबंध को चिह्नित करने के तरीके हैं। मैं उनमें से किसी का भी उल्लेख कर सकता था। लेकिन आपने संगति का उपाय पूछा, इसलिए मैंने आपको सहसंबंध के अन्य संभावित रूप दिए। मैक्रो का जवाब जितना अच्छा हो सकता है, यह एक कार्यात्मक संबंध फिट बैठता है, लेकिन एसोसिएशन का एक उपाय प्रदान नहीं करता है।
बजे माइकल आर। चेरिक

1
@ मिकेल, मुझे नहीं पता कि आप कौन सा प्रश्न पढ़ रहे थे, लेकिन ओपी ने पूछा कि संघ के माप के लिए नहीं, बल्कि संघ के लिए कैसे परीक्षण करना है। किसी भी मामले में, आपका उत्तर जितना अच्छा हो सकता है, (और इस तथ्य की अनदेखी करते हुए कि इसके लिए एक मजबूत ज्ञान की आवश्यकता है जहां परिवर्तन बिंदु होता है) मुझे लगता है कि यह सामान्य रूप से इस प्रश्न में विशिष्ट कथानक के अनुरूप है। "नॉनलाइनियर एसोसिएशन" समस्या।
मैक्रो

3
@Michael, आपकी व्याख्या ( "प्रश्न सहसंबंध की अवधारणा को सामान्य बनाने के तरीके के बारे में था .." ) और सांख्यिकीय "तर्क" जो आप देते हैं (btw, गुणांक के siginicance और मॉडल के लिए परीक्षण) यह एक रैखिक मॉडल में है उसी तरह एक सहसंबंध के परीक्षण) का कोई मतलब नहीं है, तथ्यों को देखते हुए, इसलिए मैं उन्हें संबोधित नहीं करने जा रहा हूं। लेकिन, ".. आपके दिए जाने के बाद आपकी खदान को अस्वीकार कर दिया गया और आपका स्वीकार कर लिया गया ... मुझे लगा कि यह सही नहीं था" आपके उत्तर के लिए अभियान चला रहा है जो केवल प्रतिनिधि बिंदुओं पर एक निर्धारण को दर्शाता है, समुदाय के लिए उपयोगी कुछ भी नहीं।
मैक्रों

5
@ मैक्रो और माइकल मेरे लिए एक सेमी / गैर-पैरामीट्रिक तरीके से और बीच के संबंध के एक मॉडल को फिट कर रहे हैं , दोनों के बीच सहयोग का परीक्षण करने का एक तरीका है। इस तरह के परीक्षण को आपके द्वारा सुझाए गए विभिन्न तरीकों के साथ जुड़ने की सीमा को मापकर बढ़ाया जा सकता है। मुझे लगता है कि दोनों उत्तर और अनुवर्ती यहाँ मेरे लिए बहुत उपयोगी किया गया है, बिना विज्ञापन hominem । हालांकि, चूंकि मेरे सवाल में यह शामिल था कि हम "इसकी प्रकृति को लेबल कैसे कर सकते हैं", जिसे मॉडल-फिटिंग के रूप में व्याख्या किया जा सकता है, मैं मैक्रो के जवाब के साथ छड़ी करने जा रहा हूं। xy
user1447630

14

यदि गैर-संबंध संबंध नीरस रैंक सहसंबंध था (स्पीयरमैन के आरएचओ) उपयुक्त होगा। अपने उदाहरण में एक स्पष्ट छोटे से क्षेत्र जहां monotoncally में वृद्धि से वक्र परिवर्तन montonically एक परवलय की तरह कम करने के बिंदु है जहां पहले व्युत्पन्न के बराबर होती है पर क्या करना होगा है ।0

मुझे लगता है कि यदि आपके पास कुछ मॉडलिंग ज्ञान (अनुभवजन्य जानकारी से परे) है, जहां वह परिवर्तन बिंदु ( पर कहता ) तब आप सकारात्मक के रूप में सहसंबंध को चिह्नित कर सकते हैं और जोड़े के सेट पर स्पीयरमैन के आरएचओ का उपयोग कर सकते हैं जहां उस सहसंबंध का एक अनुमान प्रदान करने के लिए और लिए स्पीयरमैन के सहसंबंध के एक और अनुमान का उपयोग करें जहां सहसंबंध नकारात्मक है। ये दो अनुमान तब और बीच सहसंबंध संरचना की विशेषता रखते हैं और एक सहसंबंध अनुमान के विपरीत है जो पास होगा जब अनुमान लगाया जाएगा कि सभी डेटा का उपयोग इन दोनों अनुमानों में बड़ा और विपरीत होगा।( एक्स , वाई ) एक्स < एक एक्स > एक एक्स वाई 0x=a(x,y)x<ax>axy0

कुछ लोग यह तर्क दे सकते हैं कि सिर्फ अनुभवजन्य जानकारी ( यानी देखी गई जोड़ी इसे सही ठहराने के लिए पर्याप्त है।(x,y)


अनिवार्य रूप से, मैं x ~ y संबंध को दो भागों में विभाजित करूंगा। एक्स = ए के नीचे, स्पीयरमैन के आरएचओ द्वारा सहसंबंध सकारात्मक है। एक्स = ए के ऊपर, स्पीयरमैन की आरएच द्वारा सहसंबंध नकारात्मक है। मुझे यह तरीका पसंद है। हालांकि, पैरामीट्रिक परीक्षण के कुछ तरीके भी हैं कि क्या x और y के बीच का संबंध एक व्युत्क्रम परवलय के साथ फिट बैठता है, अर्थात , जहां ऋणात्मक है। शायद, यह एक कस्टम सांख्यिकीय परीक्षण की आवश्यकता है? ay=ax2+bx+ca
user1447630 12

1
इसके लिए आप ओएलएस रैखिक प्रतिगमन का उपयोग करते हुए द्विघात मॉडल को फिट करते हैं और एक मानक सांख्यिकीय परीक्षण करते हैं कि गुणांक 0 से अधिक है (एक-पूंछ वाले टी परीक्षण कहते हैं)।
माइकल आर। चेरिक

1
@ मिचेल, आपकी अंतिम टिप्पणी के बारे में, यदि सममित रूप से शून्य के आसपास वितरित नहीं किया गया है, तो और बीच बड़ी संपार्श्विकता हो सकती है । चूंकि यह संभवतः एक प्रतिगमन गुणांक के लिए मानक -est को प्रभावित करेगा , संभावना अनुपात परीक्षण अधिक उपयुक्त हो सकता है, है ना? x x 2 txxx2t
मैक्रो

@ मैक्रो का अनुमान है कि यदि x और x बीच उच्च स्तर का संबंध है, तो आपका सुझाव अच्छा हो सकता है। लेकिन मुझे लगता है कि गुणांक पर व्यक्तिगत टी परीक्षण लागू करना आम है, भले ही सहसंयोजक X और X सहसंबंधित हों। उच्च संपार्श्विकता गुणांक को बहुत अस्थिर बना देती है क्योंकि पहचान लगभग खो जाती है। ऐसे मामलों में सहसंयोजकों के गुणांकों पर किसी भी प्रकार का परीक्षण करना समझ में नहीं आता। 212
बजे माइकल आर। चेरिक

1

आप दूरी सहसंबंध परीक्षणों का उपयोग करके किसी भी प्रकार की निर्भरता का परीक्षण कर सकते हैं। दूरी सहसंबंध के बारे में अधिक जानकारी के लिए यहाँ देखें: दूरी सहसंबंध संगणना को समझना

और यहाँ मूल पेपर: https://arxiv.org/pdf/0803.4101.pdf

आर में यह फ़ंक्शन के energyसाथ पैकेज में लागू किया गया dcor.testहै।


0

किसी ने मुझे सही किया अगर मेरी समझ यहां गलत है, लेकिन गैर-रैखिक चर से निपटने का एक तरीका एक रैखिक सन्निकटन का उपयोग करना है। इसलिए, उदाहरण के लिए, घातांक वितरण का लॉग लेना आपको चर को सामान्य वितरण के रूप में मानने की अनुमति देता है। यह किसी भी रेखीय प्रतिगमन जैसी समस्या को हल करने के लिए इस्तेमाल किया जा सकता है।


8
मुझे नहीं लगता कि यह वास्तव में इस सवाल का जवाब देता है। लॉग्स लेना एक रैखिक सन्निकटन के रूप में एक ही बात नहीं है। इसके अलावा, भले ही आप लॉग्स लेते हैं, जिसके लिए मूल चर का लॉग सामान्य रूप से वितरित किया गया वितरण घातीय वितरण नहीं है, बल्कि लॉगनॉर्मल वितरण है । हालांकि, न तो स्वतंत्र और न ही निर्भर चर को सामान्य रूप से रैखिक प्रतिगमन के लिए उपयुक्त होने के लिए वितरित करने की आवश्यकता है - यहां मुद्दा चर के बीच संबंध है, न कि उनके सीमांत वितरण।
सिल्वरफिश

0

मैं दो चर के बीच गैर-रैखिक संबंध का पता लगाने के लिए सामान्य एडिटिव मॉडल को लागू करने के लिए इस्तेमाल किया था, लेकिन हाल ही में मैंने nlcorआर में पैकेज के माध्यम से लागू किए गए गैर-रैखिक संबंध के बारे में पता लगाया है , आप इस विधि को उसी तरह से लागू कर सकते हैं जैसे पीयरसन सहसंबंध। , सहसंबंध गुणांक 0 और 1 के बीच है न कि -1 और 1 पियरसन सहसंबंध के रूप में। उच्च सहसंबंध गुणांक का तात्पर्य एक मजबूत गैर-रैखिक संबंध के अस्तित्व से है। चलो मान लेते हैं कि दो समय श्रृंखला x2और y2, दो समय श्रृंखला के बीच गैर-संबंध सहसंबंध का परीक्षण निम्नानुसार किया जाता है

install.packages("devtools") 
library(devtools)
install_github("ProcessMiner/nlcor")
library(nlcor)
c <- nlcor(x2, y2, plt = T)
c$cor.estimate
[1] 0.897205

दोनों चर गैर-संबंध संबंध के माध्यम से दृढ़ता से सहसंबद्ध लगते हैं, आप सहसंबंध गुणांक के लिए समायोजित पी-मान भी प्राप्त कर सकते हैं

c$adjusted.p.value
[1] 0

आप परिणामों की साजिश भी कर सकते हैं

print(c$cor.plot)

आप अधिक जानकारी के लिए इस लिंक को देख सकते हैं

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.