यदि रैखिक प्रतिगमन पियर्सन के सहसंबंध से संबंधित है, तो क्या केंडल और स्पीयरमैन के सहसंबंधों से संबंधित कोई प्रतिगमन तकनीक हैं?


27

शायद यह सवाल अनुभवहीन है, लेकिन:

यदि रैखिक प्रतिगमन पियर्सन के सहसंबंध गुणांक से निकटता से संबंधित है, तो क्या कोई प्रतिगमन तकनीक केंडल और स्पीयरमैन के सहसंबंध गुणांक से संबंधित हैं?


3
एक सरल उदाहरण के रूप में जहां आपके पास एक व्याख्यात्मक और एक आश्रित चर है: और के रैंक का एक रेखीय प्रतिगमन, प्रतिगमन गुणांक के रूप में स्पीयरमैन के सहसंबंध गुणांक का उत्पादन करेगा। और इस मामले में, और प्रतिगमन में विनिमेय हैं। x xyxy
COOLSerdash

2
बस कुछ विचार। केंडल के और स्पीयरमैन के दोनों रैंक के आधार पर सहसंबंध गुणांक हैं। और बीच संबंध के बाद मांगी गई उनकी रैंक को शामिल करने की आवश्यकता होगी। हालांकि, रैंकों की गणना करने से टिप्पणियों के बीच निर्भरता का परिचय होता है, जो कि त्रुटि शब्दों के बीच निर्भरता को लागू करता है, रैखिक प्रतिगमन को समाप्त करता है। हालांकि, एक अलग सेटिंग में, कोपलों के साथ और बीच निर्भरता संरचना को मॉडलिंग करने से केंडल की पसंद के आधार पर केंडल के और / या स्पीयरमैन के साथ एक लिंक संभव हो जाएगा। ρ एक्स y एक्स y τ ρτρxyxyτρ
क्वांटाइबेक्स

1
@QuantIbex निर्भरता आवश्यक रूप से ? E[εiεj]0
छायाकार

जवाबों:


21

एक बहुत सीधा सा मतलब है जिसके द्वारा रैखिक प्रतिगमन को फिट करने के लिए लगभग किसी भी सहसंबंध उपाय का उपयोग किया जाता है, और जब आप पियर्सन सहसंबंध का उपयोग करते हैं तो कम से कम वर्गों को पुन: पेश करते हैं।

विचार करें कि यदि किसी रिश्ते की ढलान , तो और बीच संबंध होने की उम्मीद की जानी चाहिए ।- β x x βyβxx0

वास्तव में, अगर यह कुछ भी थे अन्य की तुलना में जो क्या सहसंबंध उपाय उठा किया जाएगा -, वहाँ कुछ uncaptured रैखिक संबंध होगा।0

इसलिए हम ढलान खोजने, द्वारा ढलान का अनुमान हो सकता है कि बनाता है नमूना के बीच संबंध और हो । कई मामलों में - जैसे रैंक-आधारित उपायों का उपयोग करते समय - सहसंबंध ढलान के अनुमान के मूल्य का एक चरण-कार्य होगा, इसलिए एक अंतराल हो सकता है जहां यह शून्य है। उस मामले में हम आम तौर पर अंतराल के केंद्र होने के लिए नमूना अनुमान को परिभाषित करते हैं। अक्सर स्टेप फंक्शन किसी बिंदु पर शून्य से ऊपर से नीचे शून्य पर कूदता है, और उस स्थिति में अनुमान जम्प पॉइंट पर होता है। y- ~ β एक्सएक्स0β~yβ~xx0

यह परिभाषा काम करती है, उदाहरण के लिए, रैंक आधारित और मजबूत सहसंबंधों के सभी तरीके। यह ढलान के लिए एक अंतराल प्राप्त करने के लिए भी इस्तेमाल किया जा सकता है (सामान्य तरीके से - ढलानों को खोजने से जो कि केवल महत्वपूर्ण सहसंबंधों और सिर्फ महत्वहीन सहसंबंधों के बीच की सीमा को चिह्नित करते हैं)।

यह केवल ढलान को परिभाषित करता है, निश्चित रूप से; एक बार ढलान का अनुमान लगाने के बाद, अवरोधन अवशिष्ट पर गणना किए गए उपयुक्त स्थान अनुमान पर आधारित हो सकता है । रैंक-आधारित सहसंबंधों के साथ मंझला एक सामान्य पसंद है, लेकिन कई अन्य उपयुक्त विकल्प हैं।yβ~x

यहाँ carR में डेटा के लिए ढलान के विरुद्ध दिया गया सहसंबंध है :

यहाँ छवि विवरण दर्ज करें

पीयर्सन सहसंबंध 0 से कम से कम चौकोर ढलान
पर पार करता है, 3.932 केंडल सहसंबंध थेल-सेन ढलान पर 0 से पार करता है, 3.667
स्पीयरमैन सहसंबंध क्रॉस 0 से " स्पियरमैन -लाइन" 3.714 का ढलान देता है

हमारे उदाहरण के लिए वे तीन ढलान अनुमान हैं। अब हमें इंटरसेप्ट्स की जरूरत है। सादगी के लिए मैं पहले इंटरसेप्ट के लिए माध्य अवशिष्ट और दूसरे दो के लिए माध्यिका का उपयोग करूँगा (यह इस मामले में बहुत ज्यादा मायने नहीं रखता है):

           intercept
 Pearson:  -17.573 *     
 Kendall:  -15.667
 Spearman: -16.285

* कम से कम वर्गों से छोटा अंतर ढलान अनुमान में गोलाई त्रुटि के कारण होता है; इसमें कोई संदेह नहीं है कि अन्य क्षेत्रों में समान गोलाई त्रुटि है)

इसी फिट लाइनों (ऊपर के रूप में एक ही रंग योजना का उपयोग कर) हैं:

यहाँ छवि विवरण दर्ज करें

संपादित करें: तुलना करके, क्वाड्रेंट-सहसंबंध ढलान 3.333 है

केंडल सहसंबंध और स्पीयरमैन सहसंबंध ढलान दोनों प्रभावशाली आउटलेर की तुलना में कम से कम वर्गों के लिए काफी अधिक मजबूत हैं। केंडल के मामले में एक नाटकीय उदाहरण के लिए यहां देखें ।


(+1) बढ़िया व्याख्या! क्या कोई कारण है कि केंडल को इस संदर्भ में स्पीयरमैन के लिए अधिक पसंद किया जाता है (कम से कम इस तथ्य को देखते हुए कि केंडल सहसंबंध एक ढलान अनुमानक से मेल खाता है जिसका नाम है, थील-सेन, जबकि स्पीयरल एक नहीं है)?
अमीबा का कहना है कि मोनिका

4
ऐसा होने के कई कारण हैं। पहला यह है कि Theil-Sen लाइन में एक साधारण रूप से वर्णित अनुमानक (जोड़ीदार ढलानों का मध्य) है, जिसमें स्पीयरमैन का अभाव है; छोटे नमूनों में यह हाथ की गणना के लिए बहुत उपयुक्त है। केंडल सहसंबंध सामान्यता को तेजी से ले जाता है और अधिक गणितीय रूप से ट्रैक्टेबल होता हैयहाँ और यहाँ भी देखें ।
Glen_b -Reinstate मोनिका

20

आनुपातिक बाधाओं (पीओ) मॉडल विलकॉक्सन और क्रुसकल-वालिस परीक्षणों को सामान्य करता है। के बाइनरी होने पर स्पीयरमैन का सहसंबंध विल्कोक्सन परीक्षण सांख्यिकीय है जिसका बस अनुवाद किया गया है। तो आप कह सकते हैं कि पीओ मॉडल एक एकीकृत विधि है। चूँकि पीओ मॉडल में कई अंतर हो सकते हैं क्योंकि अद्वितीय मूल्य (कम एक) हैं, यह क्रमिक और निरंतर दोनों को संभालता है ।वाई वाईXYY

PO मॉडल में स्कोर स्टेटिस्टिक का अंश बिल्कुल विल्कोक्सन स्टेटिस्टिक है।χ2

PO मॉडल संचयी प्रायिकता (कुछ कॉल संचयी लिंक) मॉडल के प्रोबिट, आनुपातिक खतरों और पूरक लॉग-मॉडल सहित अधिक सामान्य परिवार का एक विशेष मामला है। केस स्टडी के लिए मेरे हैंडआउट्स के चैप्टर 15 देखें ।


4

हारून हान (1987 में अर्थमिति) ने अधिकतम रैंक सहसंबंध अनुमानक का प्रस्ताव दिया जो ताऊ को अधिकतम करके प्रतिगमन मॉडल को फिट करता है। डौगर्टी और थॉमस (2012 में मनोविज्ञान साहित्य में) ने हाल ही में एक समान एल्गोरिथ्म का प्रस्ताव रखा था। एमआरसी पर इसके गुणों को दर्शाते हुए काम की बहुतायत है।

हारून के। हान, एक सामान्यीकृत प्रतिगमन मॉडल का गैर-पैरामीट्रिक विश्लेषण: अधिकतम रैंक सहसंबंधी आकलनकर्ता, जर्नल ऑफ़ इकोनोमेट्रिक्स, वॉल्यूम 35, अंक 2–3, जुलाई 1987, पृष्ठ 303-316, आईएसएसएन 464-4076, http: // dx.doi.org/10.1016/0304-4076(87)90030-3 । ( http://www.sciencedirect.com/science/article/pii/0304407687900900303 )

आटा, एमआर, और थॉमस, आरपी (2012)। एक अशुभ दुनिया में मजबूत निर्णय। मनोवैज्ञानिक समीक्षा, 119 (2), 321. http://damlab.umd.edu/pdf%20articles/DoughertyThomas2012Rev.pdf से लिया गया ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.