एक (नॉन-डाइकोटोमस) नाममात्र चर और एक संख्यात्मक (अंतराल) या एक क्रमिक चर के बीच सहसंबंध गुणांक


13

मैंने इस साइट के सभी पृष्ठ पहले ही पढ़ लिए हैं और अपनी समस्या का उत्तर खोजने की कोशिश कर रहा हूं, लेकिन कोई भी मुझे सही रूप में नहीं लगता है ...

पहले मैं आपको समझाता हूं कि मैं किस तरह के डेटा के साथ काम कर रहा हूं ...

मान लें कि मेरे पास शहर के कई नामों के साथ एक सरणी वेक्टर है, प्रत्येक 300 उपयोगकर्ताओं में से एक है। मेरे पास प्रत्येक उपयोगकर्ता के सर्वेक्षण या प्रत्येक उपयोगकर्ता के लिए निरंतर मूल्य के साथ एक और सरणी वेक्टर भी है।

मैं यह जानना चाहूंगा कि क्या सहसंबंध गुणांक मौजूद है जो इन दो चर के बीच नाममात्र और एक संख्यात्मक / निरंतर या क्रमिक चर के बीच सहसंबंध की गणना करता है।

मैंने इंटरनेट पर खोज की है और कुछ पन्नों में उन्होंने आकस्मिक गुणांक या क्रैमर्स वी या लैंबडा गुणांक या एटा का उपयोग करने का सुझाव दिया है। इस उपाय के लिए प्रत्येक का कहना है कि उन्हें ऐसे डेटा के लिए लागू किया जा सकता है जिसमें हमारे पास नाममात्र चर और अंतराल या संख्यात्मक चर हो। बात यह है कि खोज करना और खोजना, उनमें से हर एक को समझने की कोशिश करना, कभी-कभी लिखा जाता है या उन उदाहरणों को देख रहा है जो उन्हें उपयोग करने के लिए उचित हैं यदि आपके पास डायमोटोमस नाममात्र चर है, तो क्रैमर्स वी के अलावा, अन्य समय किसी भी आवश्यकता को नहीं लिखा जाता है डेटा का प्रकार। बहुत सारे अन्य पृष्ठ कहते हैं कि इसके बजाय प्रतिगमन लागू करना सही है, यह सही है, लेकिन मैं बस यह जानना चाहूंगा कि क्या इस तरह के डेटा के लिए पीयरसन / स्पीयरमैन जैसा गुणांक है।

मुझे यह भी लगता है कि स्पीयरमैन कोरिलेशन कोफ का उपयोग करना ठीक से नहीं है क्योंकि शहर छँटे नहीं जाते हैं।

मैंने खुद भी क्रैमर की वीवी और एटा के फंक्शन का निर्माण किया है (मैं मतलाब के साथ काम कर रहा हूं) लेकिन एटा के लिए वे किसी भी पी-वैल्यू के बारे में बात नहीं करते हैं कि क्या गुणांक सांख्यिकीय रूप से महत्वपूर्ण है ...

MatlabWorks साइट में एक अच्छा टूलबॉक्स भी है, जो eta ^ 2 की गणना करने के लिए कहता है, लेकिन जिस तरह के इनपुट की जरूरत है, वह समझ में नहीं आता है।

क्या यहाँ कोई ऐसा है जिसने मेरी तरह परीक्षा दी हो? यदि आप जिस तरह के डेटा का उपयोग कर रहे हैं, उसे समझने के लिए आपको और अधिक विवरण की आवश्यकता है, तो मैं आपको बेहतर तरीके से समझाने की कोशिश करूंगा।


1
Cramérs V दो नाममात्र के लिए है। प्रतिगमन के बारे में क्या बुरा है? सांख्यिक चर को प्रतिक्रिया के रूप में लें और इसे नाममात्र (डमीज़ का उपयोग करके) में पुनः प्राप्त करें। को देखो और संबद्ध वैश्विक एफ परीक्षण। R2
माइकल एम

प्रतिगमन के साथ कुछ भी गलत नहीं है, लेकिन जैसा कि हमारे पास पहले से ही है कि हम इसे दूसरे तरीके से जांचना चाहेंगे जैसे कि सहसंबंध गुणांक के साथ दोहरी जांच .... उत्तर के लिए धन्यवाद
क्रिटिस

आपने अपने "न्यूमेरिक / ऑर्डिनल" वेरिएबल के बारे में कुछ खास नहीं कहा है। आप इसे सामान्य बनाने के लिए क्या करते हैं? सांख्यिक?
ttnphns

ऑर्डिनल बीक्यूज़ मेरे पास एक सर्वे टेस्ट से आने वाला एक वैरिएबल है, इसलिए इसकी रेंज -4,4 है, आप इसे इंटरवल के रूप में भी सोच सकते हैं लेकिन इस तरह के सर्वे वैरिएबल को ज्यादातर ऑर्डिनल माना जाता है और बाकी न्यूमेरिक होते हैं, विशिष्ट कंटीन्यूअस के रूप में सुविधाएँ निकाली गईं।
क्रिटिस

1
साथ ही इससे संबंधित प्रश्न देखें stats.stackexchange.com/questions/23938/...
ttnphns

जवाबों:


18

नाममात्र बनाम अंतराल

नाममात्र और एक अंतराल ("संख्यात्मक") चर के बीच सबसे क्लासिक "सहसंबंध" उपाय एटा है , जिसे सहसंबंध अनुपात भी कहा जाता है, और एक-तरफ़ा एनोवा (पी-मान के साथ =) के रूट आर-वर्ग के बराबर है एनोवा)। एटा को सहसंबंधी माप के रूप में देखा जा सकता है, सहसंबंध की तरह, क्योंकि एनोवा का एटा (नाममात्र के रूप में स्वतंत्र, संख्यात्मक पर निर्भर के रूप में) मल्टीपैरेट रिग्रेशन के पिल्लई के निशान के बराबर है (स्वतंत्र रूप से संख्यात्मक के साथ, डमी चरों के सेट के अनुरूप) निर्भर के रूप में नाममात्र)।

एक अधिक सूक्ष्म उपाय इंट्राक्लास सहसंबंध गुणांक ( आईसीसी ) है। जबकि संख्यात्मक चर के संबंध में एटा केवल समूहों (नाममात्र चर द्वारा परिभाषित) के बीच के अंतर को पकड़ती है, आईसीसी एक साथ समूहों के अंदर संख्यात्मक मूल्यों के बीच समन्वय या सहमत भी मापता है; दूसरे शब्दों में, आईसीसी (विशेष रूप से मूल निष्पक्ष "पेयरिंग" आईसीसी संस्करण) मूल्यों के स्तर पर रहता है, जबकि एटा आंकड़ों के स्तर पर संचालित होता है (समूह का अर्थ समूह बनाम संस्करण)।

नाममात्र बनाम साधारण

नाममात्र और एक क्रमिक चर के बीच "सहसंबंध" उपाय के बारे में सवाल कम स्पष्ट है। कठिनाई का कारण यह है कि क्रमिक पैमाने, इसकी प्रकृति से, अंतराल या नाममात्र पैमानों की तुलना में अधिक "रहस्यवादी" या "मुड़" है। कोई आश्चर्य नहीं कि विशेष रूप से क्रमिक डेटा के लिए सांख्यिकीय विश्लेषण अब तक अपेक्षाकृत खराब रूप से तैयार किए गए हैं।

एक तरीका यह हो सकता है कि आप अपने क्रमिक डेटा को रैंक में परिवर्तित करें और फिर एटा की गणना करें जैसे कि रैंक अंतराल डेटा थे। ऐसे एटा का पी-मूल्य = क्रुस्ल-वालिस विश्लेषण। यह दृष्टिकोण एक ही तर्क के कारण वारंटेड लगता है कि क्यों स्पीयरमैन आरएच का उपयोग दो क्रमिक चर को सहसंबंधित करने के लिए किया जाता है। वह तर्क यह है कि "जब आप पैमाने पर अंतराल की चौड़ाई नहीं जानते हैं, तो किसी भी संभव एकरसता को रेखांकन करके गॉर्डियन नॉट को काटें: डेटा रैंक करें"।

एक अन्य दृष्टिकोण (संभवत: अधिक कठोर और लचीला) के रूप में आर्डिनल वैरिएबल के साथ ऑर्डिनल लॉजिस्टिक रिग्रेशन का उपयोग डीवी और नॉमिनल आईवी के रूप में किया जाएगा। नागेलकेके के छद्म आर-वर्ग (प्रतिगमन पी-मान के साथ) का वर्गमूल आपके लिए एक और सहसंबंध मापक है। ध्यान दें कि आप विभिन्न लिंक फ़ंक्शंस के साथ ऑर्डिनल रिग्रेशन में प्रयोग कर सकते हैं। यह संघ, हालांकि, सममित नहीं है: नाममात्र स्वतंत्र माना जाता है।

फिर भी एक अन्य दृष्टिकोण यह हो सकता है कि इस तरह के औपनिवेशिक डेटा के अंतराल में अंतराल के पैराग्राफ को बदलने के बजाय - आप के लिए आर (यानी एटा ) को अधिकतम करें । यह श्रेणीबद्ध प्रतिगमन (= इष्टतम स्केलिंग के साथ रैखिक प्रतिगमन) है।

अभी भी एक और दृष्टिकोण है , वर्गीकरण वृक्ष , जैसे कि CHAID, पूर्वानुमान के रूप में क्रमिक चर के साथ। यह प्रक्रिया एक साथ होगी (इसलिए यह पिछले एक के विपरीत दृष्टिकोण है) आसन्न क्रमबद्ध श्रेणियां जो नाममात्र की भविष्यवाणी की श्रेणियों के बीच अंतर नहीं करती हैं। तब आप ची-स्क्वायर-आधारित एसोसिएशन के उपायों (जैसे क्रैमर के वी) पर भरोसा कर सकते थे जैसे कि आप नाममात्र बनाम नाममात्र चर को सहसंबंधित करते हैं।

और @ मिचेल ने अपनी टिप्पणी में एक और तरीका बताया - फ्रीमैन की थीटा नामक एक विशेष गुणांक ।

इसलिए, हम इन अवसरों पर अब तक आ चुके हैं: (1) रैंक, फिर एटा की गणना करें; (2) क्रमिक प्रतिगमन का उपयोग करें; (3) श्रेणीबद्ध प्रतिगमन का उपयोग करें ("वैकल्पिक रूप से" क्रमिक चर को अंतराल में बदलना); (4) वर्गीकरण पेड़ का उपयोग करें ("श्रेणीबद्ध रूप से" क्रमबद्ध श्रेणियों की संख्या को कम करना); (5) फ्रीमैन की थीटा का उपयोग करें।


3
PS जेरोमी एंग्लिम के ब्लॉग jeromyanglim.blogspot.ru/2009/10/… में
3

2
θ

2
@ मिचेल धन्यवाद, यहां मुझे एक पेपर मिला "फ्रीमैन ऑफ एसोसिएशन के माप पर एक और नोट" moreno.ss.uci.edu/22.pdf
ttnphns

1
फ्रीमैन थीटा और एक आर पैकेज के बारे में अधिक जानकारी के लिए जिसमें आँकड़ा शामिल है, इस क्रॉस मान्य प्रश्न को देखें
साल मंगियाफिको

@ttnphns क्षमा करें, क्या आप इस प्रश्न का उत्तर दे सकते हैं: आंकड़े . stackexchange.com/questions/363543/… बहुत बहुत धन्यवाद।
Ebrahimi

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.